Способ отбора желательного белка и нуклеиновой кислоты, средства для его осуществления

Реферат

 

Изобретение относится к биотехнологии, в частности, молекулярной биологии. Описан способ отбора белка с использованием РНК-пептидных гибридов. РНК-пептидный гибрид включает молекулу РНК, ковалентно связанную или гибридизованную по 3’-концу последовательности, кодирующей белок, с последовательностью НК, способной приостанавливать трансляцию ДНК. Последовательность НК ковалентно присоединена к белковому акцептору, а белок кодируется ковалентно-связанной РНК. Описана также РНК, содержащая последовательность инициации трансляции и старт-кодон, функционально соединенный с последовательностью, кодирующей белок. Описан также микрочип, включающий набор иммобилизированных НК, каждая из которых гибридизуется с РНК-белковым гибридом. Способ отбора белков включает следующие этапы: представление популяции молекул РНК со свойствами, перечисленными выше; трансляция последовательности, кодирующей белок; отбор PHK-белкового гибрида путем тестирования белка на связывание или функциональную активность. Использование изобретения позволяет отбирать желательные белки из обширных пулов и преобразовывать полипептидные последовательности in vitro. 4 с. и 23 з.п. ф-лы, 19 ил., 5 табл.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ

Настоящее изобретение касается способов отбора белков.

Изобретение было осуществлено с использованием федеральной поддержки в виде грантов F32 GM 17776-01 и F32 GM 17776-02. Соответственно, федеральное правительство обладает некоторыми правами на настоящее изобретение.

Существующие в настоящее время способы выделения молекул РНК и ДНК основаны на их функциях. Например, эксперименты Ellington & Szostak (Nature, 1990, 346, 818 и Nature, 1992, 355, 850) и Tuerk & Gold (Science, 1990, 249, 505 и J. Mol. Biol., 1991, 222, 739) показали, что очень редкие (например, на уровне менее одной на 1013) молекулы нуклеиновых кислот с желательными характеристиками могут быть выделены из комплексных пулов молекул с помощью повторяющихся циклов отбора и амплификации. Эти способы обладают преимуществами по сравнению с традиционными генетическими методами отбора в том, что (1) может быть подвергнут скринингу очень большой пул молекул (более 1015), (ii) не затрагивается жизнеспособность организмов-хозяев и условия in vivo, и (iii) отбор может быть проведен даже тогда, когда не существует способа генетического скрининга в модели in vivo. Разрешающая способность отбора in vitro была продемонстрирована при определении последовательностей РНК и ДНК, обладающих очень узкоспецифичными функциями по связыванию с белками (см., например, Tuerk & Gold, 1990, Science, 249, 505; Irvine et al., 1991, J. Mol. Biol, 222, 739; Oliphant et al., 1989, Mol. Cell Biol., 9, 2944; Blackwell et al., 1990, Science, 250, 1104; Pollock & Treisman, 1990, Nucl. Acids Res., 18, 6197; Thiesen & Bach, 1990, Nucl. Acids Res., 18, 3203; Bartel et al., 1991, Cell, 57, 529; Stormo & Yoshioka, 1991, Proc. Natl. Acad. Sci. USA, 88, 5699; и Bock et al., 1992, Nature, 355, 564), функциями по связыванию с малыми молекулами (Ellington & Szostak, 1990, Nature, 346, 818); Ellington & Szostak, 1992, Nature, 355, 850) и каталитическими функциями (Green et al., 1990, Nature, 347, 406; Robertson & Joyce, 1990, Nature, 344, 467; Beaudry & Joyce, 1992, Science, 257, 635; Bartel & Szostak, 1993, Science, 261, 1411; Lorsch & Szostak, 1994, Nature, 371, 31-36; Cuenoud & Szostak, 1995, Nature, 375, 611-614; Chapman & Szostak, 1995, Chemistry and Biology, 2, 325-333; и Lohse & Szostak, 1996, Nature, 381, 442-444). Однако сходная стратегия отбора и амплификации белков пока отсутствует.

РЕЗЮМЕ ИЗОБРЕТЕНИЯ

Целью настоящего изобретения явилась разработка принципов отбора in vitro и преобразования последовательностей in vitro, которые могут быть применимы в отношении белков. Изобретение представляет выделение белков, обладающих желательными характеристиками, из обширных пулов при частично или полностью случайном подборе аминокислотных последовательностей. Кроме того, изобретение решает проблему выделения и амплификации полипептидных последовательностей путем ковалентного присоединения кодирующей последовательности мРНК к молекуле белка.

В целом, представляемый изобретением способ включает транскрипционно-трансляционный протокол in vitro или in situ, с помощью которого формируется белок, ковалентно присоединенный к 3'-концу его собственной мРНК, т.е. РНК-пептидный гибрид. Это осуществляется путем синтеза и трансляции in vitro или in situ молекулы мРНК с пептидным акцептором, присоединенным к ее 3'-концу. Одним из предпочтительных пептидных акцепторов является пуромицин, являющийся аналогом нуклеозида, который присоединяется к С-концу растущей пептидной цепи и терминирующий тем самым процесс трансляции. В одном из предпочтительных вариантов последовательность ДНК включается между концом мРНК и пептидным акцептором, роль которого связана с вызыванием т.н. рибосомной паузы в конце открытой рамки считывания, что дает дополнительное время для пептидного акцептора (например, для пуромицина) присоединить новообразованную полипептидную цепь перед гидролизом пептидил-тРНК.

Если это желательно, то получаемый в результате РНК-пептидный гибрид может быть включен в циклично повторяющиеся этапы отбора и амплификации, поскольку информация о полипептидной последовательности может быть восстановлена с помощью обратной транскрипции и амплификации (например, с помощью ПЦР-амплификации или с помощью любого другого метода амплификации, включая основанные на РНК методики амплификации, такие как 3SR или TSA). Амплифицированная нуклеиновая кислота может быть затем транскрибирована, модифицирована и транслирована in vitro или in situ с целью получения мРНК-пептидных гибридов для следующего раунда отбора. Способность осуществлять многократные раунды отбора и амплификации позволяет обогащать и выделять очень редкие молекулы: например, когда одна желательная молекула содержится в пуле, состоящем из 1015 членов. С другой стороны, это позволяет выделять новые или улучшенные белки, которые специфически распознают виртуально любую мишень или которые катализируют желательные химические реакции.

Соответственно, в первом своем аспекте настоящее изобретение представляет способ отбора желательного белка, включающий следующие этапы: (а) представление популяции молекул-"кандидатов" РНК, каждая из которых включает последовательность инициации трансляции и старт-кодон, функционально связанный с последовательностью, кодирующей белок-кандидат", и каждая из которых функционально соединена с пептидным акцептором по 3'-концу последовательности, кодирующей белок-кандидат"; (b) трансляция in vitro или in situ последовательности, кодирующей белок-кандидат" с получением популяции "кандидатных" РНК-пептидных гибридов; и (с) отбор желательного РНК-пептидного гибрида, определяющий тем самым отбор желательного белка.

В близком варианте настоящее изобретение представляет способ отбора молекулы ДНК, которая кодирует желательный белок, включающий следующие этапы: (а) представление популяции молекул-кандидатов" РНК, каждая из которых включает последовательность инициации трансляции и старт-кодон, функционально связанный с последовательностью, кодирующей белок-кандидат"', и каждая из которых функционально соединена с пептидным акцептором по 3'-концу последовательности, кодирующей белок-"кандидат"; (b) трансляция in vitro или in situ последовательности, кодирующей белок-кандидат" с получением популяции "кандидатных" РНК-пептидных гибридов; (с) отбор желательного РНК-пептидного гибрида; и (а) формирование на основании РНК-компонента данного гибрида молекулы ДНК, которая кодирует желательный белок.

В другом близком варианте настоящее изобретение представляет способ отбора белка, обладающего измененными функциями по сравнению с референсным белком, включающий следующие этапы: (а) получение популяции молекул-"кандидатов" РНК из популяции ДНК-матриц, при том, что каждая из матриц-кандидатов" ДНК включает последовательность, кодирующую белок-кандидат", которая отличается от последовательности, кодирующей референсный белок, и при том, что каждая молекула РНК включает последовательность инициации трансляции и старт-кодон, функционально присоединенные к последовательности, кодирующей белок-"кандидат", и каждая из них функционально соединена с пептидным акцептором по 3'-концу; (b) трансляция in vitro или in situ последовательности, кодирующей белок-кандидат", с целью получения популяции "кандидатных" РНК-пептидных гибридов; и (с) отбор РНК-пептидных гибридов, обладающих измененными функциями, позволяющий таким образом отбирать белок, обладающий измененной функцией.

Еще в одном близком варианте настоящее изобретение представляет способ отбора молекулы ДНК, которая кодирует белок, обладающий измененной функцией по сравнению с референсным белком, включающий следующие этапы: (а) получение популяции молекул-"кандидатов" РНК из популяции ДНК-матриц, при том что каждая из матриц-"кандидатов" ДНК включает последовательность, кодирующую белок-"кандидат", которая отличается от последовательности, кодирующей референсный белок, и при том, что каждая молекула РНК включает последовательность инициации трансляции и старт-кодон, функционально присоединенные к последовательности, кодирующей белок-кандидат", и каждая из них функционально соединена с пептидным акцептором по 3'-концу; (b) трансляция in vitro или in situ последовательности, кодирующей белок-"кандидат", с целью получения популяции "кандидатных" РНК-пептидных гибридов; (с) отбор РНК-пептидных гибридов, обладающий измененной функцией; и (d) формирование на основе РНК-компонента гибрида молекулы ДНК, которая кодирует белок, обладающий измененной функцией.

Еще в одном варианте настоящее изобретение представляет способ отбора желательной РНК, включающий следующие этапы: (а) представление популяции молекул-кандидатов" РНК, каждая из которых включает последовательность инициации трансляции и старт-кодон, функционально присоединенный к последовательности, кодирующей белок-кандидат", и каждая из которых функционально соединена с пептидным акцептором по 3'-концу последовательности, кодирующей белок-кандидат"; (b) трансляция in vitro или in situ последовательностей, кодирующих белки-"кандидаты", с получением популяции "кандидатных" РНК-пептидных гибридов; и (с) отбор желательного РНК-пептидного гибрида, что позволяет таким образом отбирать желательную РНК.

В предпочтительных вариантах перечисленных выше способов пептидным акцептором является пуромицин; каждая из молекул-"кандидатов" РНК дополнительно включает последовательность-индуктор паузы или дополнительно включает последовательность ДНК или аналога ДНК, ковалентно присоединенную к 3'-концу данной молекулы РНК; популяция молекул-кандидатов" РНК включает по крайней мере 109, предпочтительно по крайней мере 1010, более предпочтительно по крайней мере 1011, 1012 или 1013 и, что наиболее предпочтительно, по крайней мере 1014 различных молекул РНК; реакция трансляции in vitro осуществляется в лизате, приготавливаемом из эукариотических клеток или их частей (например, осуществляется в лизате ретикулоцитов или в лизате зародышей пшеницы); реакция трансляции in vitro осуществляется в экстракте, приготавливаемом из прокариотических клеток (например, клеток Е.coli.) или их частей; этап отбора включает связывание желательного белка с иммобилизованным связывающим компонентом; этап отбора включает тестирование желательного белка на функциональную активность; молекула ДНК амплифицирована; способ, кроме того, включает повторяющиеся этапы перечисленных выше способов; способ также включает транскрипцию молекулы РНК с молекулы ДНК и повторяющиеся этапы от (а) до (d); после этапа трансляции in vitro данный способ также включает этап инкубации, осуществляемый в присутствии 50-100 мМ Mg2+; и РНК-пептидный гибрид также включает последовательность нуклеиновой кислоты или ее аналога, расположенную проксимально по отношению к пептидному акцептору, что обеспечивает увеличение гибкости.

В других вариантах настоящее изобретение представляет РНК-пептидный гибрид, выбираемый любым из способов по настоящему изобретению; рибонуклеиновая кислота, ковалентно соединенная по амидной связи с аминокислотной последовательностью, при том, что эта аминокислотная последовательность кодируется данной рибонуклеиновой кислотой; и рибонуклеиновая кислота, которая включает последовательность инициации трансляции и старт-кодон, функционально соединенный с последовательностью, кодирующей белок-кандидат", при том, что рибонуклеиновая кислота функционально присоединена к пептидному акцептору (например, к пуромицину) по 3'-концу последовательности, кодирующей белок-кандидат".

Во втором своем аспекте настоящее изобретение представляет способ отбора желательного белка или желательной РНК путем обогащения пула последовательностей. Способ включает следующие этапы: (а) представление популяции молекул-кандидатов" РНК, каждая из которых включает последовательность инициации трансляции и старт-кодон, функционально присоединенные к последовательности, кодирующей белок-кандидат", и каждая из которых функционально присоединена к пептидному акцептору по 3'-концу последовательности, кодирующей белок-"кандидат"; (b) трансляция in vitro или in situ последовательностей, кодирующий белки-"кандидаты", с получением популяции "кандидатных" РНК-пептидных гибридов; (с) контакт популяции РНК-пептидных гибридов со связывающим компонентом, специфичным в отношении либо РНК-компонента, либо белка-компонента РНК-пептидного гибрида в условиях, которые обеспечивают эффективное отделение комплексов РНК-пептидных гибридов со связывающим компонентом от несвязанных составляющих популяции; (d) выделение связанных РНК-пептидных гибридов из этих комплексов; и (е) контакт популяции РНК-пептидных гибридов по этапу (d) со связывающим компонентом, специфичным в отношении белкового компонента желательного РНК-пептидного гибрида в условиях, которые обеспечивают эффективное отделение комплекса РНК-пептидного гибрида и связывающего компонента от несвязанных составляющих упомянутой популяции, что таким образом обеспечивает отбор желательного белка и желательной РНК.

В предпочтительных вариантах способ также включает повторяющиеся этапы от (а) до (е). Дополнительно для этих повторяющихся этапов могут быть использованы те же самые или отличающиеся связывающие компоненты, в любом случае служащие для избирательного обогащения желательного РНК-пептидного гибрида. В другом предпочтительном варианте этап (а) включает использование связывающего компонента (например, моноклонального антитела), специфичного в отношении белковой части желательного РНК-пептидного гибрида. Этот этап предпочтительно осуществляется после обратной транскрипции РНК-компонента данного гибрида с целью формирования ДНК, которая кодирует желательный белок. Если желательно, эта ДНК может быть выделена и (или) амплифицирована с помощью ПЦР. Данная методика обогащения может быть использована для отбора желательного белка или может быть использована для отбора белка, обладающего измененной функцией по сравнению с референсным белком.

В других предпочтительных вариантах способов обогащения пептидным акцептором является пуромицин; каждая из молекул-"кандидатов" РНК также включает сайт-индуктор паузы или также включает последовательность ДНК или аналога ДНК, ковалентно присоединенную к 3'-концу данной молекулы РНК; популяция молекул-кандидатов" РНК включает по крайней мере 109, предпочтительно по крайней мере 1010, более предпочтительно по крайней мере 1011, 1012 или 1013 и, что наиболее предпочтительно, по крайней мере 1014 различных молекул РНК; реакция трансляции in vitro осуществляется в лизате, приготавливаемом из эукариотических клеток или их частей (например, осуществляется в лизате ретикулоцитов или в лизате зародышей пшеницы); реакция трансляции in vitro осуществляется в экстракте, приготавливаемом из прокариотических клеток (например, клеток Е. coli) или их частей; этап отбора включает связывание желательного белка с иммобилизованным связывающим компонентом; этап отбора включает тестирование желательного белка на функциональную активность; молекула ДНК амплифицирована; способ, кроме того, включает повторяющиеся этапы перечисленных выше способов; способ также включает транскрипцию молекулы РНК с молекулы ДНК и повторяющиеся этапы от (а) до (d); после этапа трансляции in vitro данный способ также включает этап инкубации, осуществляемый в присутствии 50-100 мМ Мg2+ и РНК-пептидный гибрид также включает последовательность нуклеиновой кислоты или ее аналога, расположенную проксимально по отношению к пептидному акцептору, что обеспечивает увеличение гибкости.

В сходном варианте настоящее изобретение представляет наборы реактивов для осуществления любого из заявлямых способов отбора.

В третьем и заключительном своем аспекте настоящее изобретение представляет микрочип, который включает набор иммобилизованных одноцепочечных нуклеиновых кислот, предназначенных для гибридизации с РНК-пептидными гибридами. Предпочтительно, чтобы белковый компонент РНК-пептидного гибрида кодировался этой РНК.

По использованию в данном тексте под термином "популяция" понимается наличие более чем одной молекулы (например, более чем одной молекулы РНК, ДНК или РНК-пептидного гибрида). Поскольку способы по настоящему изобретению представляют отбор, который начинается, если это желательно, с большого числа молекул-"кандидатов", то понятие "популяции" согласно настоящему изобретению предпочтительно соответствует более чем 109 молекулам, предпочтительнее более чем 1011, 1012 или 1013 молекулам и, что наиболее предпочтительно, более чем 1013 молекулам.

Под "отбором" понимается эффективное отделение молекулы от других молекул в популяции. По использованию здесь этап "отбора" соответствует двукратному, предпочтительно 30-кратному, более предпочтительно 100-кратному и, что наиболее предпочтительно, тысячекратному обогащению желательной молекулы по отношению к нежелательным молекулам в популяции после осуществления этапа отбора. Как определено здесь, этап отбора может быть повторен любое число раз, и при этом различные варианты этапов отбора могут быть скомбинированы в данном подходе.

Термин "белок" обозначает любые две или большее число естественно встречающихся или модифицированных аминокислот, соединенных друг с другом одной или большим числом пептидных связей. Термины "белок" ("протеин") и "пептид" используются здесь вперемешку, т.е. как синонимы.

Термин "РНК" обозначает последовательность двух или большего числа ковалентно соединенных естественно встречающихся или модифицированных рибонуклеотидов. Одним из примеров модифицированной РНК, охватываемой данным термином, является фосфоротиоат-РНК.

Термин "последовательность иниациации трансляции" обозначает любую последовательность, которая способна взаимодействовать с функциональным входным сайтом рибосомы. В бактериальных системах этот участок иногда обозначается как "последовательность Шайна-Дальгарно".

Термин "старт-кодон" обозначает триплет, являющийся сигналом начала кодирующей нуклеотидной последовательности. Чаще всего этим триплетом является триплет AUG (или ATG); однако, может быть принят и любой другой триплет, который может быть использован в данной функции.

Термин "ковалентно связанный" с пептидным акцептором обозначает, что пептидный акцептор соединен с "последовательностью, кодирующей белок" либо напрямую с помощью ковалентной связи, либо опосредованно через другую ковалентно связанную последовательность (например, ДНК, соответствующую сайту-индуктору паузы).

Под "пептидным акцептором" понимается любая молекула, которая может быть добавлена к С-концу нарастающей полипептидной цепи при наличии каталитической активности рибосомной пептидилтрансферазы. Обычно такие молекулы включают (i) нуклеотид или нуклеотидоподобную составляющую (например, аденозин или аналог аденозина (приемлемо диметилирование по N-6 амино положению)), (ii) аминокислота или подобная аминокислоте составляющая (например, любая из 20 D- или L-аминокислот или аналог любой из этих аминокислот (например, 0-метилтирозин или любой из аналогов, описанных у Е11-man et al., 1991, Methods Enzymol, 202, 301)), и (iii) сцепление между двумя этими составляющими (например, эфирное, амидное или кетонное сцепление по положению 3' или, что менее предпочтительно, по положению 2'); предпочтительно, чтобы это сцепление существенно не нарушало пространственную укладку кольца в естественной конформации рибонуклеотида. Пептидные акцепторы могут также быть нуклеофильными компонентами, т.е. могут быть, без каких-либо ограничений, аминогруппой, гидроксильной группой или сульфгидрильной группой. Кроме того, пептидные акцепторы могут быть составлены соединениями, подобными нуклеотидом, аминокислотам или комбинированными нуклеотид-аминокислотными структурами.

Под тем, что пептидный акцептор расположен "с 3'-конца" последовательности, кодирующей белок, понимается то, что молекула пептидного акцептора располагается за последним кодоном последовательности, кодирующей белок. Этот термин включает, без каких-либо ограничений, молекулу пептидного акцептора, которая расположена точно по 3'-концу последовательности, кодирующей белок, а также таковую, если она отделена от последнего кодона вставочной кодирующей или некодирующей последовательностью (например, последовательностью, соответствующей сайту - индуктору паузы). Также этот термин включает конструкции, в которых кодирующие или некодирующие последовательности следуют (т.е. являются 3"-концевыми по отношению) за молекулой пептидного акцептора. Дополнительно этот термин обозначает, без каких-либо ограничений, молекулу пептидного акцептора, которая ковалентно связана (как напрямую, так и опосредованно через нуклеотидную последовательность) с последовательностью, кодирующей белок, равно как и такую молекулу, которая соединена с последовательностью, кодирующей белок, какими-либо нековалентными способами, например, путем гибридизации с использованием второй нуклеотидной последовательности, которая связывается в 3'-конце или рядом с ним с последовательностью, кодирующей белок, таким образом оказываясь сама связанной с молекулой пептидного акцептора.

Под термином "измененная функция" понимается любое количественное или качественное изменение функции молекулы.

Под "последовательностью(сайтом)-индуктором паузы" понимается нуклеотидная последовательность, которая обусловливает замедление или остановку трансляции на рибосоме.

По использованию в данном тексте под "связывающим компонентом" понимается любая молекула, которая обладает специфичной, ковалентной или нековалентной аффинностью по отношению к одному из компонентов РНК-пептидного гибрида. Примеры связывающих компонентов включают, без каких-либо ограничений, члены пар "антиген-антитело", пар "белок-ингибитор", пар "лиганд-рецептор" (например, пар поверхностно-клеточных рецепторов и их лигандов, таких как пары, состоящие из рецепторов гормонов и самих пептидных гормонов), пар "фермент-субстрат" (например, пар киназ и субстратов), пар "лектин-углеводород", агрегаций олиго- или гетероолигомерных белков, пар ДНК-связывающихся белков и сайтов связывания в последовательности ДНК, а также нуклеотидных дуплексов, гетеродуплексов или лигированных цепей, равно как и любую молекулу, которая способна формировать одну или большее число ковалентных или иного типа связей (например, дисульфидных связей) с любым компонентом РНК-пептидного гибрида. Связывающие компоненты включают, без каких-либо ограничений, любые "селективные мотивы", представленные на фиг.2.

Под "твердой подложкой" понимается, без каких-либо ограничений, любая колонка (или материал, из которого она изготавливается), гранула, аналитическая пробирка, микротитровальная чашка, твердая субстанция (например, агароза или сефароза), микрочип (например, силикон, стекловолокно или золотой чип) или мембрана (например, мембрана липосомы или пузырька), с которым может быть соединен аффинный комплекс, как напрямую, так и опосредованно (например, с помощью других промежуточных связывающих компонентов, таких как другие антитела или белок-А), или в который аффинный комплекс может быть погружен (например, через рецептор или канал).

Представляемое изобретение обладает рядом существенных преимуществ. Начать надо с того, что впервые представляется схема для отбора и амплификации белков. Эта процедура преодолевает тот тупик, который создается необходимостью формировать нуклеотидные последовательности, соответствующие желательным выделенным белкам (поскольку только нуклеиновые кислоты могут быть реплицированы). В частности, во многих существующих методах, которые позволяют выделять белки из частично или полностью случайно подобранных пулов, это осуществлялось через этап in vivo. Методы этого типа включают технологию моноклональных антител (Milstein, 1980, Sci. Amer., 243, 66 и Schultz et al., 1990, J. Chem. Engng. News, 68, 26), конструирование фагов (Smith, 1985, Science, 228, 1315; Parmley & Smith, 1988, Gene, 73, 305; и McCafferty et al., 1990, Nature, 348, 552), соединения белков с lac-ререссором (Cull et al., 1992, Proc. Natl. Acad. Sci. USA, 89, 1865) и методы классического генетического отбора. В отличие от представляемых способов, каждый из этих методов опирается на топологическую связь между белком и нуклеиновой кислотой, так, что информация о данном белке сохраняется и может быть востребована в подлежащей считыванию форме нуклеиновой кислоты.

Кроме того, настоящее изобретение имеет преимущества по сравнению с методом "упорядоченной" трансляции (Tuerk & Gold, 1990, Science, 249, 505; Irvine et al., 1991, J. Mol. Biol, 222, 739; Korman et al., 1982; Proc. Natl. Acad. Sci. USA, 79, 1844-1848; Mattheakis et al., 1994, Proc. Natl. Acad. Sci. USA, 91, 9022-9026; Mattheakis et al., 1996, Methods Enzymol., 267, 195; и Hanes & Pluckthum, 1997, Proc. Natl. Acad. Sci. USA, 94, 4937) - методом, в котором отбор проводится с учетом свойств новообразующейся полипептидной цепи, которая сильно связана с рибосомой и мРНК. В отличие от метода "упорядоченной" трансляции, представляемый способ не опирается на поддержании целостности т.н. "тройного комплекса" (включает взаимодействующие мРНК, рибосому и новообразующуюся полипептидную цепь), т.е. комплекса, который отличается исключительной "ломкостью" и, соответственно, проявляет существенную ограниченность в типах отбора, которые могут быть технически осуществимы.

Представляемый настоящим изобретением способ обладает преимуществами над процедурой разветвленного синтеза, предложенной Бреннером-Лернером (Brenner & Lemer, 1992, Proc. Natl. Acad. Sci. USA, 89, 5381-5383), в котором синтезируются ДНК-пептидные гибриды и генетическая информация теоретически может быть воспроизведена через один раунд отбора. В отличие от метода разветвленного синтеза, представляемый способ не требует регенерации белка по ДНК-компоненту гибрида (которая в методе разветвленного синтеза в целом осуществляется в виде этапов индивидуального химического синтеза). Соответственно, представляемый способ позволяет проводить повторяющиеся раунды отбора с использованием популяций молекул-"кандидатов". Кроме того, в отличие от метода разветвленного синтеза, который в принципе ограничен отбором весьма коротких последовательностей, представляемый способ применим для отбора молекул белков значительной длины.

Еще одним преимуществом представляемого способа отбора и направленного преобразования последовательностей является возможность использования очень больших и сложных по составу библиотек последовательностей-кандидатов". С другой стороны, существующие методы отбора белков, которые опираются на этап in vivo, обычно ограничены использованием относительно небольших библиотек при достаточно ограниченной сложности их состава. Это преимущество, в частности, является важным тогда, когда проведение отбора последовательностей функциональных белков связано с представлением, например, 1013 возможных вариантов последовательности, которые может образовывать пептид только из 10-аминокислотной последовательности. В классических генетических методах - методе конструирования фага и связывания с lac-супрессором - максимальные уровни сложности обычно попадают в пределы, меньшие чем 1013 членов. Большой размер библиотеки также обеспечивает преимущество для применения в области направленного преобразования последовательностей в том, что "объем" такой последовательности может быть использован в гораздо большей степени по отношению к данной исходной последовательности.

Представляемый способ также отличается от ранее разработанных методик тем, что этап отбора является контекст-независимым. Во многих других протоколах отбора контекст, в котором, например, присутствует экспрессируемый белок, может существенно влиять на природу формируемых библиотек. Например, экспрессируемый белок может не быть правильно экспрессирован в конкретной системе или может не быть правильно размещен (например, на поверхности фаговой частицы). С другой стороны экспрессия белка может действительно служить помехой для одного или нескольких критических этапов в цикле отбора, например, таких как жизнеспособность и инфекционность фага или связывание lac-репрессора. Эти проблемы могут приводить к утрате функциональных молекул или ограничению типа процедур отбора, которые могли бы быть осуществлены.

Наконец, представляемый способ является преимущественным потому, что он обеспечивает контроль за репертуаром белков, которые могут быть протестированы. В некоторых методах (например, в методе отбора с помощью антител) имеет место слабый контроль за природой исходного пула, или такой контроль отсутствует вовсе. В ряде других методов (например, в методе lac-связывания и конструирования фагов) пул молекул-"кандидатов" может быть экспрессирован в контексте участвующего в гибриде белка. С другой стороны, конструкции РНК-пептидных гибридов обеспечивают контроль за природой пула молекул-"кандидатов", пригодный для скрининга. Кроме того, размер пула молекул-"кандидатов" потенциально может быть таким же большим, как пулы РНК или ДНК (примерно 1015 членов), ограничиваясь только размером трансляционной реакции, осуществляемой in vitro. Также состав пула молекул-кандидатов" полностью зависит от схемы эксперимента; случайные участки могут быть скринированы изолированно или в пределах контекста желательного белка, входящего в состав гибрида, и большинство, а то и все возможные последовательности могут быть экспрессированы в составе "кандидатных" пулов РНК-пептидных гибридов.

Другие характеристики и преимущества настоящего изобретения будут ясны из нижеследующего подробного описания и из формулы изобретения.

ПОДРОБНОЕ ОПИСАНИЕ

Вначале кратко описаны чертежи.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг.1А-1С являются схемами этапов получения РНК-пептидных гибридов. Фиг.1А показывает образец конструкции ДНК для получения РНК-компонента гибрида. Фиг.1В показывает получение РНК-пуромицинового конъюгата. И фиг.1С показывает получение РНК-пептидного гибрида.

Фиг.2 является схемой обобщенного способа отбора в соответствии с настоящим изобретением.

Фиг.3 является схемой протокола синтеза минимальной трансляционной матрицы, включающей пуромицин с 3'-конца. Этап (А) соответствует добавлению защитных групп к реактивным функциональным группам пуромицина (5'-ОН и NH2); в случае модификации эти группы оказываются эффективно защищенными для использования в фосфорамидитном синтезе олигонуклеотидов. Выполняющий защитную роль пуромицин был присоединен к обработанному аминогексилом пористому стеклу (CPG) по группам 2'ОН с использованием стандартного метода присоединения ДНК по ее группе 3'ОН (Gait, Oligonucleotide Synthesis, A Practical Approach, The Practical Approach Series (IRL Press, Oxfgord, 1984)). На этапе (В) минимальная трансляционная матрица (обозначенная как "43-Р"), состоящая из 43 нуклеотидов, была синтезирована с использованием стандартных методов химии РНК и ДНК (Millipore, Bedford, МА), с освобождением от защитной составляющей с помощью NH4OH и TBAF, с последующей очисткой в геле. Матрица включала 13 оснований РНК со своего 5'-конца и далее 29 оснований ДНК, присоединенных 3'-концом к пуромицину по его группе 5'ОН. Последовательность РНК включала (i) консенсусную последовательность Шайна-Дальгарно, комплементарную пяти основаниям 163-рРНК (Stormo et al., 1982, Nucleic Acids Research, 10, 2971-2996; Shine & Dalgarno, 1974, Proc. Natl. Acad. Sci. USA, 71, 1342-1346; и Steitz & Jakes, 1975, Proc. Natl. Acad. Sci. USA, 72, 4734-4738), (ii) 5-нуклеотидный спейсер, и (iii) единственный старт-кодон AUG. Последовательность ДНК была следующей – dA27dCdCP, где Р - это пуромицин.

Фиг.4 является схемой предпочтительного варианта способа приготовления защищенного, связанного с CPG пуромицина.

Фиг.5 является схемой, показывающей возможные пути включения метионина в матрицу по настоящему изобретению. Как показано в реакции (А), матрица связывается с рибосомой с образованием комплекса инициации 70S. тРНК формилметионина связывается с Р-сайтом и взаимодействует с матрицей согласно комплементарности оснований. Пуромицин в 3'-конце матрицы попадает в А-сайт, будучи внутримолекулярной структурой, и формирует амидную связь с N-формилметионином в пептидилтрансферазном центре, осуществляя таким образом деацилирование тРНК. Экстракия фенолом-хлороформом реакционной смеси позволяет выделить данную матрицу с ковалентно присоединенным метионином. В реакции (В) показана нежелательная межмолекулярная реакция матрицы с олигонуклеотидами, включающими пуромицин. Как и в предыдущем случае, минимальная матрица стимулирует образование субчастицы рибосомы 70S, включающей тРНК формилметионина, соединенную с Р-сайтом. После этого происходит внедрение второй матрицы (т.е. транс-матрицы по отношению к первой матрице) с появлением ковалентно присоединенного метионина.

Фиг.6А-6Н являются фотографиями, показывающими включение меченого 35S-метионина (35S-met) в состав трансляционной матрицы. Фиг.6А показывает зависимость этой реакции от ионов магния (Mg2+). Фиг.6В показывает стабильность оснований получаемого продукта; изменение подвижности соответствует утрате 5'-последовательности РНК 43-Р (также обозначаемой как "Met-матрица") с получением ДНК-пуромицинового компонента, обозначаемого 30-Р. Сохранение метки после обработки оснований соответствовало образованию пептидной связи между 35S-метионином и 3'-пуромицином матрицы. Фиг.6С показывает ингибирование образования продукта реакции в присутствии ингибиторов пептидилтрансферазы. Фиг.6D показывает зависимость включения 35S-метионина от кодирующей последовательности в составе матрицы. Фиг.6Е показывает зависимость включения 35S-метионина от длины ДНК-матрицы. Фиг.6F показывает образование продуктов реакции в цис- и транс-положении с использованием матриц 43-Р и 25-Р. Фиг.6G показывает образование продуктов реакции в цис- и транс-положении с использованием матриц 43-Р и 13-Р. Фиг.6Н показывает образование продукта реакции в цис- и транс-положении при использовании матриц 43-Р и 30-Р в системе лизата ретикулоцитов.

Фиг.7А-7С являются схематическим изображением конструкций, предназначенных для тестирования образования и отбора пептидных гибридов. Фиг.7А показывает LP77 ("лигированный продукт" длиной "77" нуклеотидов) (также обозначаемый как "короткая myс-матрица") (SEQ ID N0:l). Эта последовательность включает эпитоп-метку для моноклонального антитела к с-myс - EQKLISEEDL (SEQ ID NO: 2) (Evan et al., 1985, Mol. Cell. Biol., 5, 3610-3616), - фланкированную старт-кодоном с 5'-конца и линкером с 3'-конца. Участок с 5'-конца включает бактериальную последовательность Шайна-Дальгарно, идентичную той, что имеется в составе 43-Р. Кодирующая последовательность была оптимизирована для трансляции в бактериальных системах. В частности, 5'-UTRs в составе 43-Р и LP77 включали последовательность Шайна-Дальгарно, комплементарную пяти основаниям в 163-рРНК (Steitz & Jakes, 1975, Proc. Natl. Acad. Sci. USA, 72, 4734-4738) и организованную так же, как в последовательностях рибосомных белков (Stormo et al., 1982, Nucleic Acids Research, 10, 2971-2996). Фиг.7В показывает LP154 (лигированный продукт длиной 154 нуклеотида) (также обозначаемый как "длинная myс-матрица") (SEQ ID N0:3). Эта последовательность включает код пептида, используемого для получения антитела к с-myс. В 5'-концевой части находится укороченый вариант последовательности TMV (обозначенный "ТЕ"). Этот участок 5'-UTR включает 22-нуклеотидную последовательность, производную от TMV 5'-UTR, включающую два прямых повтора ACAAAUUAC (Gallie et al., 1988, Nucl. Acids Res., 16, 883). Фиг.7С показывает пул №1 (SEQ ID NO 4), являющийся примером последовательности, которая может быть использована для