Способ продуцирования библиотеки белков (варианты), способ отбора нужного белка и нуклеиновой кислоты
Реферат
Изобретение относится к биотехнологии и может быть использовано для выделения белков с нужными свойствами из крупных пулов и нуклеиновых кислот (НК). Изобретение предусматривает получение гибридов "РНК-белок", которое включает стадию посттрансляционного инкубирования с высокой концентрацией одновалентного катиона. В качестве одновалентного катиона используют Na+, K+ или NH+4 в концентрации от 125 мМ до 1,5 М. Способ предусматривает также использование и/или двухвалентного или более высоковалентного катиона, например Mg+2, в концентрации от 25 мМ до 200 мМ. Способ позволяет получить библиотеку белков. Анлогичный способ используют для получения библиотеки ДНК, который дополнительно включает стадию генерирования ДНК-молекулы из каждой РНК-части гибридов. Изобретение также раскрывает способ отбора нужного белка и НК из полученных библиотек белков и НК, включающий получение и отбор нужного гибрида "РНК-белок" с последующим отбором нужного белка и НК, кодирующего нужный белок. Использование изобретения позволяет облегчить выделение белков с нужными свойствами, а также решить проблему выделения и амплификации последовательности белка. 3 н. и 51 з.п. ф-лы, 38 ил., 5 табл.
Настоящая заявка является частичным продолжением одновременно рассматриваемой заявки США, Szostak и др., рег. №09/007005, поданной 14 января 1998, притязания по которой вытекают из предварительных заявок США, Szostak и др., рег. №60/064491, поданной 6 ноября 1997 и в настоящее время отозванной, и рег. №60/035963, поданной 21 января 1997 и в настоящее время отозванной.
Настоящее изобретение относится к способам отбора белка.
Настоящее изобретение было осуществлено на средства, выделенные правительством в соответствии с грантом F32 GM17776-01 и F32 GM17776-02. Правительство имеет определенные права на это изобретение.
Существующие в настоящее время методы выделения РНК- и ДНК-молекул основаны на их функциях. Так, например, эксперименты Ellington и Szostak (Nature 346: 818 (1990); и Nature 355: 850 (1992)) и Tuerk & Gold (Science 249: 505 (1990); и J. Mol. Biol. 222: 739 (1991)) продемонстрировали, что очень редко молекулы нуклеиновых кислот с нужными свойствами (то есть менее чем 1 из 1013) могут быть выделены из многокомпонентных пулов молекул путем проведения повторных циклов отбора и амплификации. По сравнению с традиционными генетическими методами отбора эти методы имеют те преимущества, что (i) могут быть скринированы очень крупные пулы-кандидаты (>1015), (ii) жизнеспособность хозяина и in vivo условия не имеют особого значения, и (iii) отбор может быть осуществлен даже, если не существуют метода генетического скрининга in vivo. Эффективность отбора in vitro была продемонстрирована при определении новых РНК- и ДНК-последовательностей, обладающих в высокой степени специфическими функциями связывания с белком (см., например, Tuerk & Gold, Science 249: 505 (1990); Irvine et al., J. Mol. Biol. 222: 739 (1991); Oliphant et al., Mol. Cell. Biol. 9: 2944 (1989); Blackwell et al., Science 250: 1104 (1990); Pollock & Treisman, Nuc. Acids. Res. 18: 6197 (1990); Thiesen & Bach, Nuc. Acids. Res. 18: 3203 (1990); Bartel et al. Cell. 57: 529 (1991); Stormo & Yoshioka, Proc. Natl. Acad. Sci. USA 88: 5699 (1991); и Bock et al., Nature 355: 564 (1992)), функциями связывания с небольшими молекулами (Ellington & Szostak, Nature 346: 818 (1990); Ellington & Szostak, Nature 355: 850 (1992)) и каталитическими функциями (Green et al., Nature 347: 406 (1990); Robertson & Joyce, Nature 344: 467 (1990); Beaudry & Joyce, Science 257: 635 (1992); Bartel & Szostak, Science 261: 1411 (1993); Lorsch & Szostak, Nature 371: 31-36 (1994); Cuenoud & Szostak, Nature 375: 611-614 (1995); Chapman & Szostak, Chemistry and Biology 2: 325-333 (1995); и Lohse & Szostak, Nature 381: 442-444 (1996)). Аналогичная схема отбора и амплификации белков не была продемонстрирована.
Краткое описание изобретения
Целью настоящего изобретения является осуществление принципов in vitro отбора и in vitro эволюции, применяемых к белкам. Настоящее изобретение облегчает выделение белков с нужными свойствами из крупных пулов частично или полностью рандомизированных аминокислотных последовательностей. Кроме того, настоящее изобретение позволяет решить проблему выделения и амплификации последовательности белка путем ковалентного связывания кодирующей последовательности мРНК с молекулой белка.
В общих чертах, способ настоящего изобретения представляет собой протокол in vitro или in situ транскрипции/трансляции, который позволяет генерировать белок, ковалентно связанный с 3'-концом его собственной мРНК, то есть гибрид "РНК-белок". Указанный способ осуществляют путем синтеза и in vitro или in situ трансляции молекулы мРНК с пептидным акцептором, присоединенным к ее 3'-концу. Одним из предпочтительных пептидных акцепторов является пуромицин, нуклеозидный аналог, который присоединяется к С-концу растущей пептидной цепи и терминирует трансляцию. В одной из предпочтительных конструкций ДНК-последовательность включена между концом транскрипта и пептидным акцептором, который был сконструирован для того, чтобы вызвать остановку рибосомы в конце открытой рамки считывания, что дает пептидному акцептору (например, пуромицину) дополнительное время для присоединения растущей пептидной цепи перед гидролизом связи петидил-тРНК.
Полученный гибрид "РНК-белок" позволяет осуществлять, если это необходимо, повторные циклы отбора и амплификации, так как данные о последовательности белка могут быть получены путем обратной транскрипции и амплификации (например, путем ПЦР-амплификации, а также каким-либо другим методом амплификации, включая методы амплификации на основе РНК, такие как 3SR или TSA). Амплифицированная нуклеиновая кислота может быть затем транскрибирована, модифицирована и in vitro или in situ транслирована с образованием гибридов "мРНК-белок" для проведения следующего цикла отбора. Возможность проводить множество циклов отбора и амплификации позволяет достичь обогащения очень редких молекул и их выделения, например выделения одной нужной молекулы из пула, имеющего 1015 членов. Это, в свою очередь, дает возможность выделить новые или улучшенные белки, которые специфически узнают практически любую мишень, или которые катализируют нужные химические реакции.
В соответствии с этим в первом своем аспекте настоящее изобретение относится к способу отбора нужного белка, включающему стадии: (а) продуцирования популяции РНК-молекул-кандидатов, каждая из которых содержит последовательность инициации трансляции и старт-кодон, функционально присоединенный к последовательности, кодирующей белок-кандидат, и каждая из которых функционально присоединена к пептидному акцептору у 3'-конца данной последовательности, кодирующей белок-кандидат; (b) in vitro или in situ трансляции последовательностей, кодирующих белок-кандидат, с продуцированием популяции гибридов-кандидатов "РНК-белок; и (с) отбора нужного гибрида "РНК-белок", и тем самым отбора нужного белка.
В своем родственном аспекте настоящее изобретение относится к способу отбора ДНК-молекулы, кодирующей нужный белок, включающему стадии: (а) продуцирования популяции РНК-молекул-кандидатов, каждая из которых содержит последовательность инициации трансляции и старт-кодон, функционально присоединенный к последовательности, кодирующей белок-кандидат, и каждая из которых функционально присоединена к пептидному акцептору у 3'-конца последовательности, кодирующей белок-кандидат; (b) in vitro или in situ трансляции последовательностей, кодирующих белок-кандидат, с продуцированием популяции гибридов-кандидатов "РНК-белок"; (с) отбора нужного гибрида "РНК-белок"; и (d) генерирования из РНК-части указанного гибрида ДНК-молекулы, кодирующей нужный белок.
В другом своем родственном аспекте, настоящее изобретение относится к способу отбора белка, имеющего измененную функцию по сравнению с исходным белком, где указанный способ включает стадии: (а) продуцирования популяции РНК-молекул-кандидатов из популяции ДНК-матриц, каждая ДНК-матрица-кандидат содержит последовательность, кодирующую белок-кандидат и отличающуюся от последовательности, кодирующей исходный белок, где каждая из указанных РНК-молекул содержит последовательность инициации трансляции и старт-кодон, функционально присоединенный к последовательности, кодирующей белок-кандидат, и каждая из указанных молекул функционально присоединена к пептидному акцептору у 3'-конца; (b) in vitro или in situ трансляции последовательностей, кодирующих белок-кандидат, с продуцированием популяции гибридов-кандидатов "РНК-белок"; (с) отбора нужного гибрида "РНК-белок", имеющего измененную функцию, и тем самым отбора белка, имеющего измененную функцию.
В еще одном своем родственном аспекте настоящее изобретение относится к способу отбора ДНК-молекулы, кодирующей белок, имеющий измененную функцию по сравнению с исходным белком, включающий стадии: (а) продуцирования популяции РНК-молекул-кандидатов из популяций ДНК-матриц-кандидатов, причем каждая ДНК-матрица-кандидат содержит последовательность, кодирующую белок-кандидат, которая отличается от последовательности, кодирующей исходный белок, и где каждая РНК-молекула включает последовательность инициации трансляции и старт-кодон, функционально присоединенный к последовательности, кодирующей белок-кандидат, и каждая РНК-молекула функционально присоединена к пептидному акцептору у 3'-конца; (b) in vitro или in situ трансляции последовательностей, кодирующих белок-кандидат, с продуцированием популяции гибридов-кандидатов "РНК-белок"; (с) отбора гибрида РНК-белок, имеющего измененную функцию; и (d) генерирования из указанной РНК-части гибрида ДНК-молекулы, кодирующей белок, имеющий измененную функцию.
В еще одном родственном аспекте настоящее изобретение относится к способу отбора нужной РНК, включающему стадии: (а) продуцирования популяции РНК-молекул-кандидатов, каждая из которых содержит последовательность инициации трансляции и старт-кодон, функционально присоединенный к последовательности, кодирующей белок-кандидат, и каждая из которых функционально присоединена к пептидному акцептору у 3'-конца последовательности, кодирующей белок-кандидат; (b) in vitro или in situ трансляции последовательностей, кодирующих белок-кандидат, с продуцирова-нием популяции гибридов-кандидатов "РНК-белок"; и (с) отбора нужного гибрида "РНК-белок", и тем самым отбора нужной РНК.
В предпочтительных вариантах вышеуказанных способов пептидным акцептором является пуромицин; каждая из РНК-молекул-кандидатов, кроме того, включает стоп-последовательность, или, кроме того, включает ДНК-последовательность или аналог ДНК-последовательности, ковалентно связанный с 3'-концом указанной РНК; популяция РНК-молекул-кандидатов включает, по крайней мере, 109, предпочтительно, по крайней мере, 1010, более предпочтительно, по крайней мере, 1011, 1012 или 1013, а наиболее предпочтительно, по крайней мере, 1014 различных РНК-молекул; указанную реакцию in vitro-трансляции осуществляют в лизате, полученном от эукариотической клетки или ее части (т.е. эту реакцию, например, осуществляют в лизате ретикулоцита или лизате зародыша пшеницы); указанную реакцию in vitro-трансляции осуществляют в экстракте, полученном из прокариотической клетки (например, E.coli) или ее части; указанная стадия отбора предусматривает связывание нужного белка с иммобилизованным партнером по связыванию; данная стадия отбора предусматривает проведение анализа на функциональную активность нужного белка; данная молекула ДНК является амплифицированной; данный способ, кроме того, предусматривает повторение стадий вышеуказанных способов отбора; данный способ, кроме того, предусматривает транскрибирование РНК-молекулы из ДНК-молекулы и повторение стадий (a)-(d); а после стадии трансляции in vitro данный способ, кроме того, включает стадию инкубирования в присутствии 50-100 мМ Мg2+; а указанный гибрид РНК-белок, кроме того, включает последовательность нуклеиновой кислоты или аналог последовательности нуклеиновой кислоты, расположенный непосредственно у пептидного акцептора, который увеличивает гибкость.
В других родственных аспектах настоящее изобретение относится к гибриду РНК-белок, отобранному любым из способов настоящего изобретения; к рибонуклеиновой кислоте, ковалентно связанной амидной связью с аминокислотной последовательностью, где данная аминокислотная последовательность кодируется рибонуклеиновой кислотой; и к рибонуклеиновой кислоте, которая включает последовательность инициации трансляции и старт-кодон, функционально присоединенный к последовательности, кодирующей белок-кандидат, где указанная рибонуклеиновая кислота функционально присоединена к пептидному акцептору (например, к пуромицину) у 3'-конца данной последовательности, кодирующей белок-кандидат.
Во втором своем аспекте настоящее изобретение относится к способу отбора нужного белка или нужной РНК путем обогащения пула последовательностей. Этот способ предусматривает проведение стадий: (а) продуцирования популяции РНК-молекул-кандидатов, каждая из которых включает последовательность инициации трансляции и старт-кодон, функционально присоединенный к последовательности, кодирующей белок-кандидат, и каждая из которых функционально присоединена к пептидному акцептору у 3'-конца данной последовательности, кодирующей белок-кандидат; (b) in vitro- или in situ-трансляции последовательностей, кодирующих белок-кандидат, с продуцированием популяции гибридов-кандидатов "РНК-белок"; (с) контактирования популяции гибридов РНК-белок с партнером по связыванию, специфичным для РНК-части или белковой части гибрида "РНК-белок" в условиях, которые, в основном, способствуют отделению комплексов гибрида "партнер по связыванию-РНК-белок" от несвязанных членов этой популяции; (d) высвобождения связанных гибридов "РНК-белок" из этих комплексов; и (е) контактирования данной популяции гибридов "РНК-белок" стадии (d) с партнером по связыванию, специфичным для белковой части нужного гибрида "РНК-белок" в условиях, которые, в основном, способствуют отделению комплекса "партнер по связыванию-РНК-белок" от несвязанных членов указанной популяции и, тем самым, отбора нужного белка и нужной РНК.
В предпочтительных вариантах осуществления изобретения указанный способ, кроме того, предусматривает повторение стадий (а)-(е). Кроме того, для проведения этих повторных стадий в целях селективного обогащения нужным гибридом "РНК-белок" могут быть использованы те же самые или другие партнеры по связыванию в любом порядке. В другом предпочтительном варианте стадия (d) предусматривает использование партнера по связыванию (например, моноклонального антитела), специфичного для белковой части нужного гибрида. Эту стадию предпочтительно проводят после обратной транскрипции РНК-части гибрида с продуцированием ДНК, кодирующей нужный белок. При необходимости указанная ДНК может быть выделена и/или ПЦР-амплифицирована. Этот способ обогащения может быть использован для отбора нужного белка, либо он может быть использован для отбора белка, имеющего измененную функцию по сравнению с исходным белком.
В других предпочтительных вариантах осуществления способов обогащения пептидным акцептором является пуромицин; каждая из РНК-молекул кандидатов, кроме того, включает стоп-последовательность или, кроме того, включает ДНК-последовательность или аналог ДНК-последовательности, ковалентно связанный с 3'-концом указанной РНК; указанная популяция РНК-молекул-кандидатов включает, по крайней мере, 109, предпочтительно, по крайней мере, 1010, более предпочтительно, по крайней мере, 1011, 1012 или 1013, а наиболее предпочтительно, по крайней мере, 1014 различных РНК-молекул; указанную реакцию in vitro-трансляции осуществляют в лизате, полученном из эукариотической клетки или ее части (эту реакцию, например, осуществляют в лизате ретикулоцита или лизате зародыша пшеницы); указанную реакцию in vitro-трансляции осуществляют в экстракте, полученном от прокариотической клетки (например, E.coli) или ее части; указанная ДНК-молекула является амплифицированной; по крайней мере, один из партнеров по связыванию является иммобилизованным на твердом носителе; после стадии трансляции in vitro, данный способ, кроме того, включает стадию инкубирования, осуществляемую в присутствии 50-100 мМ Mg2+; а указанный гибрид "РНК-белок", кроме того, включает последовательность нуклеиновой кислоты или аналог последовательности нуклеиновой кислоты, расположенный возле пептидного акцептора, что увеличивает гибкость.
В своем родственном аспекте настоящее изобретение относится к способам продуцирования библиотек (например, библиотек белка, ДНК или РНК-гибридов) или к способам отбора нужных молекул (например, молекул белка, ДНК- или РНК-молекул или молекул, имеющих конкретную функцию или измененную функцию), включающим стадию посттрансляционного инкубирования в присутствии высшей соли (включая, но не ограничиваясь ею, высшая соль, которая содержит одновалентный катион, такой как К+, NH+4 или Na+, двухвалентный катион, такой как Mg+2, или их комбинацию). Такое инку-бирование может быть осуществлено приблизительно при комнатной температуре или приблизительно при -20С, а предпочтительные концентрации соли составляют приблизительно 125 мМ - 1,5 М (более предпочтительно приблизительно 300 мМ - 600 мМ) для одновалентных катионов и приблизительно 25 мМ - 200 мМ для двухвалентных катионов.
В другом своем родственном аспекте настоящее изобретение относится к наборам для осуществления любого из способов отбора, описанных в настоящей заявке.
В третьем и последнем своем аспекте настоящее изобретение относится к микрочипам, которые включают массив иммобилизованных одноцепочечных нуклеиновых кислот, нуклеиновых кислот, гибридизированных с гибридами РНК-белок. Предпочтительным белковым компонентом гибрида "РНК-белок" является белок, кодируемый РНК.
Используемый здесь термин "популяция" означает более чем одну молекулу (например, более чем одну РНК, ДНК или гибридную молекулу "РНК-белок"). Поскольку способы настоящего изобретения облегчают отбор, который начинается, если это необходимо, с большого числа членов молекул-кандидатов, составляющих "популяцию" настоящего изобретения, состоящую предпочтительно из более чем 109 молекул, более предпочтительно из более чем 1011, 1012 или 1013 молекул, а наиболее предпочтительно из более чем 1013 молекул.
Термин "отбор" означает, в основном, отделение одной молекулы от других молекул в популяции. Используемый здесь термин стадия "отбора" означает, по крайней мере, 2-кратное, предпочтительно 30-кратное, более предпочтительно 100-кратное, а наиболее предпочтительно 1000-кратное обогащение данной популяции нужными молекулами по сравнению с ненужными молекулами после проведения данной стадии отбора. Как показано в настоящей заявке, стадия отбора может повторяться любое число раз, и в данном способе могут быть объединены различные типы стадий отбора.
Термин "белок" означает любые две или более природные или модифицированные аминокислоты, связанные друг с другом одной или более пептидными связями. Термины "белок" и "пептид" являются взаимозаменяемыми.
Термин "РНК" означает последовательность, состоящую из двух или более ковалентно связанных природных или модифицированных рибонуклеотидов. Одним из примеров модифицированной РНК, охватываемой этим термином, является фосфоротиоат-РНК.
Термин "последовательность инициации трансляции" означает любую последовательность, имеющую функциональный сайт присоединения рибосомы. В бактериальных системах эту область иногда называют последовательностью Шайна-Дальгарно.
Термин "старт-кодон" означает три основания, которые являются признаком начала последовательности, кодирующей белок. Обычно такими основаниями являются AUG (или ATG), однако в данном способе они могут быть заменены на любой другой подходящий триплет.
Термин "ковалентно связанный" с пептидным акцептором означает, что данный пептидный акцептор присоединен к "кодирующей белок последовательности" либо непосредственно через ковалентную связь, либо опосредованно с помощью другой ковалентно связанной последовательности (например, ДНК, соответствующей стоп-сайту).
Термин "пептидный акцептор" означает любую молекулу, способную присоединяться к С-концу растущей пептидной цепи благодаря каталитической активности пептидилтрансферазной функции рибосомы. Обычно такие молекулы содержат (i) нуклеотид или нуклетид-подобную составляющую (например, аденозин или аналог аденозина (допускается диметилирование в N-6-амино-положении)), (ii) аминокислоту или составляющую, подобную аминокислоте (например, любую из 20 D- или L-аминокислот или любой их аналог (например, O-метилтирозин или любой из аналогов, описанных Ellman et al., Meth. Enzymol. 202: 301, 1991) и (iii) связь между двумя группами (например, сложноэфирную, амидную или кетоновую связь в 3'-положении или менее предпочтительно в 2'-положении); при этом предпочтительно, чтобы эта связь, в основном, не нарушала образование кольца из природной рибонуклеотидной конформации. Пептидный акцептор может также содержать нуклеофильную группу, которая может быть, но не ограничивается ими, аминогруппой, гидроксильной группой или сульфгидрильной группой. Кроме того, пептидные акцепторы могут состоять из нуклеотидных миметиков, аминокислотных миметиков или миметиков из объединенных нуклеотид-аминокислотных структур.
Понятие "пептидный акцептор, находящийся в положении у 3'-конца кодирующей белок последовательности" означает, что данная молекула пептидного акцептора расположена за конечным кодоном указанной кодирующей белок последовательности. Этот термин включает, но не ограничивается ими, молекулу пептидного акцептора, которая расположена непосредственно у 3'-конца кодирующей белок последовательности, а также молекулу, которая отделена от конечного кодона кодирующей или некодирующей последовательностью-интроном (например, последовательностью, соответствующей стоп-сайту). Этот термин также включает конструкции, в которых кодирующие или некодирующие последовательности следуют за (т.е., с 3'-конца) молекулой пептидного акцептора. Кроме того, этот термин включает, но не ограничивается ими, молекулу пептидного акцептора, которая является ковалентно связанной (либо непосредственно, либо опосредованно через встраиваемую последовательность нуклеиновой кислоты) с кодирующей белок последовательностью, а также молекулу, которая присоединена к кодирующей белок последовательности путем нековалентного связывания, например путем гибридизации с использованием второй последовательности нуклеиновой кислоты, которая связывается у 3'-конца или возле 3'-конца последовательности, кодирующей белок, и которая сама является связанной с молекулой пептидного акцептора.
Термин "измененная функция" означает любое качественное или количественное изменение функции молекулы.
Термин "стоп-последовательность" означает последовательность нуклеиновой кислоты, которая замедляет уровень или прекращает трансляцию под действием рибосомы.
Термин "партнер по связыванию", используемый в настоящем описании, означает любую молекулу, которая имеет специфическую ковалентную или нековалентную аффинность по отношению к части нужного гибрида РНК-белок. Примерами партнеров по связыванию являются, но не ограничиваются ими, члены пар антиген/антитело, пар белок/ингибитор, пар рецептор/лиганд (например, пар рецептор клеточной поверхности/лиганд, таких как пары рецептор гормона/пептидный гормон), пар фермент/субстрат (например, пар ки-наза/субстрат), пар лектин/углевод, агрегатов олигомерных или гетероолигомерных белков, пар ДНК-связывающий белок/сайт связывания с ДНК, пар РНК/белок и дуплексов нуклеиновой кислоты, гетеродуплексов или лигированных цепей, а также любая молекула, способная образовывать одну или несколько ковалентных или нековалентных связей (например, дисульфидных связей) с любой частью гибрида "РНК-белок". Партнерами по связыванию являются, но не ограничиваются ими, любой из "мотивов для отбора", представленных на фиг.2.
Термин "твердый носитель" означает, но не ограничивается ими, любую колонку (или материал колонки), гранулы, тест-пробирку, чашку для микротитрования, твердую частицу (например, агарозу или сефарозу), микрочип (например, чип из кремния, кремниевого стекла или золота) или мембрану (например, мембрану липосомы или везикулы), с которыми может связываться аффинный комплекс либо прямо, либо опосредованно (например, посредством других промежуточных партнеров по связыванию, таких как другие антитела или белок А), или в которые аффинный комплекс может быть погружен (например, посредством рецептора или канала).
Термин "высшая соль" означает соль, имеющую концентрацию одновалентного катиона, по крайней мере, 200 мМ, а предпочтительно, по крайней мере, 500 мМ или даже 1 М, и/или концентрацию двухвалентного катиона или катиона с более высокой валентностью, по крайней мере, 25 мМ, предпочтительно, по крайней мере, 50 мМ, а наиболее предпочтительно, по крайней мере, 100 мМ.
Настоящее изобретение имеет ряд значительных преимуществ. Прежде всего, это первый пример данного типа схемы отбора и амплификации белков. Описанный способ позволяет решить проблему, связанную с необходимостью выделения нуклеотидных последовательностей, соответствующих нужным выделенным белкам (поскольку реплицироваться могут только нуклеиновые кислоты). В частности, многие используемые ранее способы, которые позволяли выделять белки из частично или полностью рандомизированных пулов, предусматривали проведение стадии in vivo. Способами такого типа являются: технология моноклональных антител (Milstein, Sci. Amer. 243: 66 (1980); и Schultz et al., J. Chem. Engng. News 68:26 (1990)), фаговое отображение (Smith, Science 228: 1315 (1985); Parmley & Smith, Gene 73: 305 (1988); и McCafferty et al., Nature 348: 552 (1990)), использование гибридов пептид-lac-репрессор (Cull et al., Proc. Natl. Acad. Sci. USA 89: 1865 (1992)) и классические методы генетического отбора. В отличие от способа настоящего изобретения каждый из этих способов основан на топологической связи между белком и нуклеиновой кислотой так, чтобы данная информация о белке сохранялась и могла быть получена в считываемой форме нуклеиновой кислоты.
Кроме того, настоящее изобретение имеет преимущества по сравнению с известным методом трансляции (Tuerk & Gold, Science 249: 505 (1990); Irvine et al., J. Mol. Biol. 222: 739 (1991); Korman et al., Proc. Natl. Acad. Sci. USA 79: 1844-1848 (1982); Mattheakis et al., Proc. Natl. Acad. Sci. USA 91: 9022-9026 (1994); Mattheakis et al., Meth. Enzymol. 267: 195 (1996); и Hanes & Pluckthun, Proc. Natl. Acad. Sci. USA 94: 4937 (1997)), методом, в котором проводят отбор на определенное свойство растущей белковой цепи, которая, кроме того, образует комплекс с рибосомой и ее мРНК. В отличие от известного метода трансляции способ настоящего изобретения не основан на сохранении целостности трехкомпонентного комплекса "мРНК:рибосома:растущая цепь", то есть комплекса, который является очень непрочным, а следовательно, известный способ ограничен в отношении технически возможных типов отбора.
Способ настоящего изобретения также имеет преимущества по сравнению с методом разветвленного синтеза, предложенным Brenner & Lerner (Proc. Natl. Acad. Sci., USA, 89: 5381-5383 (1992)), в котором генерируют гибриды ДНК-пептид, и генетическую информацию теоретически получают после одного цикла отбора. В отличие от метода разветвленного синтеза способ настоящего изобретения не требует регенерации пептида из ДНК-части гибрида (который в методе разветвленного синтеза обычно получают посредством отдельных циклов химического синтеза). В соответствии с этим способ настоящего изобретения позволяет проводить повторные циклы отбора с использованием популяций молекул-кандидатов. Кроме того, в отличие от метода разветвленного синтеза, который, в основном, ограничен отбором достаточно коротких последовательностей, способ настоящего изобретения может быть использован для отбора молекул белка, имеющих значительную длину.
Еще одно преимущество настоящего изобретения заключается в том, что метод отбора и направленной эволюции позволяет использовать очень большие и комплексные библиотеки последовательностей-кандидатов. В противоположность этому существующие методы отбора белков, которые основаны на проведении стадии in vivo, обычно ограничены относительно небольшими библиотеками с несколько ограниченной множественностью. Это преимущество является особенно важным при отборе функциональных последовательностей белка, если учесть, что, например, для пептида, состоящего только из 10 аминокислот, существует 1013 возможных последовательностей. В классических генетических методах, то есть в методах с использованием гибрида lac-peпpeccopa и в способах фагового отображения, максимальная множественность обычно приходится на величину порядка ниже 1013 членов. Большой размер библиотеки также является преимуществом для ее применений в методах направленной эволюции, которые заключаются в том, что окружающие последовательности могут быть использованы для более глубокого исследования данной исходной последовательности.
Способ настоящего изобретения также отличается от предшествующих способов тем, что стадия отбора не зависит от окружающих последовательностей ("контекста"). Во многих других схемах отбора указанный "контекст", в котором, например, присутствует экспрессированный белок, может в значительной степени влиять на природу генерированной библиотеки. Так, например, экспрессированный белок не сможет соответствующим образом экспрессироваться в конкретной системе или не может быть соответствующим образом отображен (например, на поверхности фаговой частицы). Альтернативно экспрессия белка может фактически препятствовать проведению одной или нескольких критических стадий в цикле отбора, например влиять на жизнеспособность или инфекционность фага либо на связывание с lac-репрессором. Эти негативные факторы могут приводить к потерям функциональных молекул или к ограничениям на характер процедур отбора, которые могут быть использованы.
И наконец, способ настоящего изобретения имеет преимущества, поскольку он обеспечивает контроль за набором белков, которые могут быть протестированы. В некоторых методах (например, в отборе с использованием антитела) имеется незначительный или вообще отсутствует контроль за природой исходного пула. В других методах (например, с использованием lac-гибридов и фагового отображения) пул кандидатов должен быть экспрессирован в "контексте" гибридного белка. В противоположность этому гибридные конструкции "РНК-белок" позволяют осуществлять контроль за природой пулов кандидатов, доступных для скрининга. Кроме того, размер пула кандидатов может быть таким же большим, как РНК- или ДНК-пулы (~1015 членов), и ограничен лишь объемом осуществляемой реакции in vitro трансляции. Создание пула кандидатов полностью зависит от целей эксперимента; произвольные области могут быть скринированы отдельно либо в "контексте" нужного гибридного белка, и большинство возможных последовательностей, если не все, могут быть экспрессированы в пулах кандидатов гибридов "РНК-белок".
Другие признаки и преимущества настоящего изобретения будут очевидны из нижеследующего подробного описания и формулы изобретения.
Подробное описание изобретения
Сначала приводится описание чертежей.
Краткое описание чертежей.
На фигурах 1А-1С схематически представлены стадии продуцирования гибридов РНК-белок. На фиг.1А проиллюстрирована конструкция образца ДНК для генерирования РНК-части гибрида. На фиг.1В проиллюстрировано генерирование конъюгата РНК/пуромицин. На фиг.1С проиллюстрировано генерирование гибрида РНК-белок.
На фиг.2 схематически представлен протокол генерализованного отбора настоящего изобретения.
На фиг.3 схематически представлен протокол синтеза минимальных трансляционных матриц, содержащих 3'-пуромицин. На стадии (А) показано присоединение защитных групп к реакционным функциональным группам на пуромицине (5'-OH и NH2); в качестве модифицированных групп эти группы соответствующим образом защищены для их использования в олигонуклеотидном синтезе на основе фосфорамидита. Указанный защищенный пуромицин был присоединен к стеклу с контролируемым аминогексилом размером пор (CPG) посредством группы 2'-ОН с использованием стандартной схемы присоединения ДНК посредством ее 3'-ОН (Gait, Oligonucleotide Synthesis, A Practical Approach, The Practical Approach Series (IRL Press, Oxford, 1984)). В стадии (В) минимальная трансляционная матрица (называемая "43-Р"), которая содержит 43 нуклеотида, была синтезирована с использованием стандартного метода химического синтеза РНК и ДНК (Millipore, Bedford, MA), защищена с использованием NН4OН и TBAF и подвергнута гель-очистке. Данная матрица содержит 13 оснований РНК у 5'-конца, за которыми следуют 29 оснований ДНК, присоединенных к 3'-пуромицину у его 5'-ОН. Данная РНК-последовательность содержит (i) консенсусную последовательность Шайна-Дальгарно, комплементарную пяти основаниям 16S рРНК (Stormo et al., Nucleic Acids Research 10: 2971-2996 (1982); Shine & Dalgarno, Proc. Natl. Acad. Sci. USA 71: 1342-1346 (1974); и Steitz & Jakes, Proc. Natl. Acad. Sci. USA 72: 4734-4738 (1975)), (ii) спейсер из пяти оснований и (iii) один старт-кодон AUG. Эта ДНК-последовательность представляет собой dA27dCdCP, где "Р" означает пуромицин.
На фиг.4 схематически представлен предпочтительный способ получения защищенного CPG-связанного пуромицина.
На фиг.5 схематически представлены возможные методы включения метионина в матрицу настоящего изобретения. Как показано в реакции (А), данная матрица связывается с рибосомой, образуя, тем самым, комплекс инициации 70S. Fmet-тРНК связывается с Р-сайтом и представляет собой пару оснований, связанную с матрицей. Пуромицин у 3'-конца данной матрицы вводит А-сайт путем внутримолекулярной реакции и образует амидную связь с N-формилметионином через пептидилтрансферазный центр, что, тем самым, приводит к деацилированию тРНК. Экстракция реакционной смеси фенолом/хлороформом приводит к образованию матрицы с ковалентно присоединенным метионином. Как показано, реакция (В) представляет собой нежелательную внутримолекулярную реакцию матрицы с олигонуклеотидами, содержащими пуромицин. Как указывалось ранее, минимальная матрица стимулирует образование рибосомы 70S, содержащей fmet-тРНК, связанную с Р-сайтом. После этого осуществляется включение второй матрицы в транс-положение с получением ковалентно связанного метионина.
На фиг.6А-6Н представлены фотографии, иллюстрирующие включение 35S-метионина (35S-met) в трансляционные матрицы. На фиг.6А продемонстрирована зависимость реакции от магния (Мg2+). На фиг.6В продемонстрирована основная стабильность продукта; изменение подвижности, показанное на этой фигуре, соответствует потере 5'-РНК-последовательности 43-Р (называемой также "Met-матрицей") с продуцированном части ДНК-пуромицин, называемой 30-Р. Удерживание метки после обработки основанием соответствует образованию пептидной связи между 35S-метионином и 3'-пуромицином данной матрицы. На фиг.6С продемонстрировано ингибирование образования продукта в присутствии ингибиторов пептидилтрансферазы. На фиг.6D продемонстрирована зависимость включения 35S-метионина от последовательности, кодирующей матрицу. На фиг.6Е продемонстрирована зависимость длины ДНК-матрицы от включения 32S-метионина. На фиг.6F проиллюстрировано образование цис- или транс-продукта с использованием матриц 43-Р и 25-Р. На фиг.6G проиллюстрировано образование цис- или транс-продукта с использованием матриц 43-Р и 13-Р. На фиг.6Н проиллюстрировано образование цис- или транс-продукта с использованием матриц 43-Р и 30-Р в системе лизата ретикулоцита.
На фиг.7А-7С схематически проиллюстрированы конструкции для тестирования на образование и отбор пептидного гибрида. На фиг.7А показан LP77 ("лигированный продукт", длина 77 нуклеотидов) (также называемый "короткой mус-матрицей") (SEQ ID NO:1). Эта последовательность содержит метку EQKLISEEDL эпитопа моноклонального антитела против c-myc (SEQ ID NO:2) (Evan et al., Mol. Cell. Biol. 5: 3610-3616 (1985)), фланкированную 5'-старткодоном и 3'-линкером. Эта 5'-область содержит бактериальную последовательность Шайна-Дальгарно, идентичную последовательности 43-Р. Данная кодирующая последовательность была оптимизирована для трансляции в бактериальных системах. В частности, 5'-UTR 43-Р и LP77 содержат последовательность Шайна-Дальгарно, комплементарную пяти основаниям 16S рРНК (Steitz & Jakes, Proc. Natl. Acad. Sci. USA 72: 4734-4738 (1975)) и расположенную аналогично последовательностям рибосомного белка (Stormo et al., Nucleic Acids Res. 10: 2971-2996 (1982)). На фиг.7В показан LP 154 (лигированный продукт, длина: 154 нуклеотида) (также называемый "длинной mус-матрицей") (SEQ ID NO:3). Э