Сигнальные пептиды тат для продукции белков в прокариотах

Иллюстрации

Показать все

Изобретение относится к области биотехнологии. Представлен слитый пептид для нейтрализации или разрушения фосфорорганических соединений, содержащий сигнальный пептид ТАТ3 с аминокислотной последовательностью SEQ ID NO: 5, представленной в описании, функционально связанный с последовательностью органофосфатгидролазы SEQ ID NO: 18, классифицируемую как белок ЕС 3.1.8. Описаны выделенный полинуклеотид, кодирующий указанный слитый белок; вектор, содержащий указанный полинуклеотид; и прокариотическая клетка-хозяин, содержащая указанный вектор и экспрессирующая указанный слитый белок. Предложен способ получения фермента, разрушающего фосфорорганические соединения, включающий экспрессию указанного полинуклеотида в прокариотической клетке-хозяине, и продукцию указанного фермента. Изобретение позволяет повысить экспрессию органофосфатгидролазы в клетке-хозяине. 5 н. и 8 з.п. ф-лы, 1 табл., 9 ил., 2 пр.

Реферат

По настоящей заявке испрашивается приоритет по предварительной заявке США 60/936,183, поданной 18 июня 2007 года, и предварительной заявке США 60/936,186, поданной 18 июня 2007 года.

ГОСУДАРСТВЕННАЯ ПОДДЕРЖКА

Часть данной работы финансировалась контрактом № BAA ECBC-04 с центром Edgewood Chemical Biological Center (ECBC) армии США. Соответственно, правительство Соединенных Штатов может иметь некоторые права на данное изобретение.

ОБЛАСТЬ ТЕХНИКИ

Изобретение касается полинуклеотидов, кодирующих слитые с ТАТ белки, и способов продукции представляющих интерес белков в микроорганизмах. В частности, настоящее изобретение относится к полинуклеотидам, векторам, полипептидам и способам экспрессии ферментов, разрушающих фосфорорганические соединения, например, органофосфатгидролазы (ОРН), в клетке-хозяине, такой как клетка-хозяин рода Streptomyces.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ

У прокариот известны два механизма переноса белков через цитоплазматическую мембрану. У большинства бактерий наиболее хорошо описанным путем белкового экспорта является общий секреторный путь (Sec). Перенос через мембрану белков, экспортируемых по Sec-пути, осуществляется в развернутом состоянии через погруженный в мембрану транслокон, к которому они направляются с помощью отщепляемых N-концевых сигнальных пептидов.

Вторым основным путем экспорта является диаргининовый механизм переноса (Tat). В отличие от Sec-системы Tat-система участвует в транспорте свернутых белков. Белки направляются по Tat-пути при наличии N-концевых сигнальных пептидов, включающих консервативный диаргининовый мотив в N-концевой области Tat-сигнального пептида.

Благодаря способности к секреции свернутых белковых субстратов, Tat-перенос представляет важный механизм получения секретируемых белков, и его можно применять для крупномасштабной продукции белков, используемых для нейтрализации фосфорорганических соединений, которые применяются во многих сельскохозяйственных пестицидах и в качестве боевых отравляющих веществ, таких как зарин, зоман и VX [О-этил-S-(2-диизопропиламиноэтил)метилфосфонотиоат].

КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Идея настоящего изобретения основана, по меньшей мере, частично, на обнаружении того, что продукцию некоторых белков можно осуществлять в бактериальных клетках-хозяевах с использованием Tat-механизма. Соответственно, настоящее изобретение касается полинуклеотидов, кодирующих ТАТ-слитые белки, и способов продукции представляющих интерес белков в клетке-хозяине. В частности, настоящее изобретение относится к полинуклеотидам, векторам, полипептидам и способам экспрессии ферментов, разрушающих фосфорорганические соединения, например, органофосфатгидролазы (ОРН), в клетке-хозяине, такой как клетка-хозяин рода Streptomyces.

В одном варианте осуществления изобретение относится к выделенному полинуклеотиду, включающему первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей гидролазу триэфира фосфорной кислоты, классифицируемую как белок ЕС 3.1.8. В другом варианте осуществления изобретения выделенный полинуклеотид по изобретению включает первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ с аминокислотной последовательностью, выбранный из SEQ ID NO:1-5, функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей гидролазу триэфира фосфорной кислоты, классифицируемую как белок ЕС 3.1.8. В другом варианте осуществления изобретения выделенный полинуклеотид по изобретению включает первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей органофосфатгидролазу (ОРН). В другом варианте осуществления изобретения органофосфатгидролаза представляет собой ОРН с последовательностью SEQ ID NO:18 или ее вариант. В другом варианте осуществления изобретения выделенный полинуклеотид по изобретению включает первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей гидролазу триэфира фосфорной кислоты, классифицируемую как белок ЕС 3.1.8, в котором кодоны второй нуклеиновой кислоты выделенного полинуклеотида оптимизированы для экспрессии гидролазы триэфира фосфорной кислоты в клетке-хозяине видов рода Streptomyces. В еще одном варианте осуществления изобретение касается выделенного полинуклеотида по изобретению, содержащего первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей гидролазу триэфира фосфорной кислоты, классифицируемую как ЕС 3.1.8, в котором выделенный полинуклеотид дополнительно функционально связан с промотором А4 с последовательностью SEQ ID NO:23.

В другом варианте осуществления изобретение относится к экспрессионному вектору, включающему выделенный полинуклеотид, содержащий первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей гидролазу триэфира фосфорной кислоты, классифицируемую как белок ЕС 3.1.8. В некоторых вариантах осуществления изобретения экспрессионный вектор включает первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ с любой из последовательностей SEQ ID NOS:1-5, и вторую последовательность нуклеиновой кислоты, кодирующую гидролазу триэфира фосфорной кислоты, классифицируемую как белок ЕС 3.1.8. В некоторых вариантах осуществления изобретения экспрессионный вектор включает выделенный полинуклеотид, содержащий первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей органофосфатгидролазу. В некоторых вариантах осуществления изобретения органофосфатгидролаза представляет собой ОРН с последовательностью SEQ ID NO:18 или ее вариант. В некоторых вариантах осуществления изобретения выделенный полинуклеотид, включающий первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, которая функционально связана со второй последовательностью нуклеиновой кислоты, кодирующей гидролазу триэфира фосфорной кислоты, дополнительно функционально связан с промотором А4 с последовательностью SEQ ID NO:23. В других вариантах осуществления кодоны нуклеотидной последовательности, кодирующей гидролазу триэфира фосфорной кислоты, оптимизированы для экспрессии в клетке-хозяине видов рода Streptomyces. В некоторых вариантах осуществления изобретения клетка-хозяин рода Streptomyces представляет собой клетку-хозяина Streptomyces lividans.

В другом варианте осуществления изобретение касается выделенной клетки-хозяина, которая содержит экспрессионный вектор, включающий выделенный полинуклеотид, содержащий первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей гидролазу триэфира фосфорной кислоты, классифицируемую как белок ЕС 3.1.8. В некоторых вариантах осуществления изобретения клетка-хозяин содержит экспрессионный вектор, который включает первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ с любой из последовательностей SEQ ID NOS:1-5, и вторую последовательность нуклеиновой кислоты, кодирующую гидролазу триэфира фосфорной кислоты, классифицируемую как белок ЕС 3.1.8. В другом варианте осуществления изобретения клетка-хозяин содержит экспрессионный вектор, включающий выделенный полинуклеотид, содержащий первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей органофосфатгидролазу. В некоторых вариантах осуществления изобретения органофосфатгидролаза представляет собой ОРН с последовательностью SEQ ID NO:18 или ее вариант. В другом варианте осуществления изобретения экспрессионный вектор, содержащийся в клетке-хозяине, включает выделенный полинуклеотид, содержащий первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, которая функционально связана со второй последовательностью нуклеиновой кислоты, кодирующей гидролазу триэфира фосфорной кислоты, дополнительно функционально связан с промотором А4 с последовательностью SEQ ID NO:23. В других вариантах осуществления кодоны нуклеотидной последовательности, кодирующей гидролазу триэфира фосфорной кислоты, оптимизированы для экспрессии в клетке-хозяине рода Streptomyces. В некоторых вариантах осуществления изобретения клетка-хозяин по изобретению представляет собой клетку-хозяина рода Streptomyces, например, клетку-хозяина Streptomyces lividans.

В другом варианте осуществления изобретение касается выделенного слитого полипептида, включающего сигнальный пептид ТАТ2 или ТАТ3, связанный с органофосфатгидролазой с последовательностью SEQ ID NO:18. В другом варианте осуществления сигнальный пептид ТАТ, содержащийся в выделенном слитом полипептиде, выбран из SEQ ID NO:1 или 5.

В другом варианте осуществления изобретение касается способа получения фермента, разрушающего фосфорорганические соединения, включающего: экспрессию выделенного полинуклеотида, содержащего первую последовательность нуклеиновой кислоты, кодирующую сигнальный пептид ТАТ, функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей гидролазу триэфира фосфорной кислоты, классифицируемую как белок ЕС 3.1.8; и продукцию указанного фермента, разрушающего фосфорорганические соединения. В одном варианте осуществления изобретения разрушающий фосфорорганические соединения фермент, полученный способом по изобретению, представляет собой органофосфатгидролазу. В некоторых вариантах осуществления изобретения органофосфатгидролаза представляет собой ОРН с последовательностью SEQ ID NO:18 или ее вариант. В другом варианте осуществления способ по изобретению дополнительно включает выделение фермента, полученного в клетке-хозяине. В другом варианте осуществления изобретения клетка-хозяин способа по изобретению представляет собой клетку-хозяина рода Streptomyces.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Специалисту в данной области понятно, что чертежи представлены только для иллюстративных целей. Подразумевается, что чертежи никаким образом не ограничивают объем настоящего изобретения.

На фигуре 1 показан вектор рКВ105, содержащий промотор А4 из Aspergillus niger, укороченную сигнальную последовательность целлюлазы из S. lividans (CelA), полинуклеотид, кодирующий ген целлюлазы штамма 11AG8 рода Actinomyces, и последовательность терминатора целлюлазы из штамма 11AG3.

На фигуре 2 показан вектор рКВ229, полученный из вектора рКВ105 фигуры 1, в котором сигнальный пептид CelA замещен сигнальной последовательностью ТАТ1, а ген целлюлазы замещен геном ОРН с оптимизированными кодонами.

На фигуре 3 показан вектор рКВ231, полученный из вектора рКВ105 фигуры 1, в котором сигнальный пептид CelA замещен сигнальной последовательностью ТАТ2, а ген целлюлазы замещен геном ОРН с оптимизированными кодонами.

На фигуре 4 показан вектор рКВ233, полученный из вектора рКВ105 фигуры 1, в котором сигнальный пептид CelA замещен сигнальной последовательностью ТАТ3, а ген целлюлазы замещен геном ОРН с оптимизированными кодонами.

На фигуре 5 показан вектор рКВ234, полученный из вектора рКВ233 удалением ДНК-последовательностей E. coli между сайтами рестрикции SphI и EcoRI.

На фигуре 6 показан ДСН-ПААГЭ анализ ОРН, полученной в Streptomyces и экспрессированной в клетках-хозяевах в виде белка, слитого с сигнальными пептидами ТАТ1, ТАТ2 и ТАТ3.

На фигуре 7 показан эффект добавления ионов Zn2+ и Co2+ на получение и стабильность при хранении ОРН, экспрессированной в Streptomyces в виде белка, слитого с ТАТ3.

На фигуре 8 показана идентификация предполагаемой ОРН, полученной в клетках Streptomyces, с помощью трипсинового гидролиза в геле и пептидного картирования с помощью MALDI-масс спектрометрии.

На фигуре 9 показана параоксоназная активность ОРН, полученной в клетках-хозяевах Streptomyces.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Изобретение относится к полинуклеотидам, кодирующим слитые с ТАТ белки, и способам получения представляющих интерес белков в клетке-хозяине. В частности, настоящее изобретение относится к полинуклеотидам, векторам, полипептидам и способам экспрессии органофосфатгидролазы (ОРН) в клетке-хозяине, такой как клетка-хозяин рода Streptomyces.

Идея настоящего изобретения далее будет подробно описана путем ссылки только с использованием следующих определений и примеров. Все патенты и публикации, включая все последовательности, раскрытые в таких патентах и публикациях, упоминаемые в настоящем описании, прямо включены путем ссылки.

Если в описании не указано иное, то все технические и научные термины, используемые в настоящем описании, имеют такое же значение, какое обычно понимает под ними средний специалист в области, к которой относится изобретение. Специалисты в данной области могут найти общее описание многих терминов, используемых в изобретении, например, в Singleton and Sainsbury, Dictionary of Microbiology and Molecular Biology, 2d Ed., John Wiley and Sons, NY (1994); и в Hale and Markham, The Harper Collins Dictionary of Biology, Harper Perennial, NY (1991). Хотя в претворении на практике настоящего изобретения находят применение любые способы и материалы, аналогичные или эквивалентные способам и материалам, описанным в настоящем документе, предпочтительные способы и материалы описаны в настоящем документе. Соответственно, термины, определение которых приведено ниже, более полно описаны путем ссылки на описание изобретения в целом. Также, используемое в настоящем описании единственное число включает множественное, если контекст ясно не указывает иное. Численные диапазоны включают числа, ограничивающие диапазон. Если не указано иное, то нуклеотидные кислоты приведены слева направо в направлении от 5' к 3'; аминокислотные последовательности приведены слева направо в направлении от амино- к карбокси-концу, соответственно. Следует понимать, что это изобретение не ограничено конкретными описанными методикой, протоколами и реагентами, так как они могут варьировать в зависимости от контекста, в котором они используются специалистами в данной области.

Подразумевается, что каждое максимальное числовое ограничение, приведенное в этом описании, включает каждое меньшее числовое ограничение, как если бы такие меньшие числовые ограничения были ясно указаны в настоящем описании. Каждое минимальное числовое ограничение, приведенное в этом описании, будет включать каждое большее числовое ограничение, как если бы такие большие числовые ограничения были ясно указаны в настоящем описании. Каждый числовой диапазон, приведенный в этом описании, будет включать каждый более узкий числовой диапазон внутри такого более широкого числового диапазона, как если бы такие более узкие числовые диапазоны были ясно указаны в настоящем описании.

Приведенные в настоящем описании заголовки не являются ограничениями различных аспектов или вариантов осуществления, которые могут быть даны путем ссылки на описание изобретения в целом. Соответственно, термины, определение которых приведено ниже, более полно описаны путем ссылки на описание изобретения в целом.

ОПРЕДЕЛЕНИЯ

В настоящем описании термин «разрушающие фосфорорганические соединения ферменты» относится к ферментам, катализирующим гидролиз фосфоэфирных связей в фосфорорганических соединениях.

В настоящем описании термины «гидролаза триэфира фосфорной кислоты» или «фосфотриэстераза» относятся к ферменту, классифицируемому как EC 3.1.8, который действует на фосфорорганические соединения (такие как параоксон), включая эфиры фосфоновой и фосфиновой кислот. Гидролазы триэфира фосфорной кислоты включают арилдиалкилфосфатазы (EC 3.1.8.1), также известные как ОРН, и диизопропилфторфосфатазу (EC 3.1.8.2), также известную как ДФФаза.

Используемый в настоящем описании термин «полипептид» относится к соединению, представляющему одну цепь из аминокислотных остатков, соединенных пептидными связями. Используемый в настоящем описании термин «белок» может быть синонимом термину «полипептид» или может относиться, кроме того, к комплексу из двух или нескольких полипептидов. В настоящем описании используются стандартные трехбуквенные или однобуквенные обозначения аминокислотных остатков, где (А) обозначает аланин; (R) - аргинин; (N) - аспарагин; (D) - аспарагиновую кислоту; (С) - цистеин; (Е) - глутаминовую кислоту; (Q) - глутамин; (G) - глицин; (Н) - гистидин; (I) - изолейцин; (L) - лейцин; (К) - лизин; (М) - метионин; (F) - фенилаланин; (Р) - пролин; (S) - серин; (Т) - треонин; (W) - триптофан; (Y) - тирозин и (V) - валин.

Используемый в настоящем описании термин «слитый полипептид» или «слитый с Tat полипептид» относится к сигнальному пептиду Tat, соединенному или напрямую или через линкер с представляющим интерес белком.

Используемый в настоящем описании «сигнальный пептид» относится к аминокислотной последовательности на N-конце секретируемого белка. Практически все секретируемые белки имеют эту аминокислотную последовательность, которая играет важную роль в транспорте белка-предшественника к мембране и переносе через нее, и которая обычно протеолитически удаляется сигнальной пептидазой в ходе переноса белка через мембрану или сразу после него.

«Сигнальный пептид Tat» относится к N-концевой последовательности, включающей два последовательных аргининовых остатка, и которая участвует в секреции белков в свернутой конформации. «Сигнальный пептид Tat» можно взаимозаменяемо называть «Tat-пептид» или «Tat-полипептид».

Используемые в настоящем описании «представляющий интерес белок» или «представляющий интерес полипептид» относится к белку, экспрессируемому и секретируемому клеткой-хозяином. Представляющим интерес белком может быть любой белок, который до сегодняшнего момента рассматривался как белок, подходящий для экспрессии в прокариотах. Представляющий интерес белок может быть или гомологичным или гетерологичным для хозяина. В случае гомологичного представляющего интерес белка сверхэкспрессия представляет собой экспрессию выше обычного содержания белка в указанном хозяине. В случае гетерологичного представляющего интерес белка любая экспрессия представляет собой сверхэкспрессию.

Используемый в настоящем описании термин «гетерологичный белок» относится к белку или полипептиду, который в природе не встречается в клетке-хозяине. Примеры гетерологичных белков включают, но не ограничены, ферменты, такие как гидролазы, включая эстеразы, протеазы, гликозилазы; изомеразы, такие как рацемазы, эпимеразы, таутомеразы или мутазы; лиазы; лигазы; трансферазы, такие как киназы, трансаминазы и фосфотрансферазы; или оксидоредуктазы, такие как оксидазы и дегидрогеназы. Гетерологичный ген может кодировать терапевтические важные белки или пептиды, такие как ростовые факторы, цитокины, лиганды, рецепторы и ингибиторы, а также вакцины и антитела. Ген может кодировать коммерчески важные промышленные белки или пептиды, такие как эстеразы, протеазы, карбогидразы, такие как амилазы и глюкоамилазы, целлюлазы, оксидазы и липазы. Представляющий интерес ген может представлять собой природный ген, мутированный ген или синтетический ген.

Термин «гомологичный белок» относится к белку или полипептиду, нативному или встречающемуся в природе в клетке-хозяине. Изобретение включает гомологичные белки, которые представляют собой варианты, например, содержащие вставку, делецию или разрыв, по сравнению со встречающимся в природе гомологичным белком.

Термин «нуклеиновая кислота» и «полинуклеотид» используются взаимозаменяемо и охватывают молекулы РНК, ДНК и кДНК. Используемый в настоящем описании термин относится к полимерной форме нуклеотидов любой длины, или рибонуклеотидов или дезоксирибонуклеотидов. Термин относится только к первичной структуре молекулы и, поэтому, включает двух- и одноцепочечную ДНК и РНК. Он также включает известные типы модификаций, включающих, но не ограниченных, метки, известные в данной области, метилирование, «кэпирование», замену одного или несколько природных нуклеотидов аналогами; модификации внутри нуклеотидов, такие как, например, модификации нуклеотидов с незаряженными связями (например, метилфосфонаты, фосфотриэфиры, фосфоамидаты, карбаматы и т.д.) и с заряженными связями (например, фосфоротиоаты, фосфородитиоаты и т.д.), модификации, включающие дополнительные части, такие как, например, белки (включая, например, нуклеазы, токсины, антитела, сигнальные пептиды, поли-L-лизин и т.д.), модификации с интеркалирующими агентами (например, акридином, псораленом и т.д.), модификации, включающие хелаты (например, металлы, радиоактивные металлы, бор, окисляющие металлы и т.д.), модификации, включающие алкилирующие агенты, модификации с модифицированными связями (например, альфа аномерные нуклеиновые кислоты и т.д.), а также немодифицированные формы полинуклеотида. В общем, нуклеотидные сегменты по настоящему изобретению можно собирать из фрагментов генома и коротких олигонуклеотидных линкеров, или из ряда олигонуклеотидов, или из отдельных нуклеотидов, чтобы получить синтетическую нуклеиновую кислоту, способную экспрессироваться в рекомбинантной транскрипционной единице, включающей регуляторные элементы, полученные из микробного или вирусного оперона или эукариотического гена. Поскольку генетический код является вырожденным, одна конкретная аминокислота может кодироваться более чем одним кодоном, а настоящее изобретение охватывает все полинуклеотиды, которые кодируют конкретную аминокислотную последовательность.

То, что полинуклеотид или полипептид имеет некоторый процент (например, 65%, 70%, 75%, 80%, 85%, 90%, 95% или 99%) идентичности по последовательности с другой последовательностью, означает, что при выравнивании этот процент оснований или аминокислотных остатков одинаков при сравнении двух последовательностей. Это выравнивание можно провести и определить процент гомологии или идентичности, используя любое подходящее программное обеспечение, известное в данной области, например, описанное в Current Protocols in Molecular Biology (F. M. Ausubel et al. (eds) 1987, Supplement 30, section 7.7.18). В некоторых вариантах осуществления изобретения программы включают программу GCG Pileup, FASTA (Pearson et al. (1988) Proc. Natl, Acad. Sci USA 85:2444 2448) и BLAST (BLAST Manual, Altschul et al., Natl Cent. Biotechnol. Inf., Natl Lib. Med. (NCIB NLM NIH), Bethesda, Md., и Altschul et al., (1997) NAR 25:3389 3402). Другими примерами программ выравнивания являются ALIGN Plus (Scientific and Educational Software, PA), при этом предпочтительно использовать параметры по умолчанию, и TFASTA Data Searching Program, доступная в пакете программ Sequence Software Package Version 6.0 (Genetics Computer Group, University of Wisconsin, Madison, Wis.). Специалист в данной области поймет, что последовательности, охватываемые изобретением, включают последовательности, гибридизующиеся при жестких условиях с полинуклеотидами по изобретению.

«Гетерологичная» конструкция нуклеиновой кислоты или последовательность, также именуемая в настоящем описании как «химерный ген», содержит часть последовательности, которая не является нативной для клетки, в которой она экспрессируется. Определение «гетерологичная» в отношении регуляторной последовательности относится к регуляторной последовательности (например, промотору или энхансеру), которая в природе не участвует в регуляции этого гена, экспрессию которого в настоящей момент она регулирует. В общем, гетерологичные последовательности нуклеиновой кислоты не являются эндогенными для клетки или частью генома клетки, в которой они присутствуют, и они введены в клетку с помощью инфекции, трансфекции, микроинъекции, электропорации или аналогичного метода. «Гетерологичная» конструкция нуклеиновой кислоты может содержать комбинацию регуляторной последовательности и кодирующей последовательности ДНК, которые одинаковы с комбинацией регуляторной последовательности и кодирующей последовательности ДНК, присутствующих в нативной клетке, или отличаются от нее. Регуляторная последовательность, например, последовательность, регулирующая транскрипцию, обычно функционально связана с гетерологичной кодирующей белок последовательностью, или (в химерном гене селектируемого маркера) с геном селектируемого маркера, кодирующего белок, придающий трансформированным клеткам устойчивость к антибиотику. Типичные химерный ген или гетерологичная конструкция нуклеиновой кислоты по настоящему изобретению включают область регуляции транскрипции, последовательность, кодирующую сигнальный пептид, последовательность, кодирующую белок и терминаторную последовательность. Область регуляции транскрипции может быть конститутивной или индуцируемой.

Используемый в настоящем описании термин «вектор» относится к полинуклеотидной последовательности, разработанной для введения нуклеиновых кислот в один или несколько типов клеток. Векторы включают векторы для клонирования, векторы для экспрессии (экспрессионные), «челночные» векторы, плазмиды, кассеты и т.д.

Используемый в настоящем описании термин «экспрессионный вектор» относится к вектору, который способен включать и экспрессировать гетерологичный ДНК-фрагмент в чужеродной клетке. В продаже имеется множество векторов для экспрессии в прокариотах и эукариотах.

Используемые в настоящем описании термины «конструкция нуклеиновой кислоты» и «экспрессионный вектор» используются взаимозаменяемо для описания нуклеиновой кислоты, используемой для введения последовательности в клетку или организм-хозяина. Нуклеиновую кислоту можно получить in vitro с помощью ПЦР или любых других подходящих методик, известных специалистам в данной области. Конструкцию нуклеиновой кислоты или рекомбинантную экспрессионную кассету можно включить в плазмиду, хромосому, митохондриальную нуклеиновую кислоту, плазмидную нуклеиновую кислоту, вирус или фрагмент нуклеиновой кислоты. Обычно, часть рекомбинантной экспрессионной кассеты экспрессионного вектора или конструкции нуклеиновой кислоты включает, помимо других последовательностей, транскрибируемую последовательность нуклеиновой кислоты и промотор. В некоторых вариантах осуществления изобретения экспрессионные векторы обладают способностью включать и экспрессировать гетерологичные фрагменты нуклеиновой кислоты в клетке-хозяине. В продаже имеется множество прокариотических и эукариотических экспрессионных векторов. Выбор подходящих экспрессионных векторов входит в компетенцию специалистов в данной области.

Используемый в настоящем описании термин «плазмида» относится к кольцевой двухцепочечной (дц) ДНК-конструкции, используемой в качестве вектора для клонирования, и которая образует внехромосомный самореплицирующийся генетический элемент в многих бактериях и некоторых эукариотах.

Используемый в настоящем описании термин «промотор» относится к последовательности нуклеиновой кислоты, которая управляет транскрипцией гена. Промотор должен генетически соответствовать клетке-хозяину, в которой экспрессируется представляющий интерес ген. Промотор вместе с другими транскрипционными и трансляционными регуляторными последовательностями нуклеиновой кислоты (также называемыми «регуляторные последовательности») необходимы для экспрессии данного гена. В общем, транскрипционные и трансляционные регуляторные последовательности включают, но не ограничены, промоторные последовательности, сайты связывания рибосомы, последовательности начала и остановки транскрипции, последовательности начала и остановки трансляции, и энхансерные или активаторные последовательности.

Нуклеиновая кислота «функционально связана», когда она находится в функциональной взаимосвязи с другой последовательностью нуклеиновой кислоты. Например, нуклеиновая кислота, кодирующая секреторный лидер, функционально связана с нуклеиновой кислотой, кодирующей полипептид, если она экспрессируется в составе белка-предшественника, который участвует в секреции полипептида; промотор или энхансер являются функционально связаны с кодирующей последовательностью, если они влияют на транскрипцию последовательности; или сайт связывания рибосомы функционально связан с кодирующей последовательностью, если его местоположение способствует трансляции. В общем, «функционально связан» означает, что связанные последовательности нуклеиновой кислоты являются непрерывными, а в случае секреторного лидера, непрерывными и с сохранением рамки считывания. Однако энхансеры и промоторы не обязательно должны быть непрерывными. Связывание выполняется при лигировании по удобным сайтам рестрикции. Если такие сайты не существуют, то используют синтетические олигонуклеотидные адапторы или линкеры в соответствии с общепринятой практикой.

Первый полипептид, «связанный» со вторым полипептидом, обычно означает, что связанные полипептидные последовательности непрерывны и образуют слитый белок.

Используемый в настоящем описании термин «ген» относится к полинуклеотиду (например, ДНК-фрагменту), участвующему в продукции полипептидной цепи, он может включать или может не включать области, расположенные перед и после кодирующей области, например 5'-нетранслируемую (5'-UTR) или «лидерную» последовательности и 3'-UTR или «хвостовую» последовательности, а также промежуточные последовательности (интроны) между отдельными кодирущими фрагментами (экзонами).

Термин «рекомбинантная» («рекомбинантный») при использовании в отношении клетки, нуклеиновой кислоты, белка или вектора указывает, что клетка, нуклеиновая кислота, белок или вектор были модифицированы путем введения гетерологичной нуклеиновой кислоты или белка, или путем изменения нативной нуклеиновой кислоты или белка; или что клетка получена из клетки, модифицированной таким образом, что белок экспрессируется в ненативном или генетически модифицированном окружении, например, в экспрессионном векторе для прокариотической или эукариотической системы. Поэтому, например, рекомбинантные клетки экспрессируют нуклеиновые кислоты или полипептиды, которые не найдены в нативном (не рекомбинантном) состоянии клетки, или экспрессируют нативные гены, которые иным образом аномально экспрессируются, экспрессия которых снижена, повышена или отсутствует совсем.

Используемые в настоящем описании термины «трансформированная», «стабильно трансформированная» и «трансгенная» в отношении клетки означают, что в геном клетки включена ненативная (например, гетерологичная) последовательность нуклеиновой кислоты, или она существует в клетке в качестве эписомной плазмиды, сохраняющейся в клетке в течение многих поколений.

Используемый в настоящем описании термин «экспрессия» относится к процессу, посредством которого получается полипептид исходя из последовательности нуклеиновой кислоты гена. Процесс включает как транскрипцию, так и трансляцию.

Используемый в настоящем описании термин «функционально связанный» означает, что транскрипционная и трансляционная регуляторная нуклеиновая кислота расположена относительно кодирующей последовательности таким образом, что инициируется транскрипция. В общем, это будет означать, что промотор и последовательности инициации или старта транскрипции расположены в 5'-положении относительно кодирующей области. Транскрипционная и трансляционная регуляторная нуклеиновая кислота должна обычно соответствовать клетке-хозяину, используемой для экспрессии белка. В данной области известны много типов соответствующих экспрессионных векторов и подходящих регуляторных последовательностей для разных клеток-хозяев.

Термины «продукция» и «секреция» в отношении желаемого белка, например, ОРН, охватывают процессы, следующие за экспрессией и включают стадии процессинга: удаление сигнального пептида, которое, как известно, происходит в ходе секреции белка, и перенос представляющего интерес белка за пределы клетки-хозяина.

Термин «процессинг» или «процессированная» в отношении ОРН относятся к процессу созревания, в ходе которого полноразмерный белок, например, ОРН, становится активным зрелым ферментом.

Используемый в настоящем описании термин «под транскрипционным контролем» указывает, что транскрипция полинуклеотидной последовательности, обычно ДНК-последовательности, зависит от ее функциональной связи с элементом, принимающим участие в инициации транскрипции или обеспечивающим транскрипцию.

Используемый в настоящем описании термин «под трансляционным контролем» указывает на регуляторный процесс, происходящий после образования мРНК.

Используемый в настоящем описании термин «плазмида» относится к кольцевой двухцепочечной (дц) ДНК-конструкции, используемой в качестве вектора для клонирования, и которая образует внехромосомный самореплицирующийся генетический элемент в некоторых эукариотах или прокариотах, или встраивается в хромосому хозяина.

Термин «введенная» в контексте введения последовательности нуклеиновой кислоты в клетку означает «трансфекцию» или «трансформацию» или «трансдукцию» и относится к включению последовательности нуклеиновой кислоты в эукариотическую или прокариотическую клетку, в которых последовательность нуклеиновой кислоты может быть встроена в геном клетки (например, хромосому, плазмиду, ДНК пластид или митохондрий), превращена в автономный репликон или может экспрессироваться транзиентно (например, трансфецированная мРНК).

Используемые в настоящем описании термины «полученные», «выделенные» и «разделенные» относятся к соединению, белку, клетке, нуклеиновой кислоте или аминокислоте, которые удалены от, по меньшей мере, одного компонента, с которым они ассоциированы в природе.

Используемый в настоящем описании термин «активность» или «биологическая активность» относится к активности, ассоциированной с конкретным белком, например, ферментативной активности. Биологическая активность относится к любой активности, которая в норме может относиться к этому белку по мнению специалиста в данной области.

Используемый в настоящем описании термин «удельная активность» обозначает единицу фермента, определенную как число молей субстрата, превращенных в продукт препаратом фермента за единицу времени при определенных условиях. Удельную активность обычно выражают в единицах (Ед)/мг белка.

Термин «полученный» охватывает термины «происходит из», «полученный», «получаемый из» и «выделенный из».

Термины «клетка-хозяин» или «штамм-хозяин» обозначают клетку, которая содержит вектор и поддерживает репликацию и/или транскрипцию, или транскрипцию и трансляцию (экспрессию) экспрессионной конструкции. В некоторых вариантах осуществления изобретения, клетки-хозяева или штаммы-хозяева являются прокариотическими, например, бактериальными клетками, включающими, но не ограниченными клетки Streptomyces.

Термин «вариант» относится к области нуклеиновой кислоты или белка, которая содержит один или несколько отличающихся, дополнительных или отсутствующих нуклеотидов или аминокислот по сравнению с исходными нуклеиновой кислотой или белком, например, природными или дикого типа нуклеиновой кислотой или белком. Предполагается, что вариантный белок сохраняет функцию исходного белка, т.е. вариантный белок представляет собой активный вариант исходного белка. В некоторых вариантах осуществления изобретения способность вариантного белка выполнять такую функцию равна или выше способности исходного белка.

Используемый в настоящем описании термин «род Streptomyces» включает все виды рода Streptomyces, известные специалистам в данной области, включающие, но не ограниченные, S. achromogenes, S. albicans, S. albogriseolus, S. ambofaciens, S. avermitilis, S. carbophilus, S. clavuligerus, S. coelicolor, S. felleus, S. ferralitis, S. filamentosus, S. griseus, S. Helvaticus, S. hygroscopicus, S. lysosuperficus, S. lividans, S. noursei, S. plicatosporus, S. rubiginosus, S. scabies, S. somaliensis, S. thermoviolaceus и S. violaceoruber.

Идея настоящего изобретения основана на открытии, что некоторые белк