Способ модификации фрагмента днк, кодирующего инсектицидный белок bacillus thuringiensis, фрагмент днк, кодирующий инсектицидный белок bacillus thuringiensis (варианты), фрагмент днк, содержащий структурный ген, кодирующий инсектицидный белок (варианты), и фрагмент днк, содержащий структурный ген, кодирующий слитый белок

Реферат

 

Область использования: биотехнология, в частности, генная инженерия. Сущность изобретения: способ модификации фрагмента ДНК, кодирующего инсектицидный белок Bacillus thuringiensis, варианты фрагментов ДНК, кодирующих инсектицидный белок Bacillus thuringiensis, варианты фрагмента ДНК, содержащего структурный ген, кодирующий инсектицидный белок, и фрагмент ДНК, содержащий структурный ген, кодирующий слитый белок, включающий 610 N-терминальных аминокислот, полученных из Bacillus thuringiensis kurstaki HP-1, и 567 С-терминальных аминокислот белка токсина, полученного из Bac. thuringiesis kurstaki HD-73. 12 с. и 1 з.п.ф-лы, 15 табл., 44 ил.

Изобретение относится к генетической инженерии и, в частности, к трансформации растений, при которой растение трансформируют чужеродной ДНК для экспрессии гетерологичного гена.

Хотя в последние годы достигнут значительный прогресс в получении трансгенных растений, экспрессирующих чужеродные белки, такие как ферменты устойчивости к гербицидам и белки оболочки вирусов, очень мало известно об основных факторах, воздействующих на эту экспрессию. Выявлено несколько потенциальных факторов, оказывающих влияние на уровень экспрессии белка, кодируемого чужеродным геном. При этом количество мРНК в клетке, несомненно, критический фактор.

Известно много потенциальных причин, которые обуславливают низкий уровень мРНК. Во-первых, синтез полноразмерной РНК может не идти с высокой частотой. Это могло быть обусловлено, например, преждевременной терминацией РНК или ее неожиданным процессингом во время транскрипции. Во-вторых, полноразмерная РНК может продуцироваться, но затем она процессируется [сплайсинг, присоединение поли(A)] в ядре так, что образуется нефункционирующая мРНК. Если РНК правильно синтезирована, терминирована и полиаденилирована, то тогда она транслируется в цитоплазме. В цитоплазме мРНК имеют определенное время жизни, которое детерминируется их последовательностями и клеточным типом, в котором они экспрессируются. Некоторые РНК очень короткоживущие, а некоторые гораздо более долгоживущие. В дополнение, имеется эффект, важность которого неопределена, это - трансляционная эффективность. Кроме того, каждая молекула РНК складывается в определенную структуру или, возможно, семейство структур, которые детерминируются ее последовательностью. Следовательно, последовательность любой РНК может обеспечивать большую или меньшую ее стабильность в цитоплазме. Структура мРНК также определяется процессингом в ядре. К сожалению, невозможно предсказать и почти невозможно определить структуру любой РНК (за исключением тРНК) in vitro или in vivo. Однако похоже, что изменение последовательности РНК сказывается на принимаемой ею структуре. При этом структура или отдельные структурные черты мРНК определяют ее стабильность.

В РНК идентифицировано несколько отдельных последовательностей или сигналов, которые могут оказывать специфический эффект на ее стабильность. Эти идентифицированные последовательности часто A+T богатые, и таким образом, более вероятно, что встречаются в A+T кодирующей последовательности, такой как B.t ген. Последовательность АТТТА (или АУУУА в РНК) является дестабилизирующей последовательностью в мРНК клеток млекопитающих (Shaw G. and Kamen R. , Cell, 1989, 46:659-667). Работ, относящихся к функционированию такой последовательности в растениях, не проводилось. Многие короткоживущие мРНК имеют A+T богатые 3' нетранслируемые районы, и эти районы часто имеют ATTTA последовательность, иногда присутствующую во многих копиях или как мультимеры (то есть, АТТТАТТТА...). Показано, что перенос 3'конца нестабильной мРНК к стабильной РНК (глобина или VA1) значительно уменьшает время полужизни этой РНК (Shaw G. and Kamen R., 1986). В дальнейшем было показано, что пентамер АТТТА оказывает дестабилизирующий эффект на стабильный предшественник. Причем этот сигнал может оказывать свои эффекты в зависимости от его расположения на 3' конце или внутри кодирующей последовательности. Однако положение последовательностей АТТТА и/или последовательностей, по соседству с которыми они оказываются, так важно для определения, функционируют ли они как дестабилизирующие последовательности. Показано также, что тример АТТТА оказывал гораздо меньший эффект на стабильность мРНК, чем пентамер, а димер или мономер не влиял на ее стабильность (Shaw G. and Kamen R., 1987, RNA Processing, Cold Spring Harbor Laboratory, p.220). Заметьте, что мультимеры АТТТА, такие как пентамер, автоматически образуют A+T богатый район. Это, как было показано, оказывает цитоплазматический, а не ядерный эффект. У других нестабильных мРНК последовательность АТТТА может присутствовать только в одной копии, но часто содержится в A+T богатом районе. Из данных по клеткам животных, собранных к настоящему времени, оказывается, что АТТТА в некоторых окружениях благотворна для стабильности, но еще невозможно предсказать, в каких положениях АТТТА являются дестабилизирующими элементами.

Некоторые исследования по деградации мРНК в животных клетках также указывают, что деградация РНК в некоторых случаях может начаться с нуклеотической атаки на A+T богатые районы. Однако не ясно, происходит ли при этом разрезание в АТТТА последовательностях. Существуют также примеры мРНК, которые имеют различную стабильность, зависящую от типа клетки, в которых они экспрессируются, или от стадии клеточного цикла, на которой они экспрессируются. Например, гистоновые мРНК стабильны во время синтеза ДНК, но нестабильны, если синтез ДНК прекращен. Считается, что за этот эффект ответственен 3'конец некоторых гистоновых мРНК (Pandey N.B. and Marzluff W.F., 1987, RNA Processing, Cold Spring Harbor Laboratory, p.133). Однако все еще остается неясным, что контролирует разную стабильность этой мРНК. Другой пример дифференциальной стабильности мРНК - Igb в B-лимфоцитах во время созревания B клеток (Genovese C. and Milcarek C., 1988, RNA Processing, Cold Spring Harbor Laboratory, p.62). Последний пример - нестабильность мутантной бета-талласемийной глобиновой мРНК. В клетках костного мозга, где этот ген нормально экспрессируется, мутантная мРНК нестабильна, в то время как мРНК дикого типа стабильна. Когда мутантный ген экспрессируют в Hela или L клетках in vitro, мутантная мРНК не показывает нестабильности. Это подтверждает тот факт, что стабильность мРНК может определяться типом клетки или фактором, специфичным для клеточного цикла. Более того, этот тип нестабильности пока не ассоциирован со специфическими последовательностями. Учитывая это, зачастую невозможно предсказать, какие РНК нестабильны в данной клетке. Даже АТТТА последовательность может действовать различно в зависимости от природы клетки, в которой присутствует данная РНК (Shaw G. and Kamen R., 1987). Сообщается, например, что активация протеинкиназы C может блокировать деградацию, опосредованную АТТТА (Shaw G.and Kamen R., 1987).

Добавление участка полиаденилирования к 3' концу - общая черта большинства эукариотических мРНК как растений, так и животных. В результате добавления полиA транскрипт имеет большую протяженность 3' конца, чем зрелый белок. Внутри этого транскрипта находятся сигналы полиаденилирования и образования правильного 3' конца. Этот процессинг на 3' конце включает расщепление мРНК и добавление полиA к зрелому 3' концу. Поиск последовательностей, расположенных рядом с полиA сигналом, как в растительных, так и в животных мРНК возможно позволит идентифицировать последовательности, которые кодируют добавление полиA и расщепление 3' конца. Как правило, эти сигналы являются вариацией последовательности ААТААА. В клетках животных было идентифицировано несколько вариантов этой последовательности, которые являлись функциональными. В растительных клетках, по-видимому, существует большее количество функциональных последовательностей (Wickens M. and Stephenson P., Science, 1984, v. 226, p.1045; Dean C. et al., Nucleic Acids Research, 1986, v.14, N 5, p. 2229). Поскольку все эти последовательности вариации ААТААА, они все А+Т богатые. Эта последовательность обычно находится за 15-20 пн до полиA участка в зрелой мРНК. Эксперименты на животных клетках показывают, что эта последовательность участвует как в полиаденилировании, так и в 3' созревании. Сайт - направленными мутациями в этой последовательности можно нарушить эти функции (Conway L. and Wickens M., 1988, RNA Processing, Cold Spring Harbor Laboratory, p.40; Wickens M. et al., 1987, RNA Processing, Cold Spring Harbor Laboratory, p.9). Однако также наблюдали, что последовательности за 50-100 пн после 3' полиА сигнала также необходимы. Так, например, ген, который имеет нормальный ААТААА, но был перемещен или прерван ниже, не был правильно полиаденилирован (Gil A. and Proudfoot N.J., Nature, 1984, v.312, p.473; Sadofsky M. and Alwine J.C., Molecular and Cellular Biology, 1984, v. 4, N 8, pp.1460-1468; McDevitt M.A. et ai., Cell, 1984, v.37, pp.993-999).

То есть, сам по себе сигнал полиА не существенен для полного и правильного процессинга. Неизвестно, какие специфичные, лежащие по ходу транскрипции последовательности требуются в дополнение к сигналу полиА, или существует ли специфичная последовательность, которой присуща эта функция. Следовательно, анализ последовательности позволяет только обнаружить потенциальные полиА сигналы.

В природных, нормальных полиаденилированных мРНК наблюдали, что при нарушении этого процесса посредством изменения сигнала полиА либо других последовательностей в этой мРНК получают значительные эффекты на уровне функциональной мРНК. Это наблюдали в случае нескольких природных мРНК. Однако не существует общих правил, которые можно было бы вывести из изучения мутантов этих природных генов, и нет правил, которые можно было бы приложить к гетерологичным генам. Ниже приводятся четыре примера.

1. В глобиновом гене отсутствие правильного сайта полиА ведет к неправильной терминации транскрипции. По-видимому (хотя и не доказано), неправильно терминированная РНК нефункциональна и нестабильна (Proudfoot N.J. et al., 1987, RNA Processig, Cold Spring Harbor Laboratory, p.17).

2. В глобиновом гене отсутствие функционального сигнала полиА может приводить к 100-кратному уменьшению уровня накопления мРНК (Proudfoot N.J.et al., 1987).

3. Сайт полиА глобинового гена перемещали в 3' концы двух различных гистоновых генов. Гистоновые гены около их 3' конца имеют вторичную структуру (стебель-петля). Количество правильно полиаденилированной гистоновой мРНК, продуцируемой с этих химер, уменьшалось при увеличении дистанции между стеблем-петлей и сайтом полиА. Кроме того, два гистоновых гена продуцировали значительно различающиеся уровни правильно полиаденилированных мРНК. Это предполагает взаимодействие между сайтом полиА и другими последовательностями на мРНК, которые модулируют накопление мРНК (Pandey N.B. and Marzluff W.F., 1987).

4. Ген леггемоглобина сои клонировали в клетках Hela. Было показано, что этот растительный ген содержит "загадочный" сигнал полиаденилирования, который активен в животных клетках, но не утилизируется в растительных. Это обеспечивает продукцию новой полиаденилированной мРНК, которая нефункциональна. Следовательно, анализ гена в клетках одного типа не может предсказать его поведение в альтернативных клеточных типах (Wiebauer K. et al., Molecular and Cellular Biology, 1988, v.8, N 5, pp.2042-2051).

Из этих примеров ясно, что в природных мРНК правильное полиаденилирование важно для накопления мРНК и что нарушение этого процесса может воздействовать на уровень мРНК. Однако имеется еще недостаточно знаний, чтобы предсказать эффект изменений в нормальном гене. В гетерологичном гене, у которого мы не знаем, функциональны ли имеющиеся полиА сайты (последовательности консенсуса), еще труднее предсказать последствия. Существует такая возможность, что имеющиеся сайты, которые идентифицированы, нефункциональны. То есть, эти сайты могут не действовать как правильные сайты полиА, а вместо этого функционировать как аберрантные сайты, которые дают увеличение нестабильных мРНК.

В системах животных клеток общий сигнал ААТААА гораздо чаще обнаруживается в мРНК выше полиА сигнала (Wickens M. and Stephenson P., 1984).

В растениях не было осуществлено такого обширного анализа, но ясно то, что могут использоваться множественные последовательности, подобные ААТААА. Сайты полиаденилирования растений, названные минорными или мажорными, были изучены на трех типах растительных генов (Dean C. et al., 1986). Обозначение сайтов как мажорного или минорного относится к частоте встречаемости функционирующих сайтов в анализируемых природных генах. Трудно с определенностью предсказать, какой сайт мажорный или минорный с большей или меньшей вероятностью, частично или полностью функционирует, находясь в гетерологичном гене, таком как B.t (см. табл.1).

Другой тип процессинга РНК, который происходит в ядре, это сплайсинг интронов. Почти вся работа по сплайсингу интронов сделана на животных клетках, но некоторые данные появились при исследовании растений. Процессинг интрона зависит от правильных 5' и 3' границ сплайсинга. Последовательности консенсуса для этих границ получены как для животных, так и для растительных мРНК, но только несколько нуклеотидов, как известно, инвариантны. Следовательно, трудно предсказать с какой-либо определенностью, является ли имеющаяся граница сплайсинга функциональной или частично функциональной, основываясь исключительно на анализе последовательности. В частности, инвариантными нуклеотидами являются только ГТ на 5' конце интрона и АГ на 3' конце интрона. У растений все четыре нуклеотида можно обнаружить либо внутри интрона, либо в экзоне, фланкирующем этот интрон (Brown John W., Nucleic Acids Research, 1986, v. 14, N 24, p.9549; Hanley B.A. and Schuler M.A., Nucleic Acids Research, 1988, v.16, N 14, p.7159).

Растительный интрон из гена пататина перемещали в ген GUS. Чтобы проделать это, проводили сайт-специфический мутагенез, чтобы ввести новые сайты рестрикции. Этот мутагенез изменял несколько нуклеотидов в интроне и последовательности экзона, фланкированных ГТ и АГ. Однако этот интрон еще функционировал правильно, указывая на важность ГТ и АГ и возможность замены в других нуклеотидных положениях. Имеется целый ряд случаев, когда ГТ и АГ в генах не функционируют как границы сплайсинга интрона, поэтому должна существовать некоторая другая последовательность или структурная черта, которая обозначает границы сплайсинга. При анализе растительных интронов и экзонов обнаружили, что экзоны имеют приблизительно 50% А+Т, в то время как интроны имеют приблизительно 70% А+Т (Wiebauer K. et al., 1988; Goodall G. et al., 1988, RNA Processing, Cold Spring Harbor Laboratory, p.63). Создан также искусственный растительный интрон, который имеет 5' и 3'консенсус границ сплайсинга и случайно А+Т богатую внутреннюю последовательность (Goodall G. et al. , 1988). Этот интрон сплайсировался в растениях правильно. Когда внутренний сегмент был замечен Г+Ц богатой последовательностью, эффективность сплайсинга очень значительно снизилась. Эти два примера демонстрируют, что узнавание интрона в растениях может зависеть от границ сплайсинга, которые имеют большое количество разнообразных последовательностей и наличие большого количества А+Т в самом интроне. Следовательно, довольно трудно предсказать на основании одной последовательности, функционирует ли эта отдельно взятая последовательность как активная для процессинга РНК или активным является отдельно взятый интрон.

Гены B.t., будучи А + Т богатыми, содержат многочисленные участки различной длины, которые имеют 70% или более А + Т. Количество таких участков, обнаруженных анализом последовательности, зависит от длины последовательности сканирования.

Следовательно, трудно предсказать, какие последовательности используются как сайты сплайсинга в любом данном гене. Многие, являющиеся природными гены имеют альтернативные пути сплайсинга, которые образуют альтернативные комбинации экзонов с конечной мРНК (Galltgo M.E. and Nadal-Ginard B., 1988, RNA Processing, Cold Spring Harbor Laboratory, p.61; Helfman D.M. and Ricci W.M. , 1988, RNA Processing, Cold Spring Harbor Laboratory, p. 219; Tsurushita N. and Korn L.J., 1987, RNA Processing, Cold Spring Harbor Laboratory, p. 215). То есть, некоторые границы сплайсинга, по-видимому, узнаются в одних обстоятельствах или в некоторых типах клеток, но не в других. Закономерности этого непонятны. В дополнение может существовать взаимодействие между путями процессинга, так что использование определенного сайта полиаденилирования может мешать сплайсингу в близлежащем сайте сплайсинга и наоборот (Adami G. and Nevins J., 1988, RNA Processing, Cold Spring Harbor Laboratory, p. 26; Brady H. and Wold W., 1988, RNA Processing, Cold Spring Harbor Laboratory, p. 224; Marzluff W. and Pandey N., 1988, RNA Processing, Cold Spring Harbor Laboratory, p. 244). Например, в гене гормона роста быка небольшие делеции в экзоне (несколько сот нуклеотидов ниже интрона) вызывают падение эффективности сплайсинга с более чем на 95% до менее чем 2%. Другие делеции, однако, не оказывают существенного эффекта (Hampson R.K. and Roottman F.M., 1988, RNA Processing, Cold Spring Harbor Laboratory, p. 68). В заключение, разнообразие экспериментов in vitro и in vivo показывает, что мутации, которые нарушают нормальный сплайсинг, ведут к быстрой деградации РНК в ядре. Сплайсинг в многоступенчатом процессе в ядре и мутации, не затрагивающие сплайсинг, могут приводить к блокировкам в процессе на целом ряде стадий. Любая из этих блокировок может затем вести к аномальной и нестабильной РНК. Изучение мутантов с нормально процессирующимися генами (полиаденилирование и сплайсинг) относится к изучению гетерологических генов, таких как гены B.t. Гены B. t. , возможно, содержат функциональные сигналы, которые приводят к образованию аберрантных нефункциональных мРНК, и эти мРНК, вероятно, нестабильны. Но гены B.t., возможно, содержат сигналы, которые аналогичны мутантным сигналам в природном гене. Как показано выше, эти мутантные сигналы, очень вероятно, вызывают дефекты в путях процессинга, что является следствием образования нестабильных мРНК.

С достаточной степенью определенности еще не известно, каковы сигналы терминации транскрипции РНК в растительных и животных клетках. Некоторые исследования генов животных указывают, что участки последовательности, богатой Т, вызывают терминацию РНК полимеразы II из тимуса теленка in vitro. Эти исследования показали, что 3' концы терминированных in vitro транскриптов часто лежат внутри блоков Т таких, как Т5, Т6 или Т7. Однако другие выявленные сайты терминации не состояли исключительно из Т, а имели один или более других нуклеотидов. Терминация, как было найдено, происходит внутри последовательностей ТАТТТТТТ, АТТЦТТ, ТТЦТТ (Dedrick R. et al., The Journal of Biological Chemistry, 1987, v.262, N19, pp. 909-1106; Reines D. et al., J. Mol. Biol., 1987, 196, pp. 299-312). В случае двух последних последовательность вдобавок является Ц + Т богатой. Другие исследования показывают, что потенциальные терминаторы транскрипции являются районами, богатыми А. Интересный пример по SV 40 иллюстрирует неопределенность определения терминаторов, основанного только на последовательности. Один из потенциальных терминаторов SV 40 был А богатым и содержал 5' район двойной симметрии (потенциальная петля-стебель) по отношению к А богатому участку. Однако второй терминатор, обнаруженный экспериментально ниже в том же гене, не был А богатым и не включал никакой потенциальной вторичной структуры (Kessler M. et al., 1988, RNA Processing, Cold Spring Harbor Laboratory, p.86). Гены B.t содержат участки, обогащенные А или Т, которые, по-видимому, могли бы действовать как терминаторы. С помощью описанного выше примера с глобиновым геном показана важность терминации для стабильности данной мРНК. Отсутствие нормального сайта полиА ведет к нарушению правильной терминации с последующим уменьшением количества мРНК.

Выявлено влияние на стабильность мРНК, которое обусловлено трансляцией мРНК. Преждевременная терминация трансляции в триозофосфатизомеразе человека приводит к нестабильности этой мРНК (Daar I.O. et al., 1988, RNA Processing, Cold Spring Harbor Laboratory, p. 45). Другой пример (описанный выше) - глобиновая мРНК при бета-талассемии, которая специфически нестабильна в клетках костного мозга. Дефект в этом мутантном гене представляет собой делецию одной пары оснований в кодоне 44, что приводит к терминации трансляции (нонсенс кодон) в кодоне 60. По сравнению с правильно терминируемой нормальной глобиновой мРНК эта мутантная РНК очень нестабильна. Эти результаты показывают, что неправильно транслированная мРНК нестабильна. Другая работа на дрожжах показывает, что правильная, но слабая трансляция также может оказывать влияние на уровень мРНК. Гетерологичный ген модифицировали путем замены определенных кодонов на более предпочтительные в дрожжах кодонов. Наблюдали 10-кратное суммарное увеличение продукции белков, при этом было приблизительно 3-кратное снижение количества мРНК (Hoekema A. et al., Molecular and Cellular Biology, 1987, v.7, pp. 2914-2924). Это указывает на то, что более эффективная трансляция обеспечивает большую стабильность мРНК. Эффективное использование кодонов может происходить как на уровне РНК, так и на трансляционном уровне. Из изучения эффективности использования кодонов неясно, какие кодоны обеспечивают ослабление трансляции или как это соотносится со стабильностью мРНК.

Таким образом, техническим результатом изобретения является разработка способа получения синтетических растительных генов, которые экспрессируют соответствующие им белки на относительно высоких уровнях по сравнению с генами дикого типа и, в частности, получение синтетических растительных генов, которые экспрессируют кристаллический белковый токсин Bacillus thuringiensis на относительно высоких уровнях.

Фиг. 1 иллюстрирует стадии, использованные для модификации гена дикого типа с целью увеличения эффективности его экспрессии в растениях.

Фиг. 2-4 иллюстрируют сравнение модифицированной B.t.k. HD-1 последовательности по примеру 1 (нижняя линия) с последовательностью B.t.k.HD-1 дикого типа, которая кодирует кристаллический белковый токсин (верхняя линия).

Фиг. 5-7 иллюстрируют сравнение последовательности синтетического B.t.k. HD-1 по примеру 2 (нижняя линия) с последовательностью B.t.k. HD-1 дикого типа, которая кодирует кристаллический белковый токсин (верхняя линия).

Фиг 8-10 иллюстрируют сравнение последовательности синтетического B.t.k. HD-73 по примеру 3 (нижняя линия) с последовательностью B.t.k. HD-73 дикого типа (верхняя линия).

Фиг. 11 представляет физическую карту плазмиды интермедиата трансформации растений векторной кассетой pMON 893.

Фиг. 12 представляет физическую карту плазмиды интермедиата трансформации растений векторной кассетой pMON 900.

Фиг. 13 представляет карту для лишенной концов Т-ДНК А. tumefaciens АСО.

Фиг. 14-16 иллюстрируют сравнение синтетического усеченного гена B.t.k. HD-73 (аминокислоты 29-615 c N-концевым Met-Ala) по примеру 3 (нижняя линия) по сравнению с последовательностью B.t.k. HD-73 дикого типа (верхняя строчка).

Фиг. 17-21 иллюстрируют сравнение последовательности полноразмерного синтетического гена дикого типа B.t.k. HD-73 (нижняя линия) по примеру 3 с последовательностью полноразмерного B.t.k. HD-73 дикого типа (верхняя строчка).

Фиг. 22-26 иллюстрируют сравнение полностью синтетической полноразмерной последовательности B. t. k. HD-73 по примеру 3 (нижняя строчка) с полноразмерной последовательностью дикого типа B.t.k. HD-73 (верхняя строчка).

Фиг. 27-31 иллюстрируют сравнение полностью синтетической полноразмерной последовательности B. t. k. HD-73 по примеру 3 (нижняя строчка) с полноразмерной последовательностью дикого типа B.t.k. HD-73 (верхняя строчка).

Фиг. 32-34 иллюстрируют сравнение синтетической B.t.t. последовательности по примеру 5 (нижняя строчка) с последовательностью B.t.t. дикого типа, которая кодирует кристаллический белковый токсин (верхняя строчка).

Фиг. 35-37 иллюстрируют сравнение синтетической последовательности B.t. Р2 по примеру 6 (нижняя линия) с последовательностью дикого типа B.t.k. HD-1, которая кодирует белковый токсин (верхняя строчка).

Фиг. 38-42 иллюстрируют сравнение синтетической последовательности B.t. entomocidus по примеру 7 (нижняя строчка) с последовательностью дикого типа B.t. entomocidus, которая кодирует белковый токсин Бтента (верхняя линия).

Фиг. 43 иллюстрирует физическую карту растительного экспрессионного кассетного вектора pMON 744.

Фиг. 44 иллюстрирует сравнение последовательности белка оболочки (синтетической) roll-вируса листьев картофеля PLRV по примеру 9 (нижняя строчка) с последовательностью белка оболочки дикого типа PLRV (верхняя строчка).

Настоящее изобретение раскрывает способ получения синтетических растительных генов, которые экспрессируют белковый продукт на уровнях значительно выше, чем гены дикого типа, которые обычно использовали для трансформации до сих пор. Кроме того, в настоящем изобретении также описаны новые синтетические растительные гены, которые кодируют нерастительные белки.

В частности, в материалах заявки раскрыто получение синтетических растительных генов, которые кодируют кристаллический белковый токсин Bacillus thiringiensis (B.t.). Подходящие подвиды B.t. включают, но не ограничиваются только B. t. kurstaki HD-1, B.t. kurstaki HD-73, B.t. sotto, B.t. berliner, B.t. thuringiensis, B.t. tolworthi, B.t. dendrolimus, B.t. alesti, B.t. galleriae, B.t. aizawai, B.t. subtoxicus, B.t. entomocidus, B.t. tenebrionis и B.t. san diego.

Однако следует особо подчеркнуть, что настоящий метод может использоваться для получения синтетических растительных генов, которые кодируют нерастительные белки, другие, чем кристаллический белковый токсин B.t., так же, как и растительные белки (см. для примера пример 9).

Экспрессия генов B.t в растениях проблематична. Об экспрессии генов B.t. в растениях с уровнями, обладающими инсектицидным действием, сообщалось ранее. В частности, экспрессия полноразмерного специфического гена липидоптерана B.t. (ДНК выделена из B.t.k.) оказалась неуспешной для достижения уровней экспрессии, обладающих инсектицидной активностью, в некоторых видах растений (Vaeck M. et al., Nature, 1987, v.328, p.33; Barton K.A. et al., Plant Physiol., 1987, 85, 1103-1109).

Сообщалось, что экспрессию полноразмерного гена из B.t.r.HD-1 детектировали в томатах, но что усеченные гены приводили к более высокой частоте растений с более высоким общим уровнем экспрессии, обладающим инсектицидным действием. Усеченные гены B.t. berliner также обеспечивали получение большего количества растений табака, обладающих инсектицидной активностью (Vaeck M. et al., 1987). С другой стороны, растения салата, которые развивались из трансформантов с полноразмерным геном, обладали инсектицидной активностью.

Также сообщалось, что полноразмерный ген из B.t.k. HD -73 обеспечивал инсектицидный эффект в табаке (Adang et al., Molecular Strategies for Crop Protection, 1987, pp. 345-353). Однако мРНК B.t., обнаруженная в этих растениях, имела размер 1,7 тпн по сравнению с ожидаемой 3,7 тпн, указывая на неправильную экспрессию гена. Полагают, что эта усеченная мРНК слишком коротка, чтобы кодировать функционально активный усеченный токсин. По-видимому, на низком уровне в некоторых растениях должна существовать более длинная мРНК или же не должно было наблюдаться инсектицидной активности. Другие авторы сообщали, что они наблюдали значительное количество мРНК, длина которых короче ожидаемой (усеченный B.t.k. ген), но некоторые мРНК имели ожидаемую длину. Действительно полагают, что возможна экспрессия полноразмерного гена токсина в каллюсе табака (Barton K.A. et al., 1987). Вышесказанное иллюстрирует, что гены типа липидоптерана B.t. слабо экспрессируются в растениях по сравнению с другими химерными генами, экспрессируемыми с тех же кассетных промоторов.

Экспрессия B.t.t. в томатах и картофеле происходит на уровнях, подобных B. t.k. (то есть, бедных). B.t.t. и B.t.k. гены имеют ограниченную гомологию последовательности, но у них много общих черт (в частности, нуклеотидный состав и наличие специфических А+Т богатых элементов).

Итак, все сообщения в этой области отмечали наличие ожидаемой экспрессии генов B. t. в растениях. В целом, инсектицидная эффективность измерялась с помощью насекомых, очень чувствительных к B.t. токсину, таких как табачная бабочка-бражник. Хотя удавалось получить растения, полностью защищенные от табачной бабочки-бражника, важно заметить, что бабочка-бражник является в 500 раз более чувствительной к токсину B.t., чем некоторые агрономически важные насекомые-вредители, такие как совка-карадрина. Следовательно, необходимо получать трансгенные растения, которые защищены от всех важных липидоптерных вредителей (или от колорадского жука в случае B.t. tenebrionis) с безопасным уровнем экспрессии B.t. сверх эффективного защитного уровня. Важно создать растительные гены, которые воспроизводимо функционируют в разных видах растений, чтобы можно было предсказать получение устойчивых к насекомым растений.

Для того, чтобы достигнуть этих целей, необходимо понимать природу более низкой экспрессии, чем ожидаемая, генов B.t. в растениях. Уровень стабильной мРНК B.t. в растениях гораздо ниже ожидаемого. То есть, по сравнению с другими кодирующими последовательностями, направляемыми тем же промотором, уровень м РНК B.t., измеренный норзерн-анализом или анализом с защитной от нуклеаз, гораздо ниже. Например, растение томата 337 (Fischhoff D.A. et al., Biotechnology, 1987, v. 5, p. 807) было отобрано как растение, лучше всех экспрессирующее ген B.t. из плазмиды pMON 9711, содержащий Kpn1 фрагмент B. t. k. HD-1, читаемый с CaMV 35S промотора и селектируемый маркерный ген NOS-NPTII-NOS. В этом растении уровень мРНК B.t. примерно в 100 и 1000 раз ниже, чем уровень мРНК NPTII, хотя CaMV 35S промотор приблизительно в 50 раз сильнее, чем NOS промотор (Sanders P.R. et al., Nucleic Acids Research, 1987, v. 15, N 4, p. 1543).

Уровень белкового токсина B.t., обнаруженный в растениях, при этом согласуется с низким уровнем мРНК B.t. Более того, инсектицидная эффективность трансгенных растений коррелирует с содержанием белка B.t., подтверждая тот факт, что белок токсина, продуцируемый в растениях, биологически активен. Следовательно, низкий уровень экспрессии токсинов B.t. является результатом низких уровней мРНК B.t.

Количество матричной РНК определяется скоростью синтеза и скоростью деградации. Имеется баланс между этими двумя величинами, который определяет устойчивый постоянный уровень мРНК. При использовании промотора GMV 35S скорость синтеза является максимальной. Использование других растительных промоторов, таких как промотор нопалинсинтазы (NOS), маннопинсинтазы (MAS) и рибулозобифосфаткарбоксилазы малой субъединицы (RUBISSO), не меняли уровень экспрессии белкового токсина B.t., указывая тем самым, что эффекты, определяющие уровень экспрессии белкового токсина B.t., не зависят от промотора. Эти данные подразумевают, что последовательности ДНК генов, кодирующих белковые токсины B.t., каким-то образом ответственны за уровень низкой экспрессии и что этот эффект проявляется в низком уровне аккумулируемой стабильной мРНК.

Ниже ожидаемых уровни мРНК наблюдали в случае четырех различных специфических генов лепидоптерана (два из B.t.k. HD-1, B.t. berliner и B.t.k. HD-13), также как и в случае использования специфичного для жуков гена B.t. tenebrionis. По-видимому, в генах B. t. лепидоптерного типа эти влияния проявляются более сильно в полноразмерных кодирующих последовательностях, чем в усеченных кодирующих последовательностях. Эти эффекты наблюдаются у всех растительных видов, хотя их значение кажется большим в некоторых растительных видах, таких как табак.

Природа кодирующих последовательностей генов B.t. отличается от растительных генов. В частности, гены B.t. очень богаты (приблизительно 62%) аденином (А) и тимином (Т), в то время как растительные гены и большинство бактериальных генов, которые экспрессированы в растениях, имеют порядка 45-55% А+Т. Содержание А+Т в геноме (таким образом и в гене) любого организма - отличительная черта этого организма и отражает его эволюционную историю. В то время как гены одного организма имеют сходный А+Т состав, этот состав может сильно варьировать от организма к организму. Например, некоторые виды Bacillus имеют более А+Т богатые гены, в то время как некоторые виды Streptomyces имеют менее А+Т богатые геномы (от 30 до 35% А+Т).

Из-за "избытка" А+Т в структурных кодирующих последовательностях, обусловленного вырожденностью генетического кода и ограниченным числом кодонов, выбранных для аминокислоты, некоторые из видов Bacillus находятся в третьей позиции кодонов. То есть, гены некоторых видов Bacillus имеют А или Т как третий нуклеотид во многих кодонах. Таким образом, А + Т состав частично может предопределять предпочтительное использование кодонов. Ясно, что эволюция гена направлена на максимальное их функционирование в организме. Это означает, что отдельные нуклеотидные последовательности, находящиеся в каком-либо гене одного организма, где они не играют никакой роли, за исключением кодирования на определенном участке аминокислот, узнаются в качестве генетических контролирующих элементов в другом организме (например, промоторами транскрипции или терминаторами, сайтами поли А, сайтами сплайсинга интронов или сигналами деградации специфической мРНК). Возможно неправильное прочтение сигналов не является общей чертой экспрессии гетерологичных генов, но это можно частично объяснить относительно гомогенным А+Т составом (приблизительно 50%) многих организмов. Этот А + Т состав плюс природа генетического кода соответствуют любой отдельной олигонуклеотидной последовательности. Таким образом, ген из E.coli с 50% А + Т составом гораздо в меньшей степени содержит отдельный сегмент, богатый А + Т, чем ген из B.thuringiensis.

Как описано выше, экспрессия белкового токсина B.t. в растениях проблематична. Хотя наблюдения, сделанные в других системах, позволяют предсказать возможность увеличения уровня экспрессии белковых токсинов B.t. в растениях. Однако успех заявленного способа является неожиданным. Действительно, в большом количестве работ в последние годы отмечается, что экспрессия полноразмерного белкового токсина B.t.k. в табаке вызывает отмирание каллюсной ткани (Barton K. A. et al., 1987). Следовательно, разумно было бы ожидать, что высокий уровень экспрессии белкового токсина недостижим из-за токсических эффектов.

Согласно изобретению способ включает модификацию существующей структурной кодирующей последовательности ("структурного гена") путем удаления последовательностей АТТТА и имеющихся сигналов полиаденилирования с помощью сайт-специфического мутагенеза ДНК, включающей структурный ген. Предпочтительно, чтобы фактически все сигналы полиаденилирования и последовательности АТТТА были удалены, хотя большие уровни экспрессии наблюдаются и при частичном удалении каждой из выше определенных последовательностей. Альтернативно, если получен синтетический ген, кодирующий и обеспечивающий экспрессию белка, кодоны выбираются таким образом, чтобы избежать АТТТА последовательности и имеющиеся сигналы полиаденилирования. При этом сигналы полиаденилирования включают, но не ограничиваются ААТААА, ААТААТ, ААССАА, АТАТАА, ААТСАА, АТАСТА, АТАААА, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, AATTAAA, AATTAA, AATACA и CATAAA.

При замене последовательностей АТТТА и сигналов полиаденилирования используются предпочтительно те кодоны, которые не являются редко встречаемыми в растительном геноме.

Другое воплощение изобретения, представленное на фиг. 1, предполагает использование метода для модификации существующего структурного гена или альтернативного метода синтеза de novo структурного гена, который является менее строгим, чем метод, описанный выше. При этом выбранная последовательность ДНК сканируется для того, чтобы выявить районы, содержащие более четырех последовательных адениновых (А) или тиминовых (Т) нуклеотидов. А+Т районы сканируют на потенциальные сигналы полиаденилирования растений. Как правило, удаление пяти или более последовательных А или Т нуклеотидов элиминирует большинство растительных сигналов полиаденилирования. Однако, если выявляют более чем один минорный сигнал полиаденилирования, найденный внутри десяти нуклеотидов другого сигнала, тогда нуклеотидную последовательность этого района предпочтительно изменять, чтобы удалить эти сигналы, сохраняя при этом оригинальную аминокислотную последовательность.

Далее следует вторая стадия - принять во внимание 15-30 нуклеотидные районы, окружающие A + T богатые участки, определенные на первой стадии. Если содержание A + T в окружающем районе меньше, чем 80%, он должен быть проверен на наличие сигналов полиаденилирования. Изменение района в случае обнаружения в нем сигналов полиаденилирования зависит от количества присутствующих сигналов полиаденилирования и от присутствия мажорного растительного сигнала полиаденилирования.

Протяженный район исследуют на присутствие растительных сигналов полиаденилирования. Сигналы полиаденилирования удаляют сайт-специфическим мутагенезом последовательности ДНК. Кроме того, район также исследуют на мультикопийность последовательности ATTTA, которая также удаляется с помощью мутагенеза.

Предпочтительно, чтобы районы, включающие много по