Синтетические гены
Иллюстрации
Показать всеИзобретение относится к области биохимии, в частности к синтетической ДНК для экспрессии белковых токсинов Cry. Также раскрыты ДНК-конструкция для экспрессии белковых токсинов Cry и трансгенное растение, имеющее устойчивость к насекомым-вредителям, чувствительным к белковым токсинам Cry. Раскрыт способ борьбы с насекомыми-вредителями зерна или семян, чувствительными к белковым токсинам Cry. Изобретение позволяет бороться с насекомыми-вредителями . 4 н.п. ф-лы, 29 табл., 17 пр.
Реферат
УРОВЕНЬ ТЕХНИКИ
Было обнаружено, что для достижения необходимых уровней экспрессии гетерологичных белков в трансгенных растениях целесообразно изменять нативную кодирующую последовательность ДНК, иногда называемую последовательностью дикого типа или исходной последовательностью, различными способами, например, таким образом, чтобы использование кодонов точнее соответствовало использованию кодонов для вида растения-хозяина, и/или чтобы содержание G+C в кодирующей последовательности точнее соответствовало уровню G+C, обычно имеющемуся в кодирующих последовательностях для вида растения-хозяина, и/или чтобы определенные последовательности, которые дестабилизируют мРНК, были удалены. Например, экспрессия в растениях кристаллических белковых токсинов Bacillus thuringiensis (B.t.) против насекомых было улучшено с применением одного или более указанных способов. См., например, патент США No. 5380301, патент США No. 5625136, патент США No. 6218188, патент США No. 6340593, патент США No. 6673990, патент США No. 7741118. Вырожденность кодонов позволяет создавать синтетические последовательности ДНК, которые кодируют представляющий интерес белок с использованием кодонов, которые отличаются от используемых в исходной кодирующей последовательности ДНК.
Что касается удаления последовательностей, которые могут дестабилизировать мРНК, в патенте США No. 7741118 изложен список из 16 последовательностей сигналов полиаденилирования (столбец 15, таблица II) и требования по снижению количества таких последовательностей в синтетических кодирующих последовательностях, которые предназначены для экспрессии в растениях. Последовательности сигналов полиаденилирования, приведенные в таблице II US 7741118, приведены ниже в таблице 1:
Таблица 1 | |||||||
Последовательности сигналов полиаденилирования, приведенные в таблице II US 7741118 | |||||||
1 | AATAAA | 6 | ATACTA | 11 | ATACAT | 16 | CATAAA |
2 | AATAAT | 7 | ATAAAA | 12 | AAAATA | ||
3 | AACCAA | 8 | ATGAAA | 13 | ATTAAA | ||
4 | ATATAA | 9 | AAGCAT | 14 | AATTAA | ||
5 | AATCAA | 10 | ATTAAT | 15 | AATACA |
В US 7741118 также, предпочтительно, требуется удаление последовательности ATTTA (известной как последовательность Шоу-Камена), поскольку она была идентифицирована как потенциально дестабилизирующая мРНК.
В отличие от изложенного в US 7741118, мы обнаружили, что снижение количества последовательностей сигналов полиаденилирования, идентифицированных выше в таблице 1, не является ни необходимым, ни достаточным для обеспечения повышенной экспрессии синтетических генов в растениях.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Ниже в таблице 2 идентифицировано 20 потенциальных последовательностей сигналов полиаденилирования, которые часто появляются в генах кукурузы.
Таблица 2 | |||||||
Потенциальные последовательности сигналов полиаденилирования, найденные в генах кукурузы | |||||||
1 | ATATAT | 6 | TATTTT | 11 | TAATAA | 16 | TATTAT |
2 | TTGTTT | 7 | TTTTTT | 12 | ATTTAT | 17 | TGTTTG |
3 | TTTTGT | 8 | ATTTTT | 13 | TATATT | 18 | TTATAT |
4 | TGTTTT | 9 | TTATTT | 14 | TTTTAT | 19 | TGTAAT |
5 | TATATA | 10 | TTTATT | 15 | ATATTT | 20 | AAATAA |
Ниже в таблице 3 идентифицировано 20 потенциальных последовательностей сигналов полиаденилирования, которые часто появляются в генах сои.
Таблица 3 | |||||||
Потенциальные последовательности сигналов полиаденилирования, найденные в генах сои | |||||||
1 | ATTTTT | 6 | TTTTAT | 11 | AAATTT | 16 | ATATAT |
2 | TATTTT | 7 | AATTTT | 12 | AAATAA | 17 | ATTATT |
3 | TTATTT | 8 | TTTTTA | 13 | ATATTT | 18 | ATTTTA |
4 | TTTATT | 9 | TAATTT | 14 | TTTGTT | 19 | TTTAAT |
5 | TTTTTT | 10 | TTAATT | 15 | TTGTTT | 20 | TTTTAA |
Настоящее изобретение предоставляет синтетическую последовательность ДНК для экспрессии представляющего интерес белка в клетках кукурузы, которая содержит:
a) оптимизированную по кодонам последовательность ДНК, кодирующую представляющий интерес белок,
b) по меньшей мере, одну последовательность сигнала полиаденилирования, выбранную из группы, состоящей из класса I и класса II, где
класс I выбирают из группы, состоящей из AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA и CATAAA; и
класс II выбирают из группы, состоящей из ATATAT, TTGTTT, TTTTGT, TGTTTT, TATATA, TATTTT, TTTTTT, ATTTTT, TTATTT, TTTATT, TAATAA, ATTTAT, TATATT, TTTTAT, ATATTT, TATTAT, TGTTTG, TTATAT, TGTAAT и AAATAA; и
где указанная оптимизированная по кодонам последовательность ДНК содержит, по меньшей мере, одну последовательность сигнала полиаденилирования из класса II, и где указанная синтетическая последовательность ДНК содержит меньше последовательностей сигналов полиаденилирования класса II, чем нативная последовательность ДНК белка, и содержит такое же количество последовательностей сигналов полиаденилирования класса I по сравнению с нативной последовательностью ДНК.
Настоящее изобретение также предоставляет синтетическую последовательность ДНК для экспрессии представляющего интерес белка в клетках сои, которая содержит:
a) оптимизированную по кодонам последовательность ДНК, кодирующую представляющий интерес белок,
b) по меньшей мере, одну последовательность сигнала полиаденилирования, выбранную из группы, состоящей из класса I и класса III, где
класс I выбирают из группы, состоящей из AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA и CATAAA; и
класс III выбирают из группы, состоящей из ATTTTT, TATTTT, TTATTT, TTTATT, TTTTTT, TTTTAT, AATTTT, TTTTTA, ATATAT, TAATTT, TTAATT, AAATTT, AAATAA, ATATTT, TTTGTT TTGTTT, ATTATT, ATTTTA, TTTAAT и TTTTAA, и
где указанная оптимизированная по кодонам последовательность ДНК содержит, по меньшей мере, одну последовательность сигнала полиаденилирования из класса III, и где указанная синтетическая последовательность ДНК содержит меньше последовательностей сигналов полиаденилирования из класса III, чем нативная последовательность ДНК белка, и содержит такое же количество последовательностей сигналов полиаденилирования класса I по сравнению с нативной последовательностью ДНК.
Изобретение также предоставляет способ создания синтетической последовательности ДНК, которая кодирует представляющий интерес белок, который включает (a) сначала, использование аминокислотной последовательности представляющего интерес белка, полученной из встречающегося(ихся) в природе полипептида(ов), кодируемого(ых) нативной(ыми) последовательностью(ями), которые содержат, по меньшей мере, одну последовательность сигнала полиаденилирования, приведенную в таблице 2, и (b) создание синтетической последовательности ДНК, которая кодирует указанную аминокислотную последовательность и содержит меньше последовательностей сигналов полиаденилирования, приведенных в таблице 2, по сравнению с соответствующей кодирующей последовательностью нативной(ых) последовательности(ей), и содержит такое же количество последовательностей сигналов полиаденилирования, приведенных в таблице 1.
В другом варианте осуществления изобретение предоставляет способ создания синтетической последовательности ДНК, которая кодирует представляющий интерес белок, который включает (a) сначала, использование аминокислотной последовательности представляющего интерес белка, полученной из встречающегося(ихся) в природе полипептида(ов), кодируемого(ых) нативной(ыми) последовательностью(ями), которые содержат, по меньшей мере, одну последовательность сигнала полиаденилирования, приведенную в таблице 3, и (b) создание синтетической последовательности ДНК, которая кодирует указанную аминокислотную последовательность и содержит меньше последовательностей сигналов полиаденилирования, приведенных в таблице 3, по сравнению с соответствующей кодирующей последовательностью нативной(ых) последовательности(ей), и содержит такое же количество последовательностей сигналов полиаденилирования, приведенных в таблице.
В некоторых вариантах осуществления синтетические последовательности ДНК, предоставляемые в изобретении, не содержат последовательностей сигналов полиаденилирования, приведенных в таблице 2 и/или таблице 3, или количество последовательностей сигналов полиаденилирования, идентифицированных в таблице 2 и/или таблице 3, снижено насколько это возможно при условии поддержания того же количества последовательностей сигналов полиаденилирования, идентифицированных в таблице 1, и поддержания последовательностей из таблицы 1 в их исходных положениях в последовательности.
В некоторых вариантах осуществления синтетические последовательности ДНК, предоставляемые изобретением, кодируют инсектицидный белок, необязательно, полученный из Bacillus thuringiensis, а также последовательности ДНК, полезные для устойчивости к гербицидам, недостатку воды и/или устойчивости к тепловому стрессу, модификации масел для здорового питания и для маркерных генов и селектируемых маркерных генов трансформации.
Синтетические последовательности ДНК по изобретению могут быть применены в ДНК-конструкции для экспрессии представляющего интерес белка, при этом конструкция содержит 5'-нетранслируемую последовательность, синтетическую последовательность ДНК по изобретению и 3'-нетранслируемую область, и указанная 5'-нетранслируемая последовательность содержит промотор, функциональный в растениях, и указанная 3'-нетранслируемая последовательность содержит сигнал терминации транскрипции и полиаденилирования.
Изобретение также предоставляет трансгенное растение, содержащее синтетические последовательности ДНК по изобретению.
Также представлен способ борьбы с насекомыми-вредителями в растении, который включает экспрессию синтетической последовательности ДНК по изобретению в растении, где синтетическая последовательность ДНК кодирует токсины против насекомых, например, белок Cry Bacillus thuringiensis.
Также представлен способ для устойчивости к гербицидам у растения, который включает экспрессию синтетической последовательности ДНК по изобретению в растении, где синтетическая последовательность ДНК кодирует известный фермент устойчивости к гербицидам, например, такой фермент, как арилоксиалканоат диоксигеназа (AAD1), см. WO/2005/107437, или фосфинотрицин ацетилтрансфераза, или 5-энолпирувилшикимат-3-фосфат синтаза.
Также представлен способ для изменения масляных профилей в растении, который включает экспрессию одной или более синтетических последовательностей ДНК по изобретению в растении, где синтетическая последовательность ДНК кодирует один или более известных ферментов для изменения масляных профилей в растениях, например, десатуразу жирных кислот.
Также представлен способ для устойчивости к стрессу в растении, который включает экспрессию синтетической последовательности ДНК по изобретению, где синтетическая последовательность ДНК кодирует известные гены устойчивости к стрессу недостатка воды и/или тепловому стрессу, например, для ассоциированного со стрессом белка (SAP1); патентная публикация США NO:2010/0275327, и для белков 1-Cys пероксиредоксина (Per1) (Mowla, et al, 2002, Planta 215:716-726).
Также представлен способ добавления генов-репортеров к растению, который включает экспрессию синтетической последовательности ДНК по изобретению в растении, где синтетическая последовательность ДНК кодирует известный маркерный белок трансформации, являющийся функциональным в растениях, например, зеленый флуоресцентный белок (GFP) или фермент бета-глюкуронидазу.
Также представлен способ защиты от вредителей для зерен или семян, который включает получение указанных зерен или семян у растений, содержащих синтетический ген по изобретению, который экспрессирует токсин против насекомых, и способ защиты от вредителей для муки крупного и мелкого помола, который включает получение указанной муки крупного и мелкого помола из зерна, содержащего синтетический ген по изобретению, который экспрессирует токсин против насекомых.
Также представлена композиция, полученная из трансгенных растений, содержащая синтетическую ДНК по изобретению, где указанная композиция представляет собой товарный продукт, выбранный из группы, состоящей из муки крупного помола, муки мелкого помола, белкового концентрата и масла.
В некоторых случаях количество сигналов полиаденилирования, приведенных в таблице 1, может поддерживаться в синтетических последовательностях ДНК по изобретению путем удаления экземпляров AATAAA и их замены на другие последовательности сигналов полиаденилирования, приведенные в таблице 1. Пример указанного показан в примере 1, SEQ ID NO:5.
ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
SEQ ID NO:1 представляет собой нативную последовательность ДНК, кодирующую ядерный токсин Cry1Fa Bacillus thuringiensis.
SEQ ID NO:2 представляет собой последовательность ядерного токсина Cry1Fa Bacillus thuringiensis.
SEQ ID NO:3 представляет собой синтетическую последовательность ДНК, кодирующую ядерный токсин Cry1Fa Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1.
SEQ ID NO:4 представляет собой последовательность ядерного токсина Cry1Fa Bacillus thuringiensis.
SEQ ID NO:5 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую ядерный токсин Cry1Fa Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1.
SEQ ID NO:6 представляет собой последовательность ядерного токсина Cry1Fa Bacillus thuringiensis.
SEQ ID NO:7 представляет собой нативную последовательность ДНК, кодирующую токсин Cry34Ab1 Bacillus thuringiensis.
SEQ ID NO:8 представляет собой последовательность токсина Cry34Ab1 Bacillus thuringiensis.
SEQ ID NO:9 представляет собой синтетическую последовательность ДНК, кодирующую токсин Cry34Ab1 Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1.
SEQ ID NO:10 представляет собой последовательность токсина Cry34Ab1 Bacillus thuringiensis.
SEQ ID NO:11 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую токсин Cry34Ab1 Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1.
SEQ ID NO:12 представляет собой последовательность токсина Cry34Ab1 Bacillus thuringiensis.
SEQ ID NO:13 представляет собой нативную последовательность ДНК, кодирующую токсин Cry35Ab1 Bacillus thuringiensis.
SEQ ID NO:14 представляет собой последовательность токсина Cry35Ab1 Bacillus thuringiensis.
SEQ ID NO:15 представляет собой синтетическую последовательность ДНК, кодирующую токсин Cry35Ab1 Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1.
SEQ ID NO:16 представляет собой последовательность токсина Cry35Ab1 Bacillus thuringiensis.
SEQ ID NO:17 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую токсин Cry35Ab1 Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1.
SEQ ID NO:18 представляет собой последовательность токсина Cry35Ab1 Bacillus thuringiensis.
SEQ ID NO:19 представляет собой нативную последовательность ДНК, кодирующую ядерный токсин Cry1Ab1 Bacillus thuringiensis.
SEQ ID NO:20 представляет собой последовательность ядерного токсина Cry1Ab1 Bacillus thuringiensis.
SEQ ID NO:21 представляет собой синтетическую последовательность ДНК, кодирующую ядерный токсин Cry1Ab1 Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1.
SEQ ID NO:22 представляет собой последовательность ядерного токсина Cry1Ab1 Bacillus thuringiensis.
SEQ ID NO:23 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую ядерный токсин Cry1Ab1 Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1.
SEQ ID NO:24 представляет собой последовательность ядерного токсина Cry1Ab1 Bacillus thuringiensis.
SEQ ID NO:25 представляет собой нативную последовательность ДНК, кодирующую ядерный токсин Cry1Ca Bacillus thuringiensis.
SEQ ID NO:26 кодирует последовательность ядерного токсина Cry1Ca Bacillus thuringiensis.
SEQ ID NO:27 представляет собой синтетическую последовательность ДНК, кодирующую ядерный токсин Cry1Ca Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1.
SEQ ID NO:28 кодирует последовательность ядерного токсина Cry1Ca Bacillus thuringiensis.
SEQ ID NO:29 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую ядерный токсин Cry1Ca Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1.
SEQ ID NO:30 кодирует последовательность ядерного токсина Cry1Ca Bacillus thuringiensis.
SEQ ID NO:31 представляет собой нативную последовательность ДНК, кодирующую токсин Cry6Aa Bacillus thuringiensis.
SEQ ID NO:32 представляет собой последовательность токсина Cry6Aa Bacillus thuringiensis.
SEQ ID NO:33 представляет собой синтетическую последовательность ДНК, кодирующую токсин Cry6Aa Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1.
SEQ ID NO:34 представляет собой последовательность токсина Cry6Aa Bacillus thuringiensis.
SEQ ID NO:35 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую токсин Cry6Aa Bacillus thuringiensis с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1.
SEQ ID NO:36 представляет собой последовательность токсина Cry6Aa Bacillus thuringiensis.
SEQ ID NO:37 представляет собой нативную последовательность ДНК, кодирующую белок AAD1 Sphingobiurn herbicidovorans.
SEQ ID NO:38 представляет собой последовательность белка AAD1 Sphingobiurn herbicidovorans.
SEQ ID NO:39 представляет собой синтетическую последовательность ДНК, кодирующую белок AAD1 Sphingobiurn herbicidovorans с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1 и таблицы 2.
SEQ ID NO:40 представляет собой последовательность белка AAD1 Sphingobiurn herbicidovorans.
SEQ ID NO:41 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую белок AAD1 Sphingobiurn herbicidovorans с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1.
SEQ ID NO:42 представляет собой последовательность белка AAD1 Sphingobiurn herbicidovorans.
SEQ ID NO:43 представляет собой нативную последовательность ДНК, кодирующую белок дельта-9-десатуразы жирных кислот Aspergillus nidulans.
SEQ ID NO:44 представляет собой последовательность белка дельта-9-десатуразы жирных кислот Aspergillus nidulans.
SEQ ID NO:45 представляет собой синтетическую последовательность ДНК, кодирующую белок дельта-9-десатуразы жирных кислот Aspergillus nidulans с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1 и таблицы 2.
SEQ ID NO:46 представляет собой последовательность белка дельта-9-десатуразы жирных кислот Aspergillus nidulans.
SEQ ID NO:47 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую белок дельта-9-десатуразы жирных кислот Aspergillus nidulans с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1.
SEQ ID NO:48 представляет собой белок дельта-9-десатуразы жирных кислот Aspergillus nidulans.
SEQ ID NO:49 представляет собой нативную последовательность ДНК, кодирующую белок SAP1 Xerophyta viscosa.
SEQ ID NO:50 представляет собой последовательность белка SAP1 Xerophyta viscosa.
SEQ ID NO:51 представляет собой синтетическую последовательность ДНК, кодирующую белок SAP1 Xerophyta viscosa с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1 и таблицы 2.
SEQ ID NO:52 представляет собой последовательность белка SAP1 Xerophyta viscosa.
SEQ ID NO:53 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую белок SAP1 Xerophyta viscosa с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1
SEQ ID NO:54 представляет собой последовательность белка SAP1 Xerophyta viscosa.
SEQ ID NO:55 представляет собой нативную последовательность ДНК, кодирующую белок GFP1 Aequorea victoria.
SEQ ID NO:56 представляет собой последовательность белка GFP1 Aequorea victoria.
SEQ ID NO:57 представляет собой синтетическую последовательность ДНК, кодирующую белок GFP1 Aequorea victoria с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1 и таблицы 2.
SEQ ID NO:58 представляет собой последовательность белка GFP1 Aequorea victoria.
SEQ ID NO:59 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую белок GFP1 Aequorea victoria с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1.
SEQ ID NO:60 представляет собой последовательность белка GFP1 Aequorea victoria.
SEQ ID NO:61 представляет собой нативную последовательность ДНК, кодирующую белок дельта-9-десатуразы жирных кислот Leptosphaeria nodorum.
SEQ ID NO:62 представляет собой последовательность белка дельта-9-десатуразы жирных кислот Leptosphaeria nodorum.
SEQ ID NO:63 представляет собой синтетическую последовательность ДНК, кодирующую белок дельта-9-десатуразы жирных кислот Leptosphaeria nodorum с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1 и таблицы 2.
SEQ ID NO:64 представляет собой последовательность белка дельта-9-десатуразы жирных кислот Leptosphaeria nodorum.
SEQ ID NO:65 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую белок дельта-9-десатуразы жирных кислот Leptosphaeria nodorum с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1
SEQ ID NO:66 представляет собой последовательность белка дельта-9-десатуразы жирных кислот Leptosphaeria nodorum.
SEQ ID NO:67 представляет собой нативную последовательность ДНК, кодирующую белок PER1 Xerophyta viscosa.
SEQ ID NO:68 представляет собой последовательность белка PER1 Xerophyta viscosa.
SEQ ID NO:69 представляет собой синтетическую последовательность ДНК, кодирующую белок PER1 Xerophyta viscosa с использованием кодонов, оптимизированных для кукурузы, и в которой поддерживаются последовательности из таблицы 1 и таблицы 2.
SEQ ID NO:70 представляет собой последовательность белка PER1 Xerophyta viscosa.
SEQ ID NO:71 представляет собой синтетическую последовательность ДНК по изобретению, кодирующую белок PER1 Xerophyta viscosa с использованием кодонов, оптимизированных для кукурузы, и в которой удалены последовательности, идентифицированные в таблице 2, и поддерживаются последовательности из таблицы 1.
SEQ ID NO:72 представляет собой последовательность белка PER1 Xerophyta viscosa.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Изобретение предоставляет синтетические последовательности нуклеиновых кислот, кодирующие представляющие интерес белки. Синтетические кодирующие последовательности, в частности, приспособлены для применения в экспрессии представляющих интерес белков в трансгенных растениях.
Представляющий интерес белок может быть любым белком или полипептидом, который встречается в природе, или любым встречающимся в природе вариантом, включая процессированные формы таких белков, но не ограничиваясь ими. Представляющий интерес белок также может являться белком, образованным путем объединения частей или фрагментов более чем одного встречающегося в природе белка, например, путем смешивания и сопоставления функциональных белковых доменов.
Предпочтительная группа представляющих интерес белков представляет собой группу, в которой получаемый в результате фенотип является агрономическим признаком или белком-репортером, применяемым для создания агрономических признаков. Это включает в себя резистентность к насекомым, устойчивость к гербицидам, устойчивость к недостатку воды и/или тепловому стрессу и изменению масляного профиля, но не ограничивается перечисленным.
Более предпочтительная группа представляющих интерес белков представляет собой группу, в которой получаемый в результате фенотип является агрономическим признаком. Другой предпочтительной группой является группа, в который получаемый в результате фенотип обеспечивает устойчивость к гербицидам. Другой предпочтительной группой является группа, в которой получаемый в результате фенотип обеспечивает устойчивость к стрессу. Другой предпочтительной группой является группа, в которой получаемый в результате фенотип обеспечивает модифицированный масляный профиль для более здоровой пищи. Более предпочтительной группой является группа, в которой представляющим интерес белком является белок Cry, который обеспечивает резистентность к насекомым.
Нативные последовательности ДНК/последовательности ДНК дикого типа, кодирующие представляющий интерес белок, должны быть идентифицированы и проанализированы для определения присутствия последовательностей сигналов полиаденилирования, приведенных в таблицах 1 и 2 и/или 3. В соответствии с изобретением, для кодирующих последовательностей, предназначенных для применения в кукурузе, количество последовательностей сигналов полиаденилирования, приведенных в таблице 2, снижается по сравнению с количеством, присутствующим в нативной последовательности. Для кодирующих последовательностей, предназначенных для применения в сое, снижается количество последовательностей сигналов полиаденилирования, приведенных в таблице 3. Очень важно удалить последовательности сигналов полиаденилирования, приведенные в таблицах 2 и 3, в частности, когда они появляются во вложенной мультимерной форме.
В дополнение к удалению последовательностей сигналов полиаденилирования, приведенных в таблицах 2 и 3, может быть необходимым удаление появлений последовательности Шоу-Камен, ATTTA.
В дополнение к удалению последовательностей сигналов полиаденилирования и последовательностей Шоу-Камен, является предпочтительным построение синтетических кодирующих последовательностей ДНК, в которых кодоны используются приблизительно с той же частотой, с которой они используются, в среднем, во встречающихся в природе генах в растениях тех видов, в которых будет применяться синтетическая последовательность ДНК. В таблице 4 приведены подходящие процентные значения для использования кодонов в синтетических генах, предназначенных для применения в различных сельскохозяйственных растениях, а также для применения, в общем случае, в двудольных растениях, или, в общем случае, в растениях.
Таблица 4 | |||||||
Целевые ремасштабированные составы кодонов синтетических генов растений | |||||||
Аминокислота | Кодон | % в кукурузе | % в сое | Аминокислота | Кодон | % в кукурузе | % в сое |
ALA (A) | GCA | 18,0 | 33,1 | LEU (L) | CTA | 0 | 0 |
GCC | 34,0 | 24,5 | CTC | 29,9 | 22,4 | ||
GCG | 24,0 | 0 | CTG | 33,3 | 16,3 | ||
GCT | 24,0 | 42,3 | CTT | 19,5 | 31,5 | ||
ARG (R) | AGA | 18,8 | 36,0 | TTA | 0 | 0 | |
AGG | 32,5 | 32,2 | TTG | 17,2 | 29,9 | ||
CGA | 0 | 0 | LYS (K) | AAA | 22,0 | 42,5 | |
CGC | 30,0 | 15 | AAG | 78,0 | 57,5 | ||
CGG | 18,8 | 0 | MET (M) | ATG | 100 | 100 | |
CGT | 0 | 16,9 | PHE (F) | TTC | 71,0 | 49,2 | |
ASN (N) | AAC | 68,0 | 50,0 | TTT | 29,0 | 50,8 | |
AAT | 32,0 | 50,0 | PRO (P) | CCA | 26,0 | 39,8 | |
ASP (D) | GAC | 63,0 | 38,1 | CCC | 24,0 | 20,9 | |
GAT | 37,0 | 61,9 | CCG | 28,0 | 0,0 | ||
CYS (C) | TGC | 68,0 | 50,0 | CCT | 22,0 | 39,3 | |
TGT | 32,0 | 50,0 | SER (S) | AGC | 25,3 | 16,0 | |
END | TAA | 0 | 0 | AGT | 0,0 | 18,2 | |
TAG | 0 | 0 | TCA | 17,6 | 21,9 | ||
TGA | 100 | 100 | TCC | 25,3 | 18,0 | ||
GLN (Q) | CAA | 38,0 | 55,5 | TCG | 15,4 | 0 | |
CAG | 62,0 | 44,5 | TCT | 16,5 | 25,8 | ||
GLU (E) | GAA | 29,0 | 50,5 | THR (T) | ACA | 21,0 | 32,4 |
GAG | 71,0 | 49,5 | ACC | 37,0 | 30,2 | ||
GLY (G) | GGA | 19,0 | 31,9 | ACG | 22,0 | 0,0 | |
GGC | 42,0 | 19,3 | ACT | 20,0 | 37,4 | ||
GGG | 19,0 | 18,4 | TRP (W) | TGG | 100 | 100 | |
GGT | 20,0 | 30,4 | TYR (Y) | TAC | 73,0 | 48,2 | |
HIS (H) | CAC | 62,0 | 44,8 | TAT | 27,0 | 51,8 | |
CAT | 38,0 | 55,2 | VAL (V) | GTA | 0 | 11,5 | |
ILE (I) | ATA | 14,0 | 23,4 | GTC | 34,8 | 17,8 | |
ATC | 58,0 | 29,9 | GTG | 42,4 | 32,0 | ||
ATT | 28,0 | 46,7 | GTT | 22,8 | 38,7 |
ТРАНСГЕННЫЕ РАСТЕНИЯ
Предпочтительным вариантом осуществления настоящего изобретения является трансформация растений генами, кодирующими токсины против насекомых. Трансформированные растения, которые экспрессируют гены токсинов против насекомых, являются устойчивыми к нападению целевого насекомого-вредителя благодаря наличию контролируемых объемов соответствующего инсектицидного белка или его вариантов в клетках трансформированного растения. В результате включения генетического материала, который кодирует инсектицидные свойства инсектицидных токсинов B.t., в геном растения, съеденного конкретным насекомым-вредителем, взрослая особь или личинка погибает после употребления кормового растения. Было трансформировано множество представителей односемядольных и двусемядольных. Трансгенные агрономические сельскохозяйственные культуры, а также фрукты и овощи, представляют коммерческий интерес. Такие сельскохозяйственные культуры включают кукурузу, рис, сою, канолу, подсолнечник, люцерну, сорго, пшеницу, хлопок, арахис, томат, картофель и т.п., но не ограничиваются перечисленным. Существует несколько методик внесения чужеродного генетического материала в клетки растений и для получения растений, которые стабильно поддерживают и экспрессируют внесенный ген. Такие методики включают запуск генетического материала, нанесенного на микрочастицы, непосредственно в клетки (патент США No. 4945050 и патент США No. 5141131). Растения могут трансформироваться с применением агробактериальной технологии, см. патент США No. 5177010, Европейский патент No. EP 131624B1, Европейский патент No. EP 159418B1, Европейский патент No. EP176112B1, патент США No. 5149645, EP120516B1, патент США No. 5464763, патент США No. 4693976, Европейский патент No. EP 116718B1, Европейский патент No. EP290799B1, Европейский патент No. EP320500B1, Европейский патент No. EP604662B1, патент