Способы и средство модификации растительного генома в нуклеотидной последовательности, широко используемой в геномной инженерии растений

Иллюстрации

Показать все

Изобретение относится к области биохимии, в частности к способу введения молекулы чужеродной ДНК в предварительно определенный сайт в геноме трансгенной растительной клетки путем индукции разрыва двухцепочечной ДНК посредством введения не встречающейся в природе одноцепочечной мегануклеазы или пары не встречающихся в природе мегануклеаз, а также к применению вышеуказанного способа для получения клетки растения или для получения растения. Также раскрыто применение не встречающейся в природе мегануклеазы или пары не встречающейся в природе мегануклеаз для введения разрыва двухцепочечной ДНК в кодирующую область bar в геноме трансгенной растительной клетки. Изобретение позволяет эффективно вводить молекулу чужеродной ДНК в геном растительной клетки. 6 н. и 13 з.п. ф-лы, 5 ил., 1 табл., 5 пр.

Реферат

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Изобретение относится к области агрономии. Более конкретно, изобретение предоставляет способы и средство для введения намеченной модификации, включая вставку, делецию или замену, в точно локализованную нуклеотидную последовательность в геноме трансгенного растения, в котором нуклеотидная последовательность содержится внутри элемента или фрагмента ДНК, часто используемого в трансгенезе растения, такого как широко используемый селектируемый маркерный ген. Модификации запускают на первой стадии посредством индуцирования двухцепочечного разрыва в нуклеотидной последовательности узнавания, используя мегануклеазы, происходящие от встречающихся в природе мегануклеаз, которые были переконструированы для распознавания сайта узнавания и его расщепления.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Необходимость для введения намеченных модификаций в растительные геномы, включая управление положением интеграции чужеродной ДНК в растениях, становится все более и более важной, и для удовлетворения данной потребности было разработано несколько способов (для обзора см. Kumar and Fladung, 2001, Trends in Plant Science, 6, pp. 155-159). Данные способы большей частью основываются на первоначальном введении разрыва двухцепочечной ДНК в намеченную область.

Активация намеченного локуса и/или репарированной или донорской ДНК посредством индукции разрывов двухцепочечной ДНК с помощью редко расщепляющих эндонуклеаз, таких как I-SceI., как было показано, увеличивает частоту гомологичной рекомбинации на несколько порядков величины. (Puchta et al., 1996, Proc. Natl. Acad. Sci. U.S.A. 93, pp5055-5060; Chilton and Que, Plant Physiol, 2003; D'Halluin et al. 2008 Plant Biotechnol. J. 6, 93-102).

WO 96/14408 описывает изолированную ДНК, кодирующую фермент I-SceI. Данная последовательность ДНК может быть инкорпорирована в векторы клонирования и экспрессии, трансформированные клеточные линии и трансгенные животные. Векторы являются пригодными в генном картировании и сайт-направленной вставке генов.

WO 00/46386 описывает способы модифицирования, репарации, аттенуирования и инактивирования гена или другой хромосомной ДНК в клетке посредством I-SceI-индуцированного разрыва двойной цепи. Также раскрыты способы лечения или профилактики генетического заболевания у нуждающегося в этом индивида. Дополнительно раскрыты химерные эндонуклеазы рестрикции.

В дополнение, описаны способы, которые предоставляют возможность конструирования редко расщепляющих эндонуклеаз для изменения специфичности ферментов к субстрату или последовательности, обеспечивая таким образом индуцирование двухцепочечного разрыва в интересующем локусе вне зависимости от наличия сайта узнавания для какой-либо из природных редко расщепляющих эндонуклеаз. Кратко, химерные ферменты рестрикции могут быть получены с использованием гибридов между доменом «цинковые пальцы», сконструированным для узнавания специфической нуклеотидной последовательности, и доменом расщепления неспецифической ДНК из природного фермента рестрикции, такого как Fokl. Подобные способы описаны, например, в WO 03/080809, WO 94/18313 или WO 95/09233 и у Isalan et al. 2001, Nature Biotechnology 19, 656-660; Liu et al. 1997, Proc. Natl. Acad. Sci. USA 94, 5525-5530). Еще один путь получения специально сконструированных мегануклеаз, посредством отбора из библиотеки вариантов, описан в WO 2004/067736. Специально сконструированные мегануклеазы или переконструированные мегануклеазы с измененной специфичностью последовательностей и афинностью связывания ДНК также могут быть получены посредством рационального конструирования, как описано в WO 2007/047859.

WO 2007/049095 описывает "LADGLIDADG" варианты хоуминг-эндонуклеазы, имеющие мутации в двух отдельных субдоменах, каждый из которых связывает определенную часть намеченного полусайта модифицированной ДНК таким образом, чтобы вариант эндонуклеазы был способен к расщеплению намеченной последовательности химерной ДНК, содержащей нуклеотиды, связанные каждым субдоменом.

WO 2007/049156 и WO 2007/093836 описывают варианты хоуминг-эндонуклеазы I-CreI, имеющие новую специфичность расщепления и их применение.

WO 2007/047859 описывает рационально сконструированные мегануклеазы с измененной специфичностью последовательностей и афинностью связывания ДНК.

WO 2006/105946 описывает способ точного обмена в растительных клетках и растениях намеченной последовательности ДНК для интересующей последовательности ДНК с помощью гомологичной рекомбинации, посредством которой селектируемый или скринируемый маркер, используемый во время фазы гомологичной рекомбинации для временного отбора явлений замены гена, может впоследствии быть удален без оставления следа и без обращения к культуре in vitro в процессе стадии удаления, применение описанного в нем способа для удаления выбранной ДНК посредством специфической для микроспор экспрессии двухцепочечного разрыва, индуцирующего редко расщепляющую эндонуклеазу.

Предварительная патентная заявка США 60/828042 и европейская патентная заявка 06020370.0 и WO 2008/037436 описывают варианты способов и средство WO 2006/105946, в котором стадия удаления выбранного фрагмента ДНК, индуцированная двухцепочечным разрывом, индуцирующим редко расщепляющую эндонуклеазу, находится под управлением гамет-специфического промотора. Другие варианты осуществления способа опираются на негомологичное соединение концов на одном конце репаративной ДНК и гомологичную рекомбинацию на другом конце.

Gao et al. 2009, The Plant Journal, pp. 1-11 описывают наследственный намеченный мутагенез у кукурузы с использованием переконструированной эндонуклеазы.

Поскольку переконструированные мегануклеазы происходят от встречающихся в природе эндонуклеаз, доступные потенциальные сайты узнавания не являются совсем случайными, но, по-видимому, имеют некоторую степень сходства с нуклеотидной последовательностью первоначально распознанной встречающейся в природе эндонуклеазой, на которой основана переконструированная мегануклеаза. Как установлено Gao et al., 2009 (supra) основанный на структуре способ конструирования белков для модифицирования ДНК-связывающих характеристик I-CreI основан на визуальном наблюдении за ко-кристаллической структурой I-CreI-ДНК, приводя к прогнозу большого количества аминокислотных подмен, которые изменяют основное преимущество I-CreI в конкретных позициях в его сайте узнавания. Экспериментально оценивали замещения отдельных аминокислот, и те, которые давали необходимое изменение основного преимущества, добавляли в базу данных мутаций, которые могут быть "смешаны и совмещены" для создания производных I-CreI, которые распознают высокодивергентные сайты ДНК. В теории, комбинационное разнообразие, способное к использованию текущей базы данных мутаций, является достаточным для того, чтобы устанавливать сконструированную эндонуклеазу приблизительно каждые 1000 т.н. в произвольной последовательности ДНК.

Соответственно, все еще остается необходимость в функциональных переконструированных мегануклеазах, которые могут распознавать сайт узнавания в элементе или области ДНК, предварительно введенной в трансгенное растение в качестве широко используемой части трансгена, и с достаточной эффективностью индуцировать разрыв двухцепочечной ДНК в данной области, запуская посредством этого события, требуемые, например, для вставки чужеродной ДНК, делеции или замены гомологичной рекомбинацией или негомологичным соединением концов в сайте двухцепочечного разрыва. Идентификация подобной пары сайта узнавания и переконструированной мегануклеазы, усовершенствует доступные инструменты для модифицирования растительного генома намеченным образом, за счет предоставления возможности вставки, делеции или замены ДНК вблизи от индуцированного разрыва двухцепочечной ДНК в месте ранее интродуцированного трансгена, без необходимости обращения к наличию исторически интродуцированных сайтов узнавания для редко расщепляющих эндонуклеаз, таких как, например, I-SceI (которая не встречается в природе в растительных клетках).

Данные и другие проблемы решены, как описано далее в различных подробных вариантах осуществления изобретения, а также в формуле изобретения.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

В одном варианте осуществления изобретения, предоставлен способ введения молекулы чужеродной ДНК в предварительно определенный сайт в геноме клетки трансгенного растения, включающий стадии:

a. индуцирования разрыва двухцепочечной ДНК в предварительно определенном сайте;

b. введения молекулы чужеродной ДНК в растительную клетку;

c. отбора растительной клетки, в которой чужеродная ДНК введена в предварительно определенный сайт; и

d. необязательно регенерации растительной клетки в растение,

отличающийся тем, что предварительно определенный сайт представляет собой нуклеотидную последовательность, отличающуюся от сайта узнавания для встречающейся в природе мегануклеазы и что предварительно определенный сайт представляет собой нуклеотидную последовательность, обычно вводимую в виде части трансгена в трансгенное растение, и при этом разрыв двухцепочечной ДНК индуцируют посредством введения не встречающейся в природе одноцепочечной мегануклеазы или пары не встречающихся в природе мегануклеаз, которая узнает или совместно узнают предварительно определенный сайт и индуцирует или индуцируют двухцепочечный разрыв.

В еще одном варианте осуществления изобретение предоставляет способ введения молекулы чужеродной ДНК в предварительно определенный сайт в геноме растительной клетки, включающий стадии:

a. индуцирования разрыва двухцепочечной ДНК в предварительно определенном сайте;

b. введения молекулы чужеродной ДНК в растительную клетку;

c. отбора растительной клетки, в которой чужеродная ДНК введена в предварительно определенный сайт; и

d. необязательно регенерации растительной клетки в растение,

отличающийся тем, что предварительно определенный сайт содержится внутри фосфинотрицинацетилтрансферазы, кодирующей область из S. hygroscopicus (кодирующую область bar), которая может иметь нуклеотидную последовательность SEQ ID NO: 3, и что разрыв двухцепочечной ДНК индуцируют посредством введения одноцепочечной мегануклеазы или пары мегануклеаз, которая узнает или совместно узнают предварительно определенный сайт и индуцирует или индуцируют двухцепочечный разрыв. Предварительно определенный сайт может содержать нуклеотидную последовательность SEQ ID NO: 1 или SEQ ID NO: 2.

В еще одном варианте осуществления, предоставлен способ введения молекулы чужеродной ДНК в предварительно определенный сайт в геноме растительной клетки, включающий стадии:

a. индуцирования разрыва двухцепочечной ДНК в предварительно определенном сайте;

b. введения молекулы чужеродной ДНК в растительную клетку;

c. отбора растительной клетки, в которой чужеродная ДНК введена в предварительно определенный сайт;

d. необязательно регенерации растительной клетки в растение,

отличающийся тем, что предварительно определенный сайт содержит нуклеотидную последовательность SEQ ID NO: 1 или SEQ ID NO: 2, и что разрыв двухцепочечной ДНК индуцируют посредством введения одноцепочечной мегануклеазы или пары мегануклеаз, которая узнает или совместно узнают предварительно определенный сайт и индуцирует или индуцируют двухцепочечный разрыв, например, мегануклеаза или пара мегануклеаз происходит/происходят из I-CreI (представленной SEQ ID NO: 16), и при этом следующие аминокислоты находятся в одной из субъединиц: - S в позиции 32; Y в позиции 33; E в позиции 38; R в позиции 40; K в позиции 66; Q в позиции 80; T в позиции 42; R в позиции 77; R в позиции 68; R в позиции 70; Q в позиции 44; I в позиции 24; S в позиции 26; S в позиции 28 и R в позиции 30 или R в позиции 70; T в позиции 44; I в позиции 24; S в позиции 26; S в позиции 28; N в позиции 30; S в позиции 32; R в позиции 33; Q в позиции 38; Q в позиции 80; R в позиции 40; K в позиции 66; T в позиции 42; R в позиции 77 и R в позиции 68 (позиции, соответствующие аминокислотной последовательности I-Cre-I). Примерами подобных мегануклеаз являются белки, содержащие аминокислотную последовательность SEQ ID NO: 5 и SEQ ID NO: 6, соответственно, кодируемые нуклеиновой кислотой, содержащей нуклеотидную последовательность SEQ ID NO: 4 от нуклеотидной позиции 2004 до нуклеотидной позиции 2525 или до 2522, или нуклеотидную последовательность SEQ ID NO: 4 от нуклеотидной позиции 4885 до нуклеотидной позиции 5405 или до 5403. одноцепочечные мегануклеазы, согласно изобретению, могут представлять собой белок, содержащий аминокислотную последовательность SEQ ID NO: 18, кодированную нуклеотидной последовательностью, содержащей нуклеотидную последовательность SEQ ID NO: 17 от нуклеотидной позиции 1267 до 1605 и от 1795 до 2541, или белком, содержащим аминокислотную последовательность SEQ ID NO: 18 от аминокислотной позиции 1 до 167 и от 208 до 362, кодируемую нуклеотидной последовательностью, содержащей нуклеотидную последовательность SEQ ID NO: 17 от нуклеотидной позиции 1267 до 1605, 1795 до 1956 и 2071 до 2541.

В любом из вариантов осуществления, чужеродная ДНК может содержаться внутри репаративной ДНК, причем репаративная ДНК, содержит по меньшей мере одну фланкирующую нуклеотидную последовательность, гомологичную расположенной до или после последовательности нуклеотидной последовательности SEQ ID NO: 1 или SEQ ID NO: 2. чужеродная ДНК может содержать селектируемый маркерный ген и/или интересующий экспрессируемый растением ген, такой как ген толерантности к гербицидам, ген резистентности к насекомым, ген резистентности к заболеваниям, ген резистентности к абиотическому стрессу, фермент, задействованный в биосинтезе масел, биосинтезе углеводов, фермент, связанный с прочностью волокон или длиной волокон, фермент, задействованный в биосинтезе вторичных метаболитов. Чужеродная ДНК может также быть интегрирована как таковая, т.е. без фланкирующих последовательностей с гомологией к области вокруг предварительно определенного сайта-мишени (без любой дополнительной ДНК), для интегрирования посредством негомологичного соединения концов.

Мегануклеаза или пара мегануклеаз могут быть экспрессированы из химерного гена или пары химерных генов, каждый из которых содержит экспрессируемый растением промотор, функционально связанный с кодирующей областью, кодирующей мегануклеазу или одну из пары мегануклеаз, и дополнительно функционально связанный с областью ДНК, вовлеченной в терминацию транскрипции и функциональное полиаденилирование в растительной клетке.

Изобретение дополнительно предоставляет, растительные клетки и растения и семена или репродуктивные части, в которых чужеродная ДНК была введена в предварительно определенный сайт, который был получен посредством способов, предоставленных в данном описании.

Изобретение также предоставляет способ выращивания растения, в котором чужеродная ДНК была введена в предварительно определенный сайт, который был получен посредством способов, предоставленных в данном описании, включающий стадию нанесения химического вещества на растение или субстрат, в котором выращивают растение.

Еще один вариант осуществления изобретения относится к способу получения растения, содержащего чужеродную ДНК, интегрированную в кодирующую область bar, включающий стадию скрещивания растения, состоящего по существу из клеток растения полученных посредством способов изобретения, с другим растением или с самим собой и необязательно сбора семян.

Изобретение также относится к способу, включающему стадию нанесения химического соединения на растение или семена растения, в котором чужеродная ДНК была введена в предварительно определенный сайт, который был получен посредством способов, предоставленных в данном описании.

Еще один вариант осуществления изобретения относится к применению мегануклеазы или пары мегануклеаз, как описано в данной заявке, для введения чужеродной ДНК в кодирующую область bar в растительной клетке.

Еще один вариант осуществления изобретения относится к применению специально сконструированной мегануклеазы для введения интересующей чужеродной ДНК в предварительно определенный сайт в растительной клетке.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фигура 1: Схематичное представление сайта узнавания и взаимодействия с аминокислотами различных мономерных звеньев BAY 39 и BAY40 мегануклеазы.

Фигура 2: аминокислотная последовательность мономерного звена 2 ("40") BAY 39/40 (необходимо заметить, что аминокислотная последовательность содержит сигнал внутриядерной локализации SV40 (аминокислоты 1-10)).

Фигура 3: аминокислотная последовательность мономерного звена 1 ("39") BAY 39/40 (необходимо заметить, что аминокислотная последовательность содержит сигнал внутриядерной локализации SV40 (аминокислоты 1-10)).

Фигура 4: аминокислотная последовательность одноцепочечной мегануклеазы BAY 39/40 (необходимо заметить, что аминокислотная последовательность содержит сигнал внутриядерной локализации SV40 (аминокислоты 1-12) и линкерной области (аминокислоты 168-205)).

Фигура 5: Выравнивание нуклеотидной последовательности ПЦР ампликонов вокруг сайта узнавания кодирующей области bar, в чувствительных к фосфинотрицину линиях, происходящих из трансгенного растения, содержащего экспрессируемый растением ген bar и экспрессируемые растением гены для мономерных звеньев BAY39/40. 1. нуклеотидная последовательность контрольного образца; 2. нуклеотидная последовательность толерантной к фосфинотрицину линии; 3-9: нуклеотидные последовательности чувствительных к фосфинотрицину линий.

ОПИСАНИЕ РАЗЛИЧНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Настоящее изобретение основано на наблюдении, что могут быть получены функциональные переконструированные мегануклеазы, которые специфически узнают и расщепляют нуклеотидную последовательность (SEQ ID NO: 1 и SEQ ID NO: 2 - Фигура 1), которая может быть обнаружена в нуклеотидной последовательности кодирующей области гена фосфинотрицин ацетилтрансферазы Streptomyces hygroscopicus (ген bar) (Thompson, C, Mowa, R. Tizard, R. Crameri, R. Davies, J. Lauwereys, M. ans Botterman, J. (1987) Characterization of the herbicide-resistance gene bar from Streptomyces hygroscopicus. The EMBO Journal 6: 2519-2523 (Accession X05822), нуклеотидная последовательность которого присутствует в широко используемом селектируемом маркерном гене в трансгенезе растения.

SEQ ID NO: 3 представляет нуклеотидную последовательность гена bar. Комплемент сайта узнавания SEQ ID NO: 1 (SEQ ID NO: 2) соответствует нуклеотидной последовательности SEQ ID NO: 3 от нуклеотида 132 до 153. Таким образом, описанные в данной заявке мегануклеазы способны узнавать и расщеплять нуклеотидную последовательность в трансгенных растениях, содержащих экспрессируемый растением ген, который имеет экспрессируемый растением промотор, функционально связанный с областью ДНК, кодирующей ген фосфинотрицин ацетилтрансферазы Streptomyces hygroscopicus (bar), и за которой следует функциональная в растениях область 3' терминации транскрипции и полиаденилирования, кодирующая область bar, содержащая нуклеотидную последовательность, которая является комплементом нуклеотидной последовательности SEQ ID NO: 1, такой как SEQ ID NO: 3.

Кодирующая область bar была инкорпорирована в ряде трансгенных растений, которые были коммерционализированы, коммерцианализируются или будут коммерционализированы, включая растения, содержащие следующее объекты:

Цикорий (Cichorium intybus):

- объекты RM3-3, RM3-4, RM3-6, которые описаны в регламентирующем документе 97-148-01p

Масличный рапс (Brassica napus)

- Объект MSI, который описан в регламентирующих документах DD95-04 (CA) или 98-278-01p (США)

- Объект MS8, который описан в регламентирующих документах DD96-17 (CA) или 98-278-01p (США) или WO 2001/041558

- Объект RF1, который описан в регламентирующих документах DD95-04 (CA) или 98-278-01p (США)

- Объект RF2, который описан в регламентирующих документах DD95-04 (CA) или 98-278-01p (США)

- Объект RF3, который описан в регламентирующих документах DD96-17 (CA) или 98-278-01p (США) или WO 2001/041558

- объекты PHY 14, PHY35, PHY36, которые описаны в Японских дерегламентирующих документах

Хлопок (Gossypium hirsutum)

Объект LLcotton 25, который описан в регламентирующих документах 02-042-01p (США) или WO 2003/013224

- Объект T303-40, который описан в WO2008/122406

- Объект GHB119, который описан в регламентирующем документе 08-340-01p (США) или WO2008/151780

Кукуруза (Zea mays)

- Объект TC-6275 (=DAS-06275-8), который описан в регламентирующем документе 03-181-01p (США)

- Объект Bt176, который описан в регламентирующем документе 94-319-01p (США)

- Объект B16 (=DLL25), который описан в дерегламентирующем документе США 95-145-01p или WO9506128

- Объект DBT418, который описан в дерегламентирующем документе США 96-291-01p (США)

- Объект ZMA101

- Объект CBH351, который описан в дерегламентирующем документе США 97-265-01p (США)

- Объект MS3, который описан в дерегламентирующем документе США 95-228-01p (США)

- Объект MS6, который описан в дерегламентирующем документе США 98-349-01p (США)

Рис (Oryza sativa)

- Объект LLRice62, который описан в дерегламентирующем документе США 98-329-01p или WO 2001/083818

- Объект LLRice601, который описан в дерегламентирующем документе США 06-234-01p или патентной заявке США 2008289060

Соя (Glycine max)

- объекты W62 и W98, описанные в регламентирующем документе 96-068-01p (США)

Трансгенные растения, заключающие в себе данные объекты, вследствие этого содержат последовательность узнавания для мегануклеаз, описанных в данной заявке, и являются подходящими объектами для способов изобретения. Кроме того, экспрессируемый растением ген bar используется, как правило, в качестве селектируемого маркера, и было получено множество трансгенных растений, которые также являются подходящими объектами для способов изобретения.

Соответственно, в одном варианте осуществления, изобретение относится к способу введения молекулы чужеродной ДНК в предварительно определенный или предварительно выбранный сайт в (ядерном) геноме клетки трансгенного растения, включающему стадии:

a. индуцирования разрыва двухцепочечной ДНК в предварительно определенном сайте;

b. введения молекулы чужеродной ДНК в указанную клетку растения; и

c. отбора растительной клетки, в которой чужеродная ДНК введена в предварительно определенный сайт;

при этом предварительно определенный сайт представляет собой нуклеотидную последовательность, отличающуюся от сайта узнавания для встречающейся в природе мегануклеазы, и представляет собой нуклеотидную последовательность, обычно вводимую в виде части трансгена в трансгенное растение, и при этом разрыв двухцепочечной ДНК индуцируют посредством введения не встречающейся в природе одноцепочечной мегануклеазы или пары мономерных звеньев не встречающейся в природе мегануклеазы, которая узнает или вместе узнают предварительно определенный сайт и индуцирует или индуцируют двухцепочечный разрыв.

В том смысле, в котором используется в данном описании, "нуклеотидная последовательность, обычно вводимая в виде части трансгена в растения", относится к нуклеотидной последовательности области ДНК, которая была использована ранее в виде элемента химерного гена, интродуцированного в растения, посредством которого трансгенные растения являются легко доступными, в частности посредством которого трансгенные растения были коммерционализированы, коммерцианализируются или будут коммерционализированы, и для которых применимы разрешения контролирующих органов и которые являются общедоступными. Доступны несколько баз данных, которые обобщают и предоставляют информацию по заявкам на разрешения контролирующих органов, включая базу данных генетически модифицированных сельскохозяйственных культур Центра по оценка риска для окружающей среды, к которым можно обращаться за онлайн консультацией (http://www.cera-gmc.org/?action=gm_crop_database&), или сводная ведомость заявок на нерегулируемый статус, выданный или находящийся на рассмотрении в APHIS, доступная онлайн на http://www.aphis.usda.gov/brs/not_reg.html.

Области ДНК, обычно вводимые в виде части трансгена в растения, содержат промоторные области, такие как 35S промотор CaMV 35S транскрипта (Odell et al. (1985), Nature 313: 810-812); FMV 35S промотор (Richins R.D. Scholthof H.B. Shepherd R.J. (1987) последовательность вируса мозаики норичника (группа каулимовирусов). Nucleic Acids Research 15: 8451-8466); промотор небольшой субъединицы гена Arabidopsis thaliana Rubisco (Krebbers E. Seurinck J. Herdies L. Cashmore A. R. Timko M. P. (1988). Четыре гена в двух разветвленных подсемействах кодируют небольшие субъединичные полипептиды рибулоза-1,5-бифосфат карбоксилазы Arabidopsis thaliana. Plant Molecular Biology, 11, 745-759); промотор Вируса мозаики жилки маниоки (Verdaguer et al (1996) Plant Mol. Biol. 31 : 1129 или Verdaguer et al (1998) Plant Mol. Biol. 37: 1055); промотор Actin2 из Arabidopsis (An Y.Q. McDowell J.M. Huang S. McKinney E.C. Chambliss S. Meagher R.B. (1996) Strong, constitutive expression of the Arabidopsis ACT2/ACT8 actin subclass in vegetative tissues. The Plant Journal 10: 107-121) или риса (McElroy D. Zhang W. Cao J. Wu R. (1990) Isolation of an efficient actin promoter for use in rice transfomation. The Plant Cell 2: 163-171); промотор гистона H3 или промотор гистона H4 (Chaboute M, Chaubet N, Philipps G, Ehling M and Gigot C (1987) Genomic organization и nucleotide sequences of two histone H3 and two histone H4 genes of Arabidopsis thaliana. Plant Mol. Biol. 8: 179-191); промотор гена ubiquitin-1 кукурузы (Zea mays) (Christensen et al (1992) Plant Mol. Biol. 18: 675); 5' UTR лидерные последовательности, такая как лидерная последовательность cab22L (Harpster M, Townsend J, Jones J, Bedbrook J and Dunsmuir P.(1988) Relative strengths of the 35S cauliflower mosaic virus, 1’, 2' and nopaline synthase promoters in transformed tobacco, sugarbeet and oilseed rape callus tissue. Mol Gen Genet. 212: 182-190); или 5' tev (Carrington J and Freed D (1990) Cap-independent enhancement of translation by a plant potyvirus 5' nontranslated region. J Virol 64(4): 1590-1597); конец 3’ гена нопалин-синтазы (Depicker A. Stachel S. Dhaese P. Zambryski P. Goodman H.M. (1982). Nopaline synthase: transcript mapping and DNA sequence. Journal of Molecular and Applied Genetics 1, 561-573); конец 3’ гена октопин синтазы (De Greve H. Dhaese P. Seurinck J. Lemmers M. Van Montagu M. Schell J. (1982). Nucleotide sequence and transcript map of the Agrobacterium tumefaciens Ti plasmid-encoded octopine synthase gene. Journal of Molecular and Applied Genetics, 1, 499-511); терминатор CaMV35S (Sanfacon et al (1991) Gene Dev. 5: 141) transcription termination and polyadenylation region of gene 7 of the octopine type T-DNA vector (D'Haese et al, 1983, EMBO Journal, 2, 419-426) и селектируемые маркеры, такие как bar (Thompson, C, Mowa, R. Tizard, R. Crameri, R. Davies, J. Lauwereys, M. ans Botterman, J. (1987) Characterization of the herbicide-resistance gene bar from Streptomyces hygroscopicus. The EMBO Journal 6: 2519-2523 (Accession X05822)); pat (Wohlleben,W. Arnold, W. Broer,L, Hillemann,D. Strauch, E. И Puhler, A. Nucleotide sequence of the phosphinothricin N-acetyltransferase gene from Streptomyces viridochromogenes Tu494 and its expression in Nicotiana tabacum. Gene 70 (1), 25-37 (1988)); 2mepsps (последовательность 4 из патента US6566587 или EMBL номер AR337832); CP4 (Padgette S.R. Re D. Barry G. Eichholtz D. Delannay X. Fuchs R.L. Kishore G.M. Fraley R.T. (1996). New weed control opportunities: development of soybeans with a Roundup Ready gene. In Herbicide-Resistant Crops: Agricultural, Environmental, Econ.... neo Accession V00618; Beck et al (1982) Gene 19(3) p 327-336); или hpt (Kaster et al. (1983), NAR 11, 6895-6911).

Предпочтительной областью ДНК в контексте данного изобретения является нуклеотидная последовательность кодирующей области гена bar, которая упоминается выше.

Переконструированные мегануклеазы, описанные в данном документе, основаны на встречающейся в природе мегануклеазе I-CreI для использования в качестве каркаса. I-CreI представляет собой хоминг-эндонуклеазу, обнаруженную в хлоропластах Chlamydomonas rheinhardti (Thompson et al. 1992, Gene 119, 247-251). Данная эндонуклеаза представляет собой гомодимер, который узнает псевдопалиндромный сайт ДНК 22 т.н. В гене 23SrРНК и создает разрыв двухцепочечной ДНК, который используется для введения интрона. I-CreI представляет собой звено группы эндонуклеаз, несущее единственный мотив LAGLIDADG. Ферменты LAGLIDADG заключают в себе одну или две копии консенсусного мотива. Ферменты с единственным мотивом, такие как I-CreI, функционируют в качестве гомодимеров, тогда как ферменты с двумя мотивами представляют собой мономеры с двумя отдельными доменами. Соответственно, при переконструировании мегануклеаз, полученных из каркаса I-CreI для узнавания интересующей нуклеотидной последовательности 22 bp, конструируют два мономерных звена, каждое из которых узнает часть сайта узнавания 22 bp, которые необходимы совместно для индуцирования двухцепочечного разрыва в сайте узнавания 22 т.н. (WO2007/047859). Согласованного действия можно добиться посредством связывания двух мономерных звеньев в одну одноцепочечную мегануклеазу или также можно добиться посредством стимулирования образования гетеродимеров, которые описаны например, в WO2007/047859.

Аминокислотная последовательность встречающегося в природе мономера I-CreI предоставлена в виде SEQ ID NO: 16. Для переконструирования мономерных звеньев I-CreI таким образом, чтобы их гетеродимеры узнавали нуклеотидную последовательность SEQ ID NO: 1 и/или 2, в упомянутых позициях находятся следующие аминокислоты:

1. В мегануклеазном звене 1:

a. S в позиции 32;

b. Y в позиции 33;

c. E в позиции 38;

d. R в позиции 40;

e. K в позиции 66;

f. Q в позиции 80;

g. T в позиции 42;

h. R в позиции 77;

i. R в позиции 68;

j. R в позиции 70;

k. Q в позиции 44;

l. I в позиции 24;

m. S в позиции 26;

n. S в позиции 28;

o. R в позиции 30.

2. В мегануклеазном звене 2:

P. R в позиции 70;

q. T в позиции 44;

r. I в позиции 24;

s. S в позиции 26;

t. S в позиции 28;

u. N в позиции 30;

V. S в позиции 32;

w. R в позиции 33;

х. Q в позиции 38;

y. Q в позиции 80;

z. R в позиции 40;

aa. K в позиции 66;

bb. T в позиции 42;

cc. R в позиции 77;

dd. R в позиции 68.

На фигуре 1 предоставлена его схематичное представление.

Переконструированный фермент, индуцирующий двухцепочечный разрыв, может содержать, но без необходимости содержать, сигнал внутриядерной локализации (NLS), такой как NLS большого T-антигена SV40 [Raikhel, Plant Physiol. 100: 1627-1632 (1992) и ссылки на него] [Kalderon et al. Cell 39: 499-509 (1984)]. Сигнал внутриядерной локализации может быть локализован в белке где угодно, но обычно локализован на N-терминальном конце белка. Сигнал внутриядерной локализации может заменять одну или более аминокислот фермента, индуцирующего двухцепочечный разрыв. Необходимо заметить, что если переконструированная мегануклеаза снабжена NLS на N-конце белка, например, 10 или 12 аминокислотным NLS SV40, позиции аминокислот будут, соответственно, сдвинуты (увеличены). Аналогичным образом, в случае, когда два мономерных звена связаны в одноцепочечную мегануклеазу, позиция второго звена также будет сдвинута. Позиции соответствующих аминокислот относительно аминокислотной последовательности I-CreI также могут быть идентифицированы посредством определения оптимального выравнивания, которое описано ниже. Необходимо понимать, что в одноцепочечной переконструированной мегануклеазе порядок звеньев не имеет значения, т.е. находится ли упомянутое выше звено 1 и 2 в самом деле внутри данного порядка в единственной аминокислотной цепи или звено 2 предшествует звену один в единственной аминокислотной цепи не имеет значения для того, чтобы два объединенных звена были в состоянии узнавать намеченную последовательность.

Переконструированные мегануклеазы, подходящие для изобретения, могут содержать аминокислотную последовательность, которая представлена в SEQ ID NO: 5 и 6 (мономерные звенья, которые могут расщеплять сайт узнавания в виде гетеродимера) или могут содержать аминокислотную последовательность, которая представлена в SEQ ID NO: 18 (одноцепочечная мегануклеаза, содержащая два звена, представленные аминокислотами от 1 до 167 и от 208 до 362, соответственно, связанные линкерной последовательностью, представленной аминокислотами от 168 до 205), или могут содержать аминокислотную последовательность, содержащую аминокислотную последовательность SEQ ID NO: 18 от 1 до 167 и от 206 до 362 (соответственно звено 1 и 2 одноцепочечной мегануклеазы без линкера).

Общепризнанно, переконструированная мегануклеаза (мегануклеазы) может быть предоставлена посредством экспрессии экспрессируемого растением рекомбинантного гена (генов), кодирующего подобную мегануклеазу (мегануклеазы). С этой целью, область ДНК, содержащая нуклеотидную последовательность, кодирующую переконструированную мегануклеазу или мономерное звено мегануклеазы, может быть функционально связана с экспрессируемым растением промотором и областью ДНК, вовлеченных в терминацию транскрипции и полиаденилирование, и интродуцированных в растение или растительные клетки. Рекомбинантный ген (гены), кодирующий переконструированную мегануклеазу (мегануклеазы), может быть интродуцирован временно или стабильно.

Для целей изобретения, термин "действующий в растении промотор" и "экспрессируемый растением промотор" подразумевает промотор, который в состоянии управлять транскрипцией в растении, растительной ткани, органе растения, части растения или растительной клетке. Он включает в себя любой промотор растительного происхождения, но также любой промотор нерастительного происхождения, который в состоянии управлять транскрипцией в растительной клетке.

Промоторами, которые могут быть использованы в данном аспекте, являются конститутивные промоторы, такие как промотор 35S транскрипта вируса мозаики цветной капусты (CaMV) (Hapster et al.1988, Mol. Gen. Genet. 212: 182-190), 19S промотор CaMV (Патент США NO: 5352605; WO 84/02913; Benfey et al. 1989, EMBO J. 8:2195-2202), промотор № 4 или № 7 вируса клевера подземного (WO 96/06932), небольшой субъединичный промотор Rubisco (Патент США № 4962028), убиквитиновый промотор (Holtorf et al. 1995, Plant Mol. Biol. 29:637-649), промоторы гена T-ДНК, такие как промоторы октопин-синтазы (OCS) и нопалин-синтазы (NOS) из Agrobacterium, и дополнительные промоторы генов, конститутивная экспрессия которых в растениях известна квалифицированным специалистам в данной области.

Дополнительными промоторами, которые могут быть использованы в данном аспекте, являются ткань-специфические или орган-специфические промоторы, предпочтительно семена-специфические промоторы, такие как промотор 2S альбумина (Joseffson et al. 1987, J. Biol. Chem. 262:12196-12201), промотор фазеолина (Патент США № 5504200; Bustos et al. 1989, Plant Cell l.(9):839-53), промотор легумина (Shirsat et al. 1989, Mol. Gen. Genet. 215(2):326-331), промотор "неизвестного белка семян" (USP) (Baumlein et al. 1991, Mol. Gen. Genet. 225(3):459-67), промотор напина (Патент США № 5608152; Stalberg et al. 1996, Planta 199:515-519), промотор олеозина Arabidopsis (WO 98/45461), Brassica Bce4 промотор (WO 91/13980) и дополнительные промоторы генов, семена-специфическая экспрессия которых в растениях известна квалифицированным специалистам в данной области.

Другими промоторами, которые могут быть использованы, являются ткань-специфические или орган-специфические промоторы, наподобие специфических для примордия промоторов (An et al. 1996, Plant Cell 8: 15-30), специфических для стеблей промоторов (Keller et al. 1988, EMBO J. 7(12): 3625-3633), специфических для листьев промоторов (Hudspeth et al. 1989, Plant Mol. Biol. 12: 579-589), мезофил-специфических промоторов (таких как светоиндуцируемые промоторы Rubisco), специфических для корней промоторов (Keller et al. 1989, Genes Dev. 3: 1639-1646), специфических для клубней промоторов (Keil et al. 1989, EMBO J. 8(5): 1323-1330), специфических для сосудистой ткани промоторов (Peleman et al. 1989, Gene 84: 359-369), специфических для тычинок промоторов (WO 89/10396, WO 92/13956), специфических для растрескиваемой зоны промоторов (WO 97/13865) и тому подобное.

Нуклеотидные последовательности, кодирующие переконструированные мегануклеазы, подходящие для изобретения, могут содержать нуклеотидную последовательность SEQ ID NO: 4 от нуклеотидной позиции 2004 до нуклеотидной позиции 2525 или 2522 или нуклеотидную последовательность SEQ ID NO: 4 от нуклеотидной позиции 4885 до нуклеотидной позиции 5405 или 5403. Для облегчения клонирования и других технологий рекомбинантных ДНК, может быть предпочтительным включение функционального для растений интрона в область, кодирующую мегануклеазу, в частности одноцепочечную мегануклеазу. Подобный интрон может, например, содержать нуклеотидную последовательность SEQ ID NO: 17 от nt позиции 1606 до 1794.

Область ДНК, кодирующая переконструированную мегануклеазу, может быть оптимизирована для экспрессии в растении посредством адаптации содержимого GC, частоты использования кодона, устранения нежелательных нуклеотидных последовательностей. кодирующая область может быть дополнительно оптимизирована для экспрессии в растениях, и синтетическая кодирующая область может иметь нуклеотидную последовательность, которая была сконструирована с возможностью соответствия следующим критериям:

a) нуклеотидная последовательность кодирует функциональную переконструированную хоминг-эндонуклеазу, как описано в данной заявке;

b) нуклеотидная последовательность имеет содержимое GC, составляющее от приблизительно 50% до приблизительно 60%;

c) нуклеотидная последовательность не содержит нуклеотидную последовательность, выбранную из группы, состоящей из GATAAT, TATAAA, AATATA, AATATT, GATAAA, AATGAA, AATAAG, AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA и CATAAA;

d) нуклеотид не содержит нуклеотидную последовательность, выбранную из группы, состоящей из CCAAT, ATTGG, GCAAT и ATTGC;

e) нуклеотидная последовательность не содержит последовательность, выбранную из группы, состоящей из ATTTA, AAGGT, AGGTA, GGTA или GCAGG;

f) нуклеотидная последовательность не содержит GC удлинение, состоящее из 7 последовательных нуклеотидов, выбранных из группы G или C;

g) нуклеотидная последовательность не содержит AT удли