Создание гаплоидных растений и усовершенствование селекции растений

Иллюстрации

Показать все

Изобретение относится к области биохимии, в частности к трансгенному растению для получения гаплоидного потомства. Также раскрыта выделенная экспрессирующая нуклеотидная конструкция, содержащая промотор, функционально соединенный с полинуклеотидом, кодирующем полипептид, где указанный полипептид содержит гетерологичную аминокислотную последовательность из по меньшей мере 5 аминокислот, соединенную с хвостовым доменом гистона, соединенным с N-концом белка, содержащего домен гистоновой складки CENH3, где гетерологичная аминокислотная последовательность гетерологична домену гистоновой складки CENH3, или хвостовой домен гистона, соединенный с N-концом белка, содержащего домен гистоновой складки CENH3, где хвостовой домен гистона гетерологичен домену гистоновой складки CENH3. Изобретение также относится к способу получения растений, которые характеризуются половиной плоидности родительского растения, экспрессирующего эндогенный белок CENH3, а также к способу получения трансгенных растений. Изобретение позволяет эффективно получать гаплоидное потомство. 4 н. и 15 з.п. ф-лы, 1 ил., 4 табл., 2 пр.

Реферат

Перекрестная ссылка на родственные патентные заявки

Настоящая заявка претендует на приоритет от предварительной заявки на патент США N61/248996, поданной 6 октября 2009 г., которая включена путем ссылки.

Уровень техники

Хотя программы по выведению растений по всему миру проделали значительный прогресс, произведя новые сорта культурных растений с большей устойчивостью к болезням, лучшей урожайностью и другими полезными характеристиками, селекция в целом зависит от скрининга множества растений для идентификации новых желательных характеристик. Зачастую нужно за несколько лет вырастить и оценить очень большое количество потомков от скрещивания для того, чтобы отобрать одно или несколько растений с желательной комбинацией признаков.

При стандартной селекции диплоидных растений зачастую требуется проводить скрининг и обратное скрещивание большого числа растений, чтобы получить нужный генотип. Одно из решений проблемы скрининга большого числа потомков заключается в получении гаплоидных растений, хромосомы которых можно удвоить с помощью колхицина или другим способом и незамедлительно получить гомозиготные, дигаплоидные растения.

Таким образом, заметного улучшения в экономике селекции можно достичь путем получения дигаплоидов, так как эффективность селекции и других процедур можно заметно улучшить при использовании чистокровного (гомозиготного) потомства. По системе получения дигаплоидов гомозиготность достигается за одно поколение. При этом производитель может исключить многочисленные циклы инбридинга, необходимые при обычных способах для достижения практического уровня гомозиготности. На самом деле настоящая гомозиготность по всем признакам вообще недостижима при обычных способах селекции.

Сущность изобретения

Настоящим изобретением предусмотрены новые способы получения гаплоидных организмов.

В некоторых воплощениях изобретением предусмотрены трансгенные растения, содержащие экспрессионную кассету для гетерологичного трансгена, причем экспрессионная кассета содержит промотор, функционально связанный с полинуклеотидом, кодирующим рекомбинантно измененный полипептид CENH3, CENPC, MIS 12, NDC80 или NUF2, при этом, если рекомбинантно измененный полипептид экспрессируется в первом растении, содержащем соответствующий инактивированный эндогенный ген CENH3, CENPC, MIS 12, NDC80 или NUF2, и первое растение подвергается скрещиванию с растением дикого типа, то по меньшей мере 0,1% полученного потомства будет гаплоидным.

В некоторых воплощениях у растения один или два аллеля эндогенной геномной кодирующей последовательности CENH3, CENPC, MIS 12, NDC80 или NUF2 инактивированы или нокаутированы. В некоторых воплощениях все аллели эндогенной геномной кодирующей последовательности CENH3, CENPC, MIS 12, NDC80 или NUF2 растения инактивированы или нокаутированы. В некоторых воплощениях растения при скрещивании с растением дикого типа дают по меньшей мере 0,1% (или же 0,5, 1, 2, 5, 10, 20% или больше) гаплоидного потомства.

В некоторых воплощениях полипептид является рекомбинантно измененным полипептидом CENH3. В некоторых воплощениях полипептид содержит гетерологичную аминокислотную последовательность из по меньшей мере 5 аминокислот, соединенную с белком, содержащим домен гистоновой складки CENH3, причем эта аминокислотная последовательность гетерологична домену гистоновой складки CENH3. В некоторых воплощениях гетерологичная последовательность непосредственно соединяется с доменом гистоновой складки CENH3 и в полипептиде отсутствует хвостовой домен CENH3. В некоторых воплощениях гетерологичная аминокислотная последовательность соединяется с доменом гистоновой складки CENH3 через промежуточную белковую последовательность. В некоторых воплощениях промежуточная белковая последовательность содержит хвостовой домен не CENH3, а другого гистона НЗ. В некоторых воплощениях хвостовой домен другого гистона НЗ, чем CENH3, содержит аминокислотную последовательность, которая по меньшей мере на 70% идентична SEQ ID NO: 95 или ее фрагменту длиной по меньшей мере в 20 аминокислот.

В некоторых воплощениях промежуточная белковая последовательность содержит хвостовой домен CENH3. В некоторых воплощениях промежуточная белковая последовательность содержит хвостовой домен гистона НЗ и гетерологичный хвостовой домен гистона CENH3. В некоторых воплощениях хвостовой домен CENH3 гетерологичен домену гистоновой складки CENH3.

В некоторых воплощениях гетерологичная аминокислотная последовательность составляет по меньшей мере 10 аминокислот.В некоторых воплощениях промежуточная белковая последовательность содержит хвостовой домен гистона НЗ и гетерологичный хвостовой домен гистона CENH3, а гетерологичная аминокислотная последовательность содержит зеленый флуоресцентный белок. В некоторых воплощениях гетерологичная аминокислотная последовательность разрушает центромеры. В некоторых воплощениях домен гистоновой складки CENH3 выбирается из группы, состоящей из SEQ ID NO: 49-94.

В некоторых воплощениях полипептид содержит хвостовой другой домен, чем домен CENH3, соединенный с доменом гистоновой складки CENH3.

В некоторых воплощениях полипептид содержит домен гистоновой складки CENH3 и укороченный хвостовой домен CENH3, при этом N-конец хвостового домена укорочен относительно эндогенного хвостового домена растения. В некоторых воплощениях в укороченном хвостовом домене CENH3 отсутствуют три или больше N-концевых аминокислот эндогенного хвостового домена. В некоторых воплощениях гетерологичная аминокислотная последовательность соединяется с N-концом укороченного хвостового домена. В некоторых воплощениях гетерологичная аминокислотная последовательность имеет длину по меньшей мере в 10 аминокислот.В некоторых воплощениях гетерологичная аминокислотная последовательность содержит зеленый флуоресцентный белок. В некоторых воплощениях гетерологичная аминокислотная последовательность разрушает центромеры. В некоторых воплощениях домен гистоновой складки CENH3 выбирается из группы, состоящей из SEQ ID NOs: 49-94.

В некоторых воплощениях полипептид представляет собой рекомбинантно измененный полипептид CENPC, MIS 12, NDC80 или NUF2.

Настоящим изобретением также предусмотрена выделенная нуклеиновая кислота, содержащая полинуклеотид, кодирующий полипептид, причем полипептид содержит:

хвостовой домен не из CENH3, соединенный с доменом гистоновой складки CENH3; или

укороченный хвостовой домен CENH3, соединенный с доменом гистоновой складки CENH3, причем укорочен N-конец хвостового домена.

Настоящим изобретением также предусмотрены растения, содержащие молчащий ген CENH3 или одну или две копии аллеля нокаутированного, инактивированного или мутированного эндогенного гена CENH3.

Настоящим изобретением также предусмотрен способ получения гаплоидных растений, который включает:

скрещивание растения, экспрессирующего эндогенный белок CENH3, с трансгенным растением, содержащим экспрессионную кассету для гетерологичного трансгена, причем экспрессионная кассета содержит промотор, функционально связанный с полинуклеотидом, кодирующим рекомбинантно измененный полипептид CENH3, CENPC, MIS 12, NDC80 или NUF2, при этом, если рекомбинантно измененный полипептид экспрессируется в первом растении, содержащем соответствующий инактивированный эндогенный ген CENH3, CENPC, MIS 12, NDC80 или NUF2, и первое растение подвергается скрещиванию с растением дикого типа, то по меньшей мере 0,1% полученного потомства будет гаплоидным; и

отбор гаплоидного потомства F1, полученного в результате скрещивания.

В некоторых воплощениях растение, экспрессирующее эндогенный белок CENH3, является опылителем (донором пыльцы) при скрещивании.

В некоторых воплощениях растение, экспрессирующее эндогенный белок CENH3, является опыляемым (донором семяпочки) при скрещивании.

В некоторых воплощениях способ дополнительно включает превращение по меньшей мере одного отобранного гаплоидного растения в дигаплоид.

Способ получения трансгенных растений, содержащих экспрессионную кассету для гетерологичного трансгена, включающую промотор, функционально связанный с полинуклеотидом, кодирующим рекомбинантно измененный полипептид CENH3, CENPC, MIS 12, NDC80 или NUF2, при этом, если рекомбинантно измененный полипептид экспрессируется в первом растении, содержащем соответствующий инактивированный эндогенный ген CENH3, CENPC, MIS 12, NDC80 или NUF2, и первое растение подвергается скрещиванию с растением дикого типа, то по меньшей мере 0,1% полученного потомства будет гаплоидным, причем способ включает:

трансформирование растительных клеток нуклеиновой кислотой, содержащей экспрессионную кассету; и

отбор трансформантов, содержащих нуклеиновую кислоту, получая при этом растение.

В некоторых воплощениях настоящим изобретением предусмотрен выделенный полинуклеотид, кодирующий полипептид, причем полипептид содержит:

аминокислотную последовательность по меньшей мере из 5 аминокислот, соединенную с белком, содержащим домен гистоновой складки CENH3, при этом аминокислотная последовательность гетерологична домену гистоновой складки CENH3; или

белок, содержащий домен гистоновой складки CENH3 и укороченный хвостовой домен CENH3, причем укорочен N-конец хвостового домена.

В некоторых воплощениях гетерологичная аминокислотная последовательность непосредственно соединяется с доменом гистоновой складки CENH3. В некоторых воплощениях у полипептида отсутствует хвостовой домен CENH3.

В некоторых воплощениях гетерологичная аминокислотная последовательность соединяется с доменом гистоновой складки через промежуточную белковую последовательность. В некоторых воплощениях промежуточная белковая последовательность содержит хвостовой домен не CENH3, а другого гистона НЗ. В некоторых воплощениях промежуточная белковая последовательность содержит хвостовой домен CENH3. В некоторых воплощениях хвостовой домен CENH3 гетерологичен домену гистоновой складки CENH3. В некоторых воплощениях хвостовой домен другого гистона НЗ, чем CENH3, содержит аминокислотную последовательность, которая по меньшей мере на 70% идентичную SEQ ID NO: 95, или ее фрагмент длиной по меньшей мере в 20 аминокислот. В некоторых воплощениях промежуточная белковая последовательность содержит хвостовой домен гистона НЗ и хвостовой домен гетерологичного гистона CENH3.

В некоторых воплощениях гетерологичная аминокислотная последовательность имеет длину по меньшей мере в 3, 5, 10, 15, 20, 30 или 50 аминокислот, причем у нее необязательно отсутствует фиксированная вторичная структура.

В некоторых воплощениях гетерологичная аминокислотная последовательность содержит зеленый флуоресцентный белок.

В некоторых воплощениях гетерологичная аминокислотная последовательность разрушает центромеры.

В некоторых воплощениях домен гистоновой складки CENH3 выбирается из группы, состоящей из SEQ ID NOs: 49-94.

В некоторых воплощениях полипептид включает белок, содержащий домен гистоновой складки CENH3 и укороченный хвостовой домен CENH3, причем укорочен N-конец хвостового домена.

В некоторых воплощениях в укороченном хвостовом домене CENH3 отсутствует по меньшей мере 1, 2, 3, 4, 5, 6, 10, 15 или 20 N-концевых аминокислот эндогенного хвостового домена. В некоторых воплощениях гетерологичная аминокислотная последовательность соединяется N-концом укороченного хвостового домена. В некоторых воплощениях гетерологичная аминокислотная последовательность имеет длину по меньшей мере в 3, 5, 10, 15, 20, 30 или 50 аминокислот. В некоторых воплощениях гетерологичная аминокислотная последовательность содержит зеленый флуоресцентный белок. В некоторых воплощениях гетерологичная аминокислотная последовательность разрушает центромеры.

В некоторых воплощениях домен гистоновой складки CENH3 выбирается из группы, состоящей из SEQ ID NOs: 49-94.

Настоящим изобретением также предусмотрена экспрессионная кассета, содержащая любой из перечисленных выше полинуклеотидов, причем экспрессионная кассета содержит промотор, функционально связанный с полинуклеотидом, кодирующим полипептид. В некоторых воплощениях изобретением предусмотрен вектор, содержащий экспрессионную кассету.

В некоторых воплощениях изобретением предусмотрено растение, содержащее экспрессионную кассету.

В некоторых воплощениях гетерологичный хвостовой домен содержит хвостовой домен гистона НЗ или хвостовой домен гетерологичного гистона CENH3.

В некоторых воплощениях полипептид содержит хвостовой домен гистона НЗ и хвостовой домен гистона CENH3.

В некоторых воплощениях растение содержит молчащий ген CENH3 либо одну или две копии аллеля нокаутированного или мутированного эндогенного гена CENH3.

В некоторых воплощениях экспрессионная кассета встраивается в хромосому растения.

Настоящим изобретением также предусмотрено растение, содержащее молчащий ген CENH3 либо одну или две копии аллеля нокаутированного или мутированного эндогенного гена CENH3.

Настоящим изобретением также предусмотрен способ получения гаплоидных растений. В некоторых воплощениях способ включает скрещивание растения, экспрессирующего эндогенный белок CENH3, с растением, описанным выше (например, экспрессирующим белок tailswap); и отбор гаплоидного потомства F1, полученного от скрещивания.

В некоторых воплощениях растение, экспрессирующее эндогенный белок CENH3, является опылителем (донором пыльцы) при скрещивании.

В некоторых воплощениях растение, экспрессирующее эндогенный CENH3 белок, является опыляемым (донором семяпочки) при скрещивании.

В некоторых воплощениях способ дополнительно содержит превращение по меньшей мере одного отобранного гаплоидного растения в дигаплоид.

Другие аспекты изобретения станут понятными из приведенного дальнейшего текста.

Определения

"Эндогенная" последовательность гена или белка означает не рекомбинантную последовательность организма в том виде, как она присутствует в организме до вызванной человеком мутации последовательности. "Мутированная" последовательность означает измененную человеком последовательность. Примеры вызванных человеком мутаций включают воздействие на организм высокой дозы химического, радиологического или инсерционного мутагена в целях селекции мутантов, а также рекомбинантные изменения последовательности. Примеры вызванных человеком рекомбинантных изменений могут включать, например, слияния, вставки, делеции и/или изменения последовательности.

Термин "промотор" обозначает участки или последовательности, расположенные до и/или после начала транскрипции и участвующие в распознавании и связывания РНК-полимеразы и других белков для инициации транскрипции. "Растительный промотор" есть такой промотор, который способен инициировать транскрипцию в растительных клетках. Растительный промотор может представлять собой, хотя и необязательно, последовательность нуклеиновой кислоты, исходно выделенную из растения.

Термин "функционально связанный" обозначает функциональную связь между последовательностью, которая контролирует экспрессию нуклеиновой кислоты (как-то промотор или набор сайтов связывания транскрипционных факторов) и последовательностью второй нуклеиновой кислоты, причем последовательность, которая контролирует экспрессию направляет транскрипцию нуклеиновой кислоты, соответствующей второй последовательности.

Термин "растение" включает целые растения, отдельные вегетативные органы/ структуры (например, листья, стебли и клубни), корни, цветки и цветковые органы/структуры (например, прицветники, чашелистики, лепестки, тычинки, плодолистики, пыльники и семяпочки), семена (включая зародыш, эндосперму и семенную оболочку) и плоды (зрелую завязь), растительные ткани (например, проводящую ткань, основную паренхиму и др.) и клетки (например, замыкающие клетки, яйцеклетки, трихомы и др.) и их потомство. Класс растений, которые можно использовать в способе изобретения, в общем так же обширен, как и класс высших и низших растений, поддающихся методам трансформации, включая покрытосемянные (однодольные и двудольные растения), голосемянные, папоротники и многоклеточные водоросли. Сюда входят растения разного уровня плоидности, включая анеуплоидные, полиплоидные, диплоидные, гаплоидные и гемизиготные.

Полинуклеотидная или полипептидная последовательность "гетерологична" организму или второй последовательности, если она происходит из другого вида, а если из того же вида, то она модифицирована от своей первоначальной формы. Например, если промотор функционально связан с гетерологичной кодирующей последовательностью, то кодирующая последовательность взята из другого вида чем тот, из которого был получен промотор, а если из того же вида, то кодирующая последовательность не связана естественным образом с промотором (например, генетически сконструированная кодирующая последовательность либо аллель из другого экотипа или разновидности). В другом примере хвостовой домен CENH3 из первого вида гетерологичен домену гистоновой складки CENH3 из второго вида.

"Рекомбинантный" означает созданный человеком полинуклеотид либо копию или комплемент созданного человеком полинуклеотида. Например, рекомбинантная экспрессионная кассета, содержащая промотор, функционально связанный со вторым полинуклеотидом, может включать промотор, гетерологичный второму полинуклеотиду в результате действий человека (например, методами, описанными в Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989) или Current Protocols in Molecular Biology, vol. 1-3, John Wiley & Sons, Inc. (1994-1998). В другом примере рекомбинантная экспрессионная кассета может содержать полинуклеотиды, скомбинированные таким образом, что их исключительно трудно найти в природе. К примеру, созданные человеком сайты рестрикции или последовательности плазмидных векторов могут фланкировать или отделять промотор от второго полинуклеотида. Специалистам в данной области известно, что полинуклеотиды могут быть созданы множеством способов и не ограничиваются вышеприведенными примерами.

Термин "трансген" известен в данной области и обозначает гетерологичную нуклеиновую кислоту, введенную в клетку человеком методами молекулярной обработки клеточного генома (например, методом молекулярной трансформации). При этом "трансгенное растение" представляет собой растение, содержащее трансген, т.е. это генетически модифицированное растение. Трансгенным растением может быть исходное растение, в которое вводился трансген, а также его потомство, в геноме которого содержится трансген.

Термин "соответствующий" в настоящем изобретении означает то же самое, что и "соответственный". Например, если говорится, что растение содержит рекомбинантно измененную копию белка, выбранного из А, В и С, то растение также содержит "соответствующую" мутантную эндогенную копию гена, выбранного из генов, кодирующих А, В или С, а если растение содержит рекомбинантно измененный белок А, то соответствующая мутантная эндогенная копия также будет А. С другой стороны, если растение содержит рекомбинантно измененный белок В, то соответствующая мутантная эндогенная копия также будет В и т.д.

Выражение "нуклеиновая кислота" или "полинуклеотидная последовательность" относится к одноцепочечным или двухцепочечным полимерам дезоксирибонуклеотидных или рибонуклеотидных оснований, считываемых от 5' к 3' концу. Нуклеиновые кислоты также могут включать и такие модифицированные нуклеотиды, которые позволяют правильное считывание их полимеразой и/или образование двухцепочечных дуплексов и не изменяют существенно экспрессию полипептида, кодируемого этой нуклеиновой кислотой.

Выражение "последовательность нуклеиновой кислоты, кодирующей" относится к нуклеиновой кислоте, направляющей экспрессию определенного белка или пептида. Последовательности нуклеиновой кислоты включают как последовательность нити ДНК, транскрибируемой в РНК, так и последовательность РНК, транслируемой в белок. Последовательности нуклеиновой кислоты включают как последовательности нуклеиновой кислоты полной длины, так и неполные последовательности нуклеиновой кислоты, полученные из полноразмерных последовательностей. Следует также иметь в виду, что последовательность включает вырожденные кодоны природной последовательности или же последовательности, которые могут вводиться для обеспечения предпочтительности кодонов в определенных клетках хозяина.

Выражение "клетки хозяина" относится к клеткам из любого организма. Типичные клетки хозяина происходят из растений, бактерий, дрожжей, грибов, насекомых или других животных. Методы введения полинуклеотидных последовательностей в различные типы клеток хозяина хорошо известны в данной области.

"Экспрессионная кассета" означает конструкцию из нуклеиновой кислоты, которая при введении в клетки хозяина (например, растительные клетки), вызывает транскрипцию и/или трансляцию РНК или полипептида, соответственно. Экспрессионная кассета может вызывать транскрипцию без трансляции, к примеру, когда транскрипции подвергается миРНК или другая не кодирующая белок РНК.

Две последовательности нуклеиновой кислоты или полипептидов считаются - "идентичными", если последовательность нуклеотидов или аминокислотных остатков, соответственно, в двух последовательностях будет одинаковой при выравнивании их на максимальное соответствие, как описано ниже. Термин "комплементарная" означает то, что данная последовательность комплементарна всей или части последовательности контрольного полинуклеотида.

Примерами алгоритмов, подходящих для определения степени идентичности последовательностей и сходства последовательностей, являются алгоритмы BLAST и BLAST 2.0, описанные в Altschul et al., Nuc. Acids Res. 25:3389-3402 (1977), и Altschul et al., J. Mol. Biol. 215:403-410 (1990), соответственно. Программное обеспечение для анализа методом BLAST общедоступно в сети через National Center for Biotechnology Information (www.ncbi.nlm.nih.gov/). Этот алгоритм включает сначала идентификацию получивших высокие баллы пар последовательностей (HSPs) путем идентификации коротких слов длиной W во введенной последовательности, которые либо совпадают, либо удовлетворяют некоему положительному значению порогового показателя Т при выравнивании со словом такой же длины в последовательности из базы данных. Т именуется пороговым показателя близости слов (Altschul et al., supra). Эти найденные близкие слова служат затравками для запуска поисков содержащих их более длинных HSPs. Найденные слова подвергаются удлинению в обоих направлениях вдоль каждой последовательности до тех пор, пока повышается кумулятивный показатель совмещения. Кумулятивный показатель рассчитывается, для нуклеотидных последовательностей, с помощью параметров М (награды за пару совпадающих остатков; она всегда >0) и N (штрафа за несовпадение остатков; он всегда <0). Для расчета кумулятивного показателя для аминокислотных последовательностей используется счетная матрица. Удлинение попавшихся слов в каждом направлении прекращается, когда: кумулятивный показатель совмещения падает на величину Х от своего максимального достигнутого уровня;

кумулятивный показатель доходит до нуля или меньше нуля вследствие накопления дающих отрицательные баллы выравниваний остатков; или по достижении конца любой из последовательностей. Параметры W, Т и Х алгоритма BLAST определяют чувствительность и быстроту выравнивания. В программе BLASTN (для нуклеотидных последовательностей) по умолчанию используется длина слов (W)=11, ожидание (Е)=10, М=5, N=-4 и сравнение обеих нитей. Для аминокислотных последовательностей в программе BLASTP по умолчанию используется длина слов (W)=3, ожидание (Е)=10 и счетная матрица BLOSUM62 (см. Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89: 10915, (1989)) совмещения (В)=50, ожидание (Е)=10, М=5, N=-4 и сравнение обеих нитей.

Алгоритм BLAST также осуществляет статистический анализ сходства между двумя последовательностями (например, см. Karlin and Altschul, Proc. Natl. Acad. Sci. USA 90:5873-5787, (1993)). Одной из мер сходства, предусмотренных алгоритмом BLAST, является наименьшая вероятность суммы (P(N)), которая служит показателем вероятности того, что совпадение между двумя нуклеотидными или аминокислотными последовательностями произойдет случайным образом. Например, нуклеиновая кислота считается сходной с контрольной последовательностью, если при сравнении данной нуклеиновой кислоты с контрольной нуклеиновой кислотой наименьшая вероятность суммы составляет менее 0,2, более предпочтительно менее 0,01 и наиболее предпочтительно менее 0,001.

"Степень идентичности последовательностей" определяется путем сравнения двух оптимально выровненных последовательностей по окошку сравнения, при этом часть последовательности полинуклеотида в окошке сравнения может содержать вставки или делеции (т.е. пробелы) по сравнению с контрольной последовательностью (не содержащей вставок или делеции) для оптимального совмещения этих двух последовательностей. Степень вычисляется в процентах путем определения числа положений, по которым в обеих последовательностях находятся идентичные основания нуклеиновых кислот или аминокислотные остатки, получая число совпадающих положений, деления числа совпадающих положений на общее число положений в окошке сравнения и умножения результата на 100, получая степень идентичности последовательностей в процентах.

Термин "существенная идентичность" последовательностей полинуклеотидов означает то, что полинуклеотид содержит последовательность, которая по меньшей мере на 25% идентична заданной контрольной последовательности. С другой стороны, степень идентичности может составлять любое целое число от 25% до 100%, к примеру, по меньшей мере: 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% или 99% при сравнении с контрольной последовательностью с помощью описанных здесь программ, предпочтительно программы BLAST с использованием стандартных параметров, как описано ниже. Специалистам должно быть известно, что приведенные выше значения степени идентичности можно соответствующим образом корректировать для определения идентичности соответствующих белков, кодируемых двумя последовательностями нуклеотидов, принимая во внимание вырожденность кодонов, сходство аминокислот, расположение рамки считывания и др. При этом существенная идентичность аминокислотных последовательностей обычно означает идентичность последовательностей по меньшей мере на 40%. Степень идентичности полипептидов может составлять любое целое число от 40% до 100%, к примеру, по меньшей мере 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% или 99%. В некоторых воплощениях "существенно сходными" являются полипептиды с такими близкими последовательностями, как отмечено выше, за исключением того, что остатки в положениях, не являющихся идентичными, могут отличаться консервативными заменами аминокислот. Консервативная замена аминокислот означает взаимозаменяемость остатков со сходными боковыми цепями. Например, группа аминокислот с алифатическими боковыми цепями представлена глицином, аланином, валином, лейцином и изолейцином;

группа аминокислот с алифатическими гидроксильными боковыми цепями представлена серином и треонином; группа аминокислот с амидосодержащими боковыми цепями представлена аспарагином и глутамином; группа аминокислот с ароматическими боковыми цепями представлена фенилаланином, тирозином и триптофаном; группа аминокислот с основными боковыми цепями представлена лизином, аргинином и гистидином; и группа аминокислот с серосодержащими боковыми цепями представлена цистеином и метионином. Типичные группы консервативных замен аминокислот: валин-лейцин-изолейцин, фенилаланин-тирозин, лизин-аргинин, аланин-валин, аспарагиновая кислота-глутаминовая кислота и аспарагин-глутамин.

Краткое описание фигур

На фиг.1 представлено выравнивание последовательностей различных белков CENH3 (Н3.3 A. thaliana=SEQ ID NO: 1; Н3.3 человека=SEQ ID NO: 2; С.albicans= SEQ ID NO: 106; человек=SEQ ID NO: 107; A. thaliana=SEQ № NO: 10; тополь= SEQ ID NO: 11; рис=SEQ ID NO: 108).

Раскрытие сущности изобретения

I. Введение

Настоящее изобретение основывается, частично, на неожиданном открытии того, что удаление эндогенного CENH3 в сочетании с экспрессией гетерологичного белка, содержащего измененный CENH3, приводит к появлению растений, обладающих полезными свойствами для селекции. Например, когда растение, у которого отсутствует эндогенный белок CENH3 и экспрессируется белок, содержащий (в направлении от N-конца к С-концу) тег GFP, хвостовой домен не CENH3 и домен гистоновой складки CENH3, подвергается скрещиванию с растением, содержащим эндогенный белок CENH3, то у части полученного потомства отсутствуют все хромосомы, полученные от родительского растения, экспрессирующего измененный вариант CENH3. Таким образом, изобретение позволяет получить гаплоидное потомство. Гаплоидные растения полезны, к примеру, для улучшения и ускорения селекции.

CENH3 является представителем кинетохорного комплекса - белковой структуры на хромосомах, к которой прикрепляются волокна митотического веретена во время деления клетки. Не намереваясь ограничивать рамки изобретения, полагаем, что наблюдаемые результаты частично обусловлены образованием такого кинетохорного белка, который действует слабее, чем у дикого типа, при этом образуются функциональные кинетохорные комплексы (к примеру, при митозе), но хромосомы плохо разделяются во время мейоза по сравнению с хромосомами, также содержащими кинетохорные комплексы дикого типа от другого родителя. При этом образуются функциональные кинетохорные комплексы, когда измененный белок является единственной изоформой в клетке, но хромосомы сравнительно плохо разделяются во время митоза, когда родитель с измененными кинетохорами скрещивается с родителем с кинетохорными комплексами дикого типа. Наряду с CENH3, другие кинетохорные белки включают, например, CENPC, MCM21, MIS12, NDC80 и NUF2. Соответственно, настоящим изобретением предусмотрены растения, грибы или животные (или их клетки), которые экспрессируют рекомбинантный мутантный кинетохорный белок (включая, без ограничения, CENH3, CENPC, MCM21, MIS 12, NDC80 и NUF2), который разрушает центромеры, и/или растения, грибы или животные (или их клетки), в которых по меньшей мере одна или обе копии аллеля эндогенного гена CENH3 нокаутированы, мутированы для снижения или устранения его функции или сделаны молчащими. Как разъясняется более подробно ниже, мутантный кинетохорный белок может быть подвергнут мутации многими разными способами, включая, без ограничения, в виде белка "tailswap" (букв. поменяться хвостами), содержащего домен гистоновой складки CENH3 и гетерологичную N-концевую последовательность. Настоящим изобретением также предусмотрены способы получения гаплоидных растений путем скрещивания растений, экспрессирующих мутантный кинетохорный белок (включая, без ограничения, белок tailswap CENH3), но не экспрессирующих эндогенный белок CENH3, с растением, которое экспрессирует эндогенный белок CENH3.

II. Кинетохорные белки

А. Белки CENH3

Белки CENH3 - это хорошо изученный класс белков, которые являются вариантами гистоновых белков НЗ и которые являются специализированными белками, связанными с центромерами. Белки CENH3 характеризуются вариабельным хвостовым доменом, не образующим жесткую вторичную структуру, и консервативным доменом гистоновой складки, состоящим из трех а-спиральных участков, соединенных петлеобразными отрезками. Дополнительные структурные и функциональные свойства белков CENH3 можно найти, например, в Cooper et al., Mol Biol Evol. 21(9): 1712-8 (2004); Malik et al., Nat Struct Biol. 10(11):882-91 (2003); Black et al., Curr Opin Cell Biol. 20(1):91-100 (2008). Белки CENH3 входят в состав кинетохорного комплекса.

Идентифицирован широкий набор белков CENH3. Например, см. SEQ ID NOs: 1-48. Следует иметь в виду, что вышеприведенный список не является исчерпывающим и что имеются и другие последовательности CENH3 из геномных исследований или они могут быть идентифицированы из геномных баз данных или хорошо известными лабораторными методами. Например, если CENH3 определенного растения или другого вида организмов недоступен из баз данных, то его можно идентифицировать или клонировать последовательность гена CENH3 данного организма с помощью праймеров, которые необязательно являются вырожденными, на основе консервативных участков других известных белков CENH3.

В практике настоящего изобретения в общем применяются традиционные методы химии, биохимии, молекулярной биологии, клеточной биологии, генетики, иммунологии и фармакологии, в пределах компетенции специалистов. Такие методы полностью изложены в литературе. Например, см. Gennaro A.R., ed. (1990) Remington's Pharmaceutical Sciences, 18th ed. Mack Publishing Co.; Hardman J.G., Limbird L.E. and Oilman A.G., eds. (2001) The Pharmacological Basis of Therapeutics, 10th ed., McGraw-Hill Co.; Colowick S. et al., eds. Methods in Enzymology, Academic Press, Inc.; Weir D.M. and Blackwell C.C, eds. (1986) Handbook of Experimental Immunology, vols. I-IV, Blackwell Scientific Publications; Maniatis T. et al., eds. (1989) Molecular Cloning: A Laboratory Manual, 2nd edition, vols. I-III, Cold Spring Harbor Laboratory Press; Ausubel F.M. et al., eds. (1999) Short Protocols in Molecular Biology, 4th edition, John Wiley & Sons; Ream et al., eds. (1998) Molecular Biology Techniques: An Intensive Laboratory Course, Academic Press; Newton C.R. and Graham A., eds. (1997) PCR (Introduction to Biotechniques Series), 2nd ed. Springer Verlag.

i. Домен гистоновой складки CENH3

Как отмечено выше, домен гистоновой складки CENH3 является консервативным между белками CENH3 из разных видов. Домен гистоновой складки можно отличить по трем а-спиральным участкам, соединенным петлеобразными отрезками. Хотя известно, что точное местонахождение домена гистоновой складки отличается у белков CENH3 из других видов, но у эндогенного белка CENH3 (дикого типа) он может быть найден на N-конце. Таким образом, в некоторых воплощениях белок CENH3 можно идентифицировать в эндогенном белке по тому, что его N-концевой домен имеет существенное сходство (например, он идентичен по меньшей мере на 30%, 40%, 50%, 60%, 70%, 85%, 90%, 95% или больше) с любой из SEQ ID N0:s 49-94. На фиг.1 представлено выравнивание нескольких белков CENH3 и выделены консервативные зоны в домене гистоновой складки.

Граница между хвостовым доменом и доменом гистоновой складки у белков CENH3 находится в пределах или вблизи (т.е. в пределах 5,10, 15, 20 или 25 аминокислот от "Р") от консервативной последовательности PGTVAL (SEQ ID NO: 114).

Последовательность PGTVAL (SEQ ID NO: 114) отстоит на 81 аминокислоту от N-конца белка CENH3 Arabidopsis, хотя расстояние от N-конца у разных эндогенных белков CENH3 отличается. Например, см. перечень последовательностей. Так, в некоторых воплощениях область гистоновой складки в белках tailswap охватывает все С-концевые аминокислоты эндогенного белка CENH3 (или белка, имеющего существенное сходство с эндогенной последовательностью) вплоть до и включая PGTVAL (SEQ ID NO: 114). В SEQ ID NOs: 49-94 отражена эта возможность. В других воплощениях белки tailswap по изобретению могут содержать большую или меньшую часть последовательности CENH3. Например, в некоторых воплощениях белок tailswap включает С-концевую последовательность белка CENH3, но только до 5, 10, 15, 20 или 25 аминокислот в направлении С-конца от "Р" в консервативной последовательности PGTVAL (SEQ ID NO: 114). В некоторых воплощениях белок tailswap включает С-концевую последовательность белка CENH3, но только до 5,10,15,20 или 25 аминокислот в направлении N-конца от "Р" в консервативной последовательности PGTVAL (SEQ ID NO: 114).

ii. Хвостовой домен CENH3

Несмотря на то, что домен гистоновой складки CENH3 эволюционирует быстрее, чем у обычного НЗ, домены гистоновой складки CENH3 и НЗ все-таки выравниваются. Напротив, N-концевые хвостовые домены CENH3 сильно отличаются даже у близкородственных видов. Хвостовые домены гистонов (включая хвостовые домены CENH3) являются гибкими и бесструктурными, о чем свидетельствует отсутствие у них большой плотности электронов в структуре нуклеосом при определении методом рентгеновской кристаллографии (Luger et al.. Nature 389(6648): 251-60 (1997).

Hi. Мутантные белки CENH3

В белок CENH3 можно вводить любое число мутаций, получая мутантный (в том числе рекомбинантно измененный) белок CENH3, способный давать гаплоидные растения при экспрессии в растениях, не экспрессирующих или с подавленной экспрессией эндогенного белка CENH3, при этом трансгенное растение подвергается скрещиванию с растением, экспрессирующим белок CENH3 дикого типа. Активные мутантные белки CENH3 можно получить, к примеру, методом случайного мутагенеза, методом направленного мутагенеза одной или нескольких аминокислот, путем полной или частичной делеции домена белка, путем слияния с гетерологичными аминокислотными последовательностям