Слитый полипептид, способный к целенаправленному переносу к масляному телу, химерная днк-контрукция, экспрессирующая кассета

Реферат

 

Изобретение относится к генетической инженерии и может быть использовано для получения представляющего интерес белка в семенах растения. Предложена химерная ДНК-конструкция, включающая последовательность, кодирующую часть белка масляного тела - олеозина, которая определена как достаточная для обеспечения переноса к масляному телу, и последовательность, кодирующую предназначенный для синтеза в растении чужеродный белок, между которыми дополнительно может быть встроена последовательность, кодирующая сайт протеазного расщепления. Путем помещения указанной ДНК-конструкции под контроль промотора гена, в норме экспрессирующегося в семени растения, получена кассета экспрессии, которая использована для трансформации растительных клеток. Семена выраженного трансгенного растения использованы для получения представляющего интерес белка, синтезированного в виде белка слияния с олеозином. Накопление экспрессированного белка во фракции масляных тел существенно облегчает его выделение и очистку. 3 с. и 12 з.п.ф-лы, 7 ил., 2 табл.

Область изобретения Настоящее изобретение относится к рекомбинантному способу получения представляющих интерес протеинов, которые легко выделять из компонентов клеток хозяев. Способ иллюстрируется экспрессией представляющего интерес протеина в растениях, особенно в семенах в форме химерного пептида, содержащего протеин масляного тела и представляющий интерес протеин.

Предпосылки изобретения В растениях были экспрессированы различные протеины. Однако хотя и была продемонстрирована общая доступность осуществления экспрессии чужеродных протеинов в растениях, получение очищенных протеинов из таких источников имеет некоторые ограничения. Эти ограничения включают стадию очистки, необходимую для получения чистого протеина, практически не содержащего растительных материалов и продуктов разложения, которые могут образовываться в экстрактах, полученных в процессе очистки, когда полученные рекомбинантные протеины контактируют с водными буферами.

Растения, имеющие масличные семена, такие как соя, рапс, подсолнечник и ряд других видов растений, таких как кукуруза, морковь и т.д., хранят в своих семенах триглицериды. В растениях эти триглицериды выполняют роль источника энергии для прорастания семян и последующего роста сеянца. Триглицериды широко используют в качестве растительных масел в пище и пищевых продуктах, а также в некоторых областях промышленности.

Триглицериды не смешиваются с водой и выделяются за счет флотации на поверхности водных растворов или образуют небольшие глобулы или липосомы в виде суспензии в водной фазе. Такие глобулы естественно сливаются, если они не стабилизированы модифицированным поверхностным слоем. Такое слияние может привести к образованию суспензии из глобул случайного размера. В семенах же при сохранении триглицеридов масляные глобулы на деле представляют собой капсулированные липидные или масляные тела обычно одинакового размера. С поверхностью этих масляных тел ассоциированы полуфрагменты (half unit) мембран, усыпанные несколькими протеинами, которые обычно называют протеинами масляного тела.

По крайней мере, один класс протеинов масляного тела имеет несколько характеристик, которые существенно консервативны от вида к виду. Этот класс протеинов масляного тела называют "олеозинами". Гидрофильные N- и С- концы этих протеинов, по-видимому, совершенно различны, тогда как липофильные внутренние участки (центральное ядро), по-видимому, строго консервативны для различных видов. Олеозины прочно связаны с масляными телами, эта прочная связь с масляными телами может быть, в основном, связана с липофильным характером этих центральных ядер. Поэтому представляет интерес определение возможности использования таких протеинов масляного тела, как олеозины, для создания средств для выделения рекомбинантных протеинов из растительных материалов.

Известный уровень техники Продуцирование чужеродных (рекомбинантных) пептидов в растениях было исследовано с использованием различных подходов, включая транскрипционные слияния с применением сильного конститутивного растительного промотора (например, из вируса мозаики цветной капусты - Sijmons et al. (1990) Bio/Technology, 8: 217-221) и кодирование чужеродного протеина; транскрипционные слияния с органо-специфическими последовательностями (Radke et al. (1988) Theoret. Appl. Genet., 75:685-694); и трансляционные слияния, которые требуют последующего отщепления рекомбинантного протеина (Vander Kerkove et al. (1989) Bio/ Technology, 7:929-932). Чужеродные протеины, которые были экспрессированы в растительных клетках, включают активные протеины из бактерий (Fraley et al. (1983) Proc. Nat'l. Acad. Sci. USA, 80:4803-4807), животных (Misra and Gedamu (1989) Theor. Appl. Genet., 78:161-168), грибков и других видов растений (Fraley et al. (1983) Proc. Nat'l. Acad. Sci. USA, 80: 4803-4807).

Некоторые протеины, обычно маркеры интеграции, были экспрессированы ткане-специфическим образом, причем некоторые были экспрессированы в семенах (Sen Gupta et al. (1985) Proc. Nat'l. Acad. Sci. USA, 82:3320-3324); Radke et al. ( 1988) Theor. Appl. Genet., 75:685-694). Эти сообщения концентрируются специфически на использовании промоторов протеинов хранения семян как средства обеспечения специфической для семян экспрессии. Используя эти системы, Vanderkerkove et al. (1989) Bio/Technol., 7: 929-932, экспессировал очень ценный пептид (leu энкефалин) в семенах Arabidopsis thaliana and Brassica napus. Выход этих пептидов чрезвычайно низок, но он демонстрирует возможность экспрессии пептидного гормона животного в ткани растения. Олеозин кукурузы был экспрессирован в масляных телах семян Brassica napus трансформированных геном олеозина кукурузы. Этот ген был экспрессирован под контролем регуляторных элементов из гена Brassica, кодирующего напин (napin), основной протеин хранения семян. Как сообщается, временная регуляция и тканеспецифичность экспрессии правильны для промотора/терминатора гена напина. См. Lee et al., Proc. Nat'l. Acad. Sci. USA, (1991) 88:6181-6185.

Масляные глобулы, которые образуются в семенах, по-видимому, все одинакового размера, что указывает на их стабилизацию (Huang А.Н.С (1985) в Modern Meths. Plant Analysis v. 1:145-151 Springer-Verlag, Berlin). При более тщательном исследовании было обнаружено, что они представляют собой не просто масляные глобулы, а скорее масляные тела, окруженные мембраной. Такие масляные тела называли по разному электронные микроскописты: олеосомы, липидные тела и сферосомы (Gurr М.I., (1980) в The Biochemistry of Plants, 4:205-248, Acad. Press, Orlando, Pla). Были исследованы масляные тела нескольких видов, и пришли к выводу, что они заключены в необычные "полуфрагментарные" мембраны, которые представляют собой не классический липидный бислой, а скорее один амфофильный слой с гидрофобными группами с внутренней стороны и гидрофильными группами с внешней (Huang А. Н. С. (1985) в Modern Meths. Plant Analysis, vol. 1:145-151 Springer-Verlag, Berblin).

Анализ содержания липидных тел продемонстрировал, что помимо триглицеридов и материала мембран они содержат также несколько полипептидов/протеинов, связанных с поверхностью или полостью масляного тела (Bowman-Vance and Huang (1987), J. Biol. Chem. 262:11275-11279, Murphy et al. (1989) Biochem. J., 258: 285-293, Taylor et al. (1990) Planta, 181:18-26). Протеины масляных тел были идентифицированы для широкого круга таксономически различных видов (Moreau et al. (1980) Plant Physiol., 65: 1176-1180; Qu et al. (1986) Biochem. J. , 235:57-65) и было показано, что они расположены только в масляных телах, но не были обнаружены в органеллах растительных тканей. В Brassica napus (семена рапса) имеются, по крайней мере, три полипептида, связанные с масляными телами в развивающихся семенах Taylor et al. (1990), Planta, 181: 18-26). Количество и размеры протеинов, связанных с масляными телами, могут меняться от вида к виду. Так например, в кукурузе существуют два иммунологически различных класса полипептидов, обнаруженных в масляных телах (Bowman-Vance and Huang (1988) J. Biol. Chem. 263:1476-1481).

Было показано, что олеозины содержат участки чередующейся гидрофобности и гидрофильности (Bowman-Vance and Huang (1987) J. Biol. Chem., 262:11275-11279). Аминокислотные последовательные олеозинов из кукурузы, семян рапса и моркови были получены. См. Qu and Huang (1990) J. Biol. Chem. 265:2238-2243, Hatzopoulos et al (1990) Plant Cell., 2:457-467 соответственно. В таких семенах масличных, как рапс, олеозин может составлять от 8% (Taylor et al. (1990) Planta, 181: 19-26) до 20% (Murphy et al. (1989) Biochem. J., 258: 285-293) от полного содержания протеина в семенах. Столь высокое содержание сопоставимо с тем, что было обнаружено для многих протеинов хранения семян.

Сообщалось, что получены гены, кодирующие протеины масляных тел для двух видов: кукуруза (Zea mays, Bowman-Vance and Huang (1987) J. Biol. Chem. 262: 11275-11279; и Qu and Huang (1990), J.Biol.Chem., 265: 2238-2243) и морковь (Hatzopoulos et al. (1990) Plant Cell., 2:457-467).

Краткое содержание изобретения Предложены способы и композиции для осуществления этих способов получения пептидов, которые можно легко выделить из протеинов хозяев. Этот способ включает стадии получения химерной конструкции ДНК, которая включает последовательность, кодирующую специфическую последовательность масляного тела, содержащую кодирующую последовательность гена протеина масляного тела, специфического для семян, или последовательность, кодирующую, по крайней мере, участок гидрофобного ядра протеина масляного тела, и последовательность, кодирующую нужный пептид, из которых можно получить кассету экспрессии, содержащую химерную конструкцию ДНК; трансформация клеток хозяина кассетой экспрессии в условиях геномной интеграции; и выращивания полученного трансгенного растения до получения семян, в которых нужный полипептид экспрессирован как протеин слияния с олеозином.

Представляющий интерес полипептид можно очистить, выделяя масляные тела из клеток семян, разрушая масляные тела, так что при этом высвобождается протеин слияния. Затем протеины масляного тела легко отделяются от других протеинов и полученных из растений материалов за счет разделения фаз. При желании сайт расщепления может быть расположен, по крайней мере, перед N-концом или после С-конца представляющего интерес полипептида, что обеспечит возможность отщеплять полипептид слияния и выделять его за счет фазового разделения на составляющие его пептиды. Таким образом, создана система, обеспечивающая целенаправленный перенос химерного пептида за счет функциональности протеина его масляного тела к масляным телам, что в свою очередь позволяет быстро очистить представляющий интерес полипептид. Эта система получения находит применение при получении многих пептидов, например таких пептидов, которые обладают нужными фармацевтическими, энзиматическими, реологическими и адгезивными характеристиками.

В соответствии с настоящим изобретением предложен полипептид слияния, отличающийся тем, что может быть обеспечена его доставка к масляному телу, содержащий: а) первый пептид формулы (последовательность 1, см. в конце описания).

при условии, что указанный первый пептид отличается от полноразмерного природного 16Кb олеозина из моркови, или 18Кb или 16Кb олеозина из кукурузы, где аа25 представляет любую аминокислоту; аа26 представляет нейтральную алифатическую аминокислоту; аа31 представляет нейтральную незамещенную алифатическую аминокислоту, состоящую из 3-6 атомов углерода; аа33 представляет нейтральную незамещенную алифатическую аминокислоту, содержащую 3-6 атомов углерода; аа36 представляет нейтральную алифатическую незамещенную аминокислоту, содержащую 3-5 атомов углерода; аа37 представляет нейтральную незамещенную аминокислоту; аа39 представляет нейтральную алифатическую незамещенную аминокислоту; аа41 представляют нейтральную алифатическую незамещенную или оксизамещенную аминокислоту; аа44 представляет нейтральную алифатическую незамещенную или оксизамещенную аминокислоту; аа46 представляет нейтральную алифатическую незамещенную аминокислоту или оксизамещенную аминокислоту; аа47 представляет нейтральную алифатическую незамещенную аминокислоту; аа59 представляет нейтральную алифатическую или ароматическую незамещенную аминокислоту; аа76 представляет нейтральную алифатическую незамещенную или тиозамещенную аминокислоту; аа78 представляет нейтральную алифатическую незамещенную аминокислоту; аа83 представляет нейтральную алифатическую незамещенную или оксизамещенную аминокислоту; аа92 представляет нейтральную алифатическую аминокислоту с оксизамещением; аа96 представляет нейтральную алифатическую тиозамещенную аминокислоту или нейтральную ароматическую гетероциклическую аминокислоту; аа97 представляет нейтральную алифатическую незамещенную или тиозамещенную аминокислоту; аа98 представляет нейтральную алифатическую незамещенную аминокислоту или ароматическую оксизамещенную аминокислоту; аа99 представляет любую аминокислоту; аа100 представляет оксизамещенную аминокислоту, либо алифатическую, либо ароматическую; аа101 представляет нейтральную незамещенную алифатическую или ароматическую аминокислоту; слитый с b) вторым пептидом, при условии, что этот второй пептид отличается от части природного олеозинового протеина из Arabidopsia или Brassica.

В настоящем изобретении предложен также полипептид слияния, характеризуемый как способный осуществлять целенаправленный перенос к масляному телу, содержащий: а) первый пептид, выбранный из группы, состоящей из: (I) пептида, содержащего, по крайней мере, восемь последовательных аминокислот, включенных в аминокислотную последовательность 2, см. в конце описания.

(2) пептид, который кодируется ДНК последовательностью, идентифицированной с помощью олигонуклеотидного зонда, сконструированного на основе указанной аминокислотной последовательности (I), или ее фрагмента, при условии, что указанный первый пептид отличается от полноразмерного природного 16Кb олеозина из моркови или 18Кb или 16Кb олеозина из кукурузы, слитый с b) вторым пептидом, при условии, что указанный второй пептид отличается от части природного олеозинового протеина из Arabidopsis или Brassica.

Далее в настоящем изобретении предложена химерная ДНК конструкции, содержащая: а) первую ДНК последовательность, кодирующую олеозин или его часть, достаточную для обеспечения целенаправленного переноса к масляному телу, и b) вторую ДНК последовательность, кодирующую пептид, при условии, что указанный пептид отличается от части природного олеозинового протеина из Arabidopsis или Brassica.

Далее в настоящем изобретении предложена кассета экспрессии, содержащая: в качестве компонентов в направлении транскрипции: - регуляторную ДНК последовательность, содержащую достаточную часть участка 5' до сайта начала трансляции гена, экспрессируемого в семенах, для обеспечения экспрессии ДНК последовательности в семенах; - химерную ДНК последовательность, содержащую а) первую ДНК последовательность, кодирующую олеозин, или достаточную ее часть для обеспечения целенаправленного переноса к масляному телу, причем указанная ДНК последовательность включает, по крайней мере, один рестрикционный сайт, и b) вторую ДНК последовательность, кодирующую пептид, при условии, что указанный пептид отличается от природного олеозинового протеина из Arabidopsis или Brassica; и - участок окончания трансляции и транскрипции; где указанные компоненты операбельно связаны, а экспрессия указанной химерной последовательности ДНК регулируется указанной регуляторной ДНК последовательностью.

В настоящем изобретении предложена также кассета экспрессии, содержащая: - ген протеина масляного тела ( oil body protein = ОВР), который включает достаточную часть участка 5' до сайта начала трансляции для обеспечения экспрессии указанного гена в клетки семян и который включает, по крайней мере, один рестрикционный сайт между 5'-концом кодона инициации метионина и 5'-сигналом окончания трансляции указанного ОВР гена, и - ДНК последовательность, встроенную в указанный рестрикционный сайт в рамке считывания с указанным ОВР геном, где указанная ДНК последовательность кодирует пептид, который отличается от части нативного олеозинового протеина из Arabidopsis или Brassica.

В настоящем изобретении предложена также кассета экспрессии, содержащая: первую ДНК последовательность, кодирующую пептид, при условии, что указанный пептид отличается от части природного олеозиинового протеина из Arabidopsis или Brassica, встроенную в рамке считывания в ген протеина масляного тела, которая включает достаточную часть регуляторного участка 5' до сайта начала трансляции указанного ОВР гена для обеспечения экспрессии указанного гена в семенах, где указанная последовательность встроена по такому сайту указанного гена, чтобы быть экспрессированной под контролем указанного регуляторного участка.

В настоящем изобретении предложен способ достижения экспрессии целевого пептида в семенах, причем указанный способ включает трансформацию клеток растения-хозяина экспрессионной кассетой в условиях геномной интеграции, где указанная кассета экспрессии содержит в качестве компонентов в направлении транскрипции первую ДНК последовательность, содержащую достаточную часть участка 5' до сайта начала трансляции гена, экспрессируемого в семенах, для обеспечения экспрессии ДНК последовательности в семенах, вторую ДНК последовательность, кодирующую олеозин или достаточную его часть, для обеспечения нацеленного переноса к масляному телу, причем указанная вторая ДНК последовательность включает, по крайней мере, один природный или синтетический рестрикционный сайт, в который встроена в рамке считывания третья ДНК последовательность, кодирующая целевой пептид, при условии, что указанный пептид отличается от части природного олеозинового протеина из Arabidopsis или Brassica; и участок окончания трансляции и транскрипции; где указанные компоненты операбельно связаны, и экспрессия указанной второй ДНК последовательности регулируется указанной первой ДНК последовательностью, для обеспечения экспрессии в семенах.

В настоящем изобретении предложен способ получения очищенного целевого пептида, причем указанный способ включает: трансформацию клеток растения-хозяина ДНК конструкцией в условиях геномной интеграции, где указанная ДНК конструкция содержит первую ДНК последовательность, кодирующую целевой пептид, при условии, что указанный пептид отличается от части природного олеозинового протеина из Arabidopsis или Brassica, встроенную в считывающую рамку гена протеина масляного тела, которая содержит достаточную часть регуляторного участка 5' до сайта начала трансляции указанного ОВР гена для обеспечения экспрессии указанного гена в семенах, причем указанная последовательность встроена по такому сайту указанного гена, что экспрессия указанной ДНК последовательности контролируется указанным регуляторным участком, за счет чего указанная ДНК конструкция интегрируется в геном указанных клеток растения; выращивание указанного растения до получения семян, в которых целевой пептид экспрессирован как протеин слияния с продуктом экспрессии указанного ОВР гена; выделение масляных тел из клеток указанных семян; разрушение указанных масляных тел, в результате чего выделяется указанный протеин слияния; и очистку указанного целевого пептида.

Краткое описание чертежей Фиг. 1А представляет нуклеотидную последовательность и выведенную аминокислотную последовательность (17 кДа протеин) гена протеина масляного тела (олеозина) из Arabidopsis thaliana. Подчеркнуты прямые повторы (R1 и R2) инвертный повтор (Т), САСА, ТАТА, ТААТ и сигналы полиаденилирования.

Интронная последовательность напечатана мелким шрифтом, а предполагаемый АВА-связывающий сайт указан жирным шрифтом.

На фиг.1В представлено сравнение последовательностей протеина 16Кb масляного тела из моркови и 18Кb и 16Кb протеинов масляного тела из кукурузы и 17Кb протеина масляного тела из Arabidopsis thaliana, где показаны сохраняющиеся (консервативные) и различающиеся участки этих протеинов; аминокислотные последовательности выравнены, чтобы показать консервативность последовательности в центральном участке протеинов.

На фиг.2 представлены конструкции, использованные для слияния генов протеинов масляного тела с генами, кодирующими чужеродные пептиды. IА представляет С-терминальное слияние целевого пептида с ОВР; IВ представляет N-терминальное слияние целевого пептида с ОВР; II представляет внутреннее слияние целевого пептида с ОВР; и III представляет междимерное трансляционное слияние целевого пептида, заключенного между двумя практически полными последовательностями протеина масляного тела, обеспечивающими его направленную доставку. В верхней части фиг. (А) представлена ДНК конструкция, использованная для трансляционного слияния целевых пептидов с протеинами масляного тела. В нижней части фиг. (В) представлены конфигурации генных продуктов, показанных на верхнем участке трансляции и доставки к масляным телам.

Ключ к фиг. следующий: заштрихованный снизу слева вверх направо прямоугольник представляет ОВР промотор или другой специфический для семян промотор; заштрихованный снизу справа вверх налево прямоугольник представляет последовательность, кодирующую целевой пептид; незаштрихованный прямоугольник представляет последовательность, кодирующую протеин масляного тела или синтетическую последовательность, обеспечивающую направленную доставку, основанную на ОВР консервативных фрагментах; заштрихованные в клеточку прямоугольники представляют терминатор гена, содержащий сигнал полиаденилирования; заштрихованный кружок представляет фрагмент распознавания протеазы; спиральная линия представляет нативный С- или N-конец ОВР.

Фиг. 3 представляет подробную структуру конструкции С-терминального слияния. Изображена структура последовательности, кодирующей участок распознавания коллагеназы, в качестве линкора при слиянии типичного гена протеина масляного тела и пептида слияния, который нужно связать, используя Ncol для клонирования и экспрессии в растениях.

На фиг.4 схематически представлен процесс конструирования векторов пептида слияния, их введение в растения и последующую экстракцию и анализ целевого рекомбинантного пептида.

На фиг. 5 схематически представлено конструирование рCGOBPILT. Прямоугольник с пунктиром представляет олеозиновый промотор; прямоугольник, заштрихованный сверху слева-вправо вниз, представляет олеозиновую кодирующую последовательность; заштрихованный в клеточку прямоугольник представляет интрон; прямоугольник со штрихами представляет 3'- нетранслируемую последовательность; прямоугольник с редко расположенными полосами сверху слева - вправо вниз, представляет последовательность интерлейкина - I-, снабженную последовательностью, кодирующей сайт расщепления протеазы ( Фактор Ха или тромбин, расположенный непосредственно в обратном направлении).

На фиг.6 представлена конструкция олигонуклеотида GVR11. На фиг.3А представлена 3' кодирующая последовательность А.thaliana oleosin, трансляционно слитая с кодирующей последовательностью фактора Ха/IL-1-, после которой следует ТАА стоп-кодон. Для целей дальнейшего кодирования включают PvuI и SalI рестрикционные сайты. Создание PvuI рестрикционного сайта приводит к дополнительной кодирующей последовательности для аланина (ala). Подчеркнуты последовательности распознавания рестрикционного энзима. Друг над другом расположены последовательности олеозина А. thaliana и последовательность распознавания фактора Ха. Действительный сайт расщепления обозначен звездочкой. На фиг. 3В представлена последовательность GVR11 для осуществления слияния с А. thaliana олезином, праймер CVR11 должен быть комплементарен последовательности верхней нити.

На фиг. 7 представлена нуклеотидная последовательность OBPILT. Подчеркнута последовательность, кодирующая IL-1-; последовательность, кодирующая сайт распознавания фактора Ха, указана жирным шрифтом. Терминаторная последовательность нопалинсинтетазы указана мелкими буквами.

Описание предпочтительного варианта В соответствии с целью изобретения предложены способы и композиции для получения пептидов, которые легко поддаются очистке. Целевой способ включает стадии получения экспрессионной кассеты, содержащей ДНК последовательность, кодирующую достаточную часть специфической последовательности масляного тела, например олеозина, для обеспечения направленного транспорта к масляному телу, и представляющий интерес пептид; трансформации экспрессионной кассетой клеток растения-хозяина; создания трансгенного растения и выращивание его для получения семян, в которых химерный протеин экспрессирован и перемещен к масляным телам. Химерный пептид включает целевой пептид и такой протеин масляного тела, как олеозин. Целевой пептид обычно является чужеродным пептидом, который обычно не экспрессируется в семенах или не находится на масляных телах. Использование протеина масляного тела в качестве носителя или в качестве средства для направленной доставки обеспечивает простой механизм очистки чужеродного протеина. Химерный протеин выделяют из массы клеточных протеинов в одну стадию (например, за счет центрифугирования или флотации); этот протеин также защищен от разложения в процессах экстракции, так как при разделении удаляются неспецифические протеазы из контакта с масляными телами. Ген, кодирующий чужеродный пептид, может быть получен из любого источника, включая растительные, бактериальные, грибковые или животные источники.

Желательно, чтобы химерный пептид содержал последовательности, которые позволяли бы отщеплять целевой пептид от олеозина. Такой метод можно использовать для экспрессии различных пептидов, которые затем легко поддаются очистке.

Обеспечение направленной доставки чужеродного рекомбинантного протеина к масляному телу обеспечивает несколько преимуществ, включая следующие. Протеины можно выделить из клеточной массы после лизиса клеток за счет центрифугирования. Частицы масляных тел будут плавать на поверхности экстракта. Протеин можно необязательно снабдить пептидным линкером, содержащим сайт распознавания протеазы. Это позволяет отделить пептид от масляного тела. Протеин можно ввести в рекомбинантный полипептид таким образом, чтобы он был внутри липофильного консервативного участка. Это приводит к интернализации рекомбинантного пептида в масляное тело, таким образом защищая его от атаки протеазы.

Экспрессионная кассета обычно будет включать в 5'-3' направлении транскрипции транскрипционный и трансляционный регуляторный участок, обеспечивающие возможность экспрессии в развивающихся семенах, типичным примером которых служит промотор, и расположенные в обратном направлении участки, связанные с протеином масляного тела, что обеспечит экспрессию химерного протеина в семенах; ДНК последовательность, кодирующую химерный пептид, содержащий аминокислотную последовательность для обеспечения направленной доставки к масляному телу, и целевой протеин, транскрипционный и трансляционный терминальные участки, функциональные в растениях. Может также присутствовать один или более из интронов.

Специфическая последовательность масляного тела встречает аналогию во фрагментах протеинов масляного тела, в частности олеозинов. Специфическая последовательность масляного тела может быть той же, что и последовательность, получаемая из протеина масляного тела, и они имеют достаточную гомологию, чтобы обеспечить направленную доставку целевого протеина к масляному телу. Под "получаемой" подразумевают аминокислотную последовательность, которая может быть природной, синтетической или комбинированной, достаточно близкой к аминокислотной последовательности протеина нативного масляного тела, для достижения нужного обеспечения направленной доставки. Особый интерес представляют центральный гидрофобный домен протеинов масляного тела, который, по-видимому, в высшей степени консервативен среди различных видов растений, и его фрагментов и гомологичных последовательностей на аминокислотном уровне.

Выведенную последовательность 3 аминокислот для Arabidopsis thaliana протеина масляного тела см. в конце описания.

Аминокислоты от около 25 до 101 содержат центральный гидрофобный домен.

Особый интерес представляют в качестве средств, обеспечивающих направленную доставку для некоторых применений, специфические последовательности 4 масляного тела или их фрагменты последовательности, которые обеспечивают направленную доставку к масляному телу (см. в конце описания).

где: рр1 и рр2 одинаковы или различны и могут быть такими же или могут отличаться от природного протеина масляного тела и обычно отличаются; они могут представлять водороды, что указывает на терминальную часть указанного полипептида, или они могут быть полипептидами, содержащими вплоть до 1000 аминокислот, обычно вплоть до около 500 аминокислот, и могут содержать лишь одну аминокислоту или могут индивидуально или раздельно быть полипептидами, содержащими от 1 до 100 аминокислот, обычно от около 1 до 75 аминокислот и особенно от около 5 до 50 аминокислот; эти полипептиды могут иметь специфические применения при модификации специфически описанных последовательностей для заранее определенных целей; аа25 может быть любой аминокислотой, в частности нейтральной алифатической аминокислотой, обычно содержащей от 3 до 6 атомов углерода, более конкретно лейцином или аланином; аа26 представляет нейтральную алифатическую аминокислоту, особенно аланин или гидроксизамещенную аминокислоту, содержащую от 3 до 4 атомов углерода, в частности треонин, или основную аминокислоту, содержащую от 5 до 6 атомов углерода, в частности лизин; аа31 представляет нейтральную незамещенную алифатическую аминокислоту, содержащую от 3 до 6 атомов углерода, в частности аланин, валин или лейцин, или ароматическую незамещенную аминокислоту, особенно фенилананин; аа33 представляет нейтральную незамещенную алифатическую аминокислоту, содержащую от 3 до 6 атомов углерода, особенно аланин, валин или лейцин, или оксизамещенную алифатическую аминокислоту, особенно треонин; аа36 представляет нейтральную алифатическую незамещеную аминокислоту, содержащую от 3 до 5 атомов углерода, особенно лейцин, или нейтральную алифатическую оксизамещенную аминокислоту, содержащую от 3 до 4 атомов углерода, особенно треонин или серин; аа37 представляет нейтральную незамещенную аминокислоту, особенно лейцин или тиозамещенную аминокислоту, особенно метиомин; аа39 представляет нейтральную алифатическую незамещенную аминокислоту, особенно валин, или ароматическую незамещенную аминокислоту, особенно фенилаланин; аа41 представляет нейтральную алифатическую незамещенную или оксизамещенную аминокислоту, особенно аланин, лейцин или серин; аа44 представляет нейтральную алифатическую незамещенную или оксизамещенную аминокислоту, в частности аланин, изолейцин или треонин; аа46 представляет нейтральную алифатическую незамещенную аминокислоту или оксизамещенную аминокислоту, особенно аланин, валин или треонин; аа47 представляет нейтральную алифатическую незамещенную аминокислоту, особенно глицин или аланин; аа59 представляет нейтральную алифатическую или ароматическую незамещенную аминокислоту, особенно лейцин или фенилаланин; аа76 представляет нейтральную алифатическую незамещенную или тиозамещенную аминокислоту, особенно аланин, лейцин или метионин; аа78 представляет нейтральную алифатическую незамещенную аминокислоту, особенно аланин, или нейтральную алифатическую аминокислоту, содержащую тио- или окси-замещения, особенно метионин или треонин; аа83 представляет нейтральную алифатическую незамещенную или оксизамещенную аминокислоту, особенно глицин, серин или треонин; аа92 представляет нейтральную алифатическую аминокислоту с окси-замещением, особенно серин или треонин; аа96 представляет нейтральную алифатическую тиозамещенную аминокислоту или нейтральную ароматическую гетероциклическую аминокислоту, особенно триптофан; аа97 представляет нейтральную алифатическую незамещенную или тиозамещенную аминокислоту, особенно валин, лейцин, изолейцин или метионин; аа98 представляет нейтральную алифатическую незамещенную аминокислоту или ароматическую окси-замещенную аминокислоту, особенно аланин, лейцин или тирозин; аа99 может представлять любую аминокислоту; аа100 представляет окси-замещенную аминокислоту, либо алифатическую, либо ароматическую, особенно тирозин или треонин; аа101 представляет нейтральную незамещенную алифатическую или ароматическую аминокислоту, особенно аланин, лейцин или фенилаланин.

Особый интерес в качестве источника ДНК кодирующей последовательности, способной обеспечить направленную доставку к протеину масляного тела, представляют гены протеинов масляных тел, получаемые из Arabidopsis или Brassica napus, которые обеспечивают экспрессию целевого протеина в семенах (см. Taylor et al. (1990), Planta 181: 18-26). Нужные участки и аминокислотные последовательности, необходимые для обеспечения способности направленной доставки к масляным телам, должны быть, по-видимому, существенно гидрофобным центральным участком протеинов масляного тела.

Для идентификации других генов протеинов масляного тела, обладающих нужными характеристиками, где протеин масляного тела уже был выделен, этот протеин можно частично секвенировать, с тем чтобы можно было сконструировать зонд для идентификации мРНК. Такой зонд особенно ценен, если он сконструирован таким образом, чтобы нацелить его к кодирующему району центрального гидрофобного домена, который в высшей степени консервативен среди различающихся видов растений. Следовательно, ДНК или РНК зонд для этого участка может быть особенно полезен для идентификации кодирующих последовательностей протеинов масляного тела из других видов растений. Для дальнейшего повышения концентрации мРНК можно получить кДНК и эту кДНК вычесть с мРНК или кДНК из клеток, продуцирующих не масляные тела. Оставшуюся кДНК можно затем использовать для зондирования генома для комплементарных последовательностей, используя соответствующие библиотеки, полученные из растительных клеток. Затем можно выделить последовательности, которые гибридизуются с кДНК в жестких условиях.

В некоторых случаях, как указано ранее, использующих зонд гена протеина масляного тела (консервативный участок), зонд можно использовать непосредственно для скринирования геномной библиотеки кДНК и идентификации последовательностей, которые гибридизуются с зондом. Выделение можно также осуществить стандартным иммунологическим скринированием библиотеки экспрессии кДНК специфической для семян. Антитела можно легко получить к протеинам масляных тел, используя способы очистки и схемы получения антител, описанные Taylor et al. (Planta, (1990), 181, 18-26). Библиотеку экспрессии кДНК скринируют, используя антитела по способу Huynh et al. (1985 в DNA Cloning, Vol.1, а Practical Approach, ed. D.М. Glover, IRL Press, рр. 49-78). Подтверждение структуры последовательности облегчается за счет высокого консерватизма, существующего в центральном гидрофобном участке (фиг.1). ДНК секвенирование по способу Sander et al. (Proc. Natl. Acad. Sci. USA, (1997) 74:5463-5467 или Maxam and Gilbert (1980), Meth. Ensymol., (1980) 65:497-560) можно осуществить на всех предполагаемых клонах и осуществить поиски гомологов. Гомологи последовательностей, кодирующих центральный гидрофобный домен, обычно составляет 70% как на аминокислотном, так и на нуклеотидном уровнях между различающимися видами. Если доступно антитело, подтверждение идентичности последовательности можно осуществить в экспериментах отбора гибридов и трансляции из препаратов мРНК семян по способу Sambrook et al. (Molecucar Cloning, (1990), 2nd Ed., Cold Spring Harbor Press, рр.8-49 до 8-51).

кДНК клоны, полученные из семян, можно скринировать, используя кДНК зонды, полученные из консервативных кодирующих участков любого доступного гена протеина масляного тела (например, Bowman-Vance and Huang (J. Biol. Chem., (1987) 262: 11275-11279). Отбирают клоны, которые обладают степенью гибридизации с ДНК семян, нежели с кДНК сеянцев. Скринирование повторяют для идентификации конкретной кДНК, связанной с масляными телами развивающихся семян