Синтетический ген, кодирующий зеленый флуоресцентный белок, способ получения гена, экспрессирующий вектор, способ получения культуры клеток
Реферат
Изобретение относится к генной инженерии. Предложен новый синтетический ген, кодирующий зеленый флуоресцентный белок. Предложенный ген характеризуется заменами непредпочтительных или менее предпочтительных кодонов на предпочтительные кодоны. При этом предпочтительные кодоны представляют собой группу gcc, cgc, aac, gac, tgc, cag, ggc, cac, atc, ctg, aag, ccc, ttc, agc, acc, tac и gtg, а менее предпочтительные представляют собой ggg, att, ctc, tcc, gtc и agg, а непредпочтительные кодоны представляют собой оставшиеся кодоны. Новый синтетический ген характеризуется способностью экспрессировать зеленый флуоресцентный белок на уровне 110-1000% от уровня экспрессии природного гена. Также предложен способ получения синтетического гена зеленого флуоресцентного белка. Способ предусматривает определение непредпочтительных или менее предпочтительных кодонов в природном гене и замену одного или нескольких кодонов на предпочтительные кодоны, кодирующих ту же аминокислоту, что и заменяемые кодоны. Предложен также экспрессирующий вектор, содержащий синтетический ген, и способ получения культуры клеток млекопитающего, несущих синтетический ген, предусматривающий трансформирование клеток экспрессирующим вектором. Предложенное изобретение может быть использовано для промышленного получения необходимых белков, а также для генной терапии. 4 н. и 11 з.п. ф-лы, 4 табл., 21 ил.
Область изобретения Настоящее изобретение относится к генам и способам высокопродуктивной экспрессии эукариотических и вирусных белков в эукариотических клетках. Предпосылки изобретения У прокариот экспрессия продуктов эукариотических генов иногда ограничена из-за наличия кодонов, которые редко используются у Е. coli. Экспрессия таких генов может усиливаться при систематической замене эндогенных кодонов на кодоны, чаще представленные в прокариотических генах с высокой продуктивностью экспрессии (Robinson et al., Nucleic Acids Res. 12:6663, 1984). Обычно полагали, что редкие кодоны создают пропуск в рибосоме, что приводит к повреждению полной образующейся полипептидной цепи и разобщению транскрипции и трансляции. Полагали, что пропуск в рибосоме ведет к обнажению 3'-конца мРНК для клеточных рибонуклеаз. Сущность изобретения Настоящее изобретение относится к синтетическому гену, кодирующему белок, обычно экспрессируемый в клетках млекопитающих или иных эукариотических клетках, в которых, по крайней мере, один непредпочтительный или менее предпочтительный кодон природного гена, кодирующий данный белок, заменен на предпочтительный кодон, кодирующий ту же аминокислоту. Предпочтительные кодоны представляют собой А1а (gсс); Аrg (сgс); Asn (aac); Asp (gас); Cys (tgc); Gln (саg); Gly (ggc); His (cac); Ilе (atc); Leu (ctg); Lys (aag); Pro (ccc); Phe (ttc); Ser (agc); Thr (асc); Туг (tac); и Val (gtg). Менее предпочтительные кодоны представляют собой Gly (ggg); Ile (att); Leu (ctc); Ser (tcc); Val (gtc) и Arg (agg). Кодоны, которые не соответствуют описанию предпочтительных кодонов или менее предпочтительных кодонов, представляют собой непредпочтительные кодоны. Вообще, степень предпочтения отдельного кодона указывает на преобладание данного кодона в человеческих генах, экспрессируемых с высокой продуктивностью, которые указаны в Таблице 1 под заголовком “Высокопродуктивный”. Например, “atc” соответствует 77% кодона Ilе в высокопродуктивно экспрессируемых человеческих генах и представляет собой предпочтительный кодон Ilе; “att” соответствует 18% кодона Ilе в высокопродуктивно экспрессируемых человеческих генах и представляет собой менее предпочтительный кодон Ilе. Последовательность “ata” соответствует лишь 5% кодона Ilе в высокопродуктивно экспрессируемых человеческих генах как непредпочтительный кодон Ilе. Замена кодона другим кодоном, который преобладает в высокопродуктивно экспрессируемых человеческих генах, будет, как правило, повышать экспрессию данного гена в клетках млекопитающих. Соответственно, настоящее изобретение включает замену менее предпочтительного кодона на предпочтительный кодон, а также замену непредпочтительного кодона предпочтительным или менее предпочтительным кодоном. Под “белком, обычно экспрессируемым в клетке млекопитающего”, подразумевается белок, который экспрессируется у млекопитающих в естественных условиях. Данный термин включает такие гены в геноме млекопитающих, как гены, кодирующие Фактор VIII, Фактор IX, интерлейкины и другие белки. Данный термин включает также гены, которые экспрессируются в клетках млекопитающих при болезненных состояниях, такие как онкогены, а также гены, которые кодируются вирусом (в том числе ретровирусом), которые экспрессируются в постинфекционных клетках млекопитающих. Под “белком, обычно экспрессируемым в эукариотических клетках”, подразумевается белок, который экспрессируется эукариотом в естественных условиях. Данный термин включает также гены, которые экспрессируются в клетках млекопитающих при болезненных состояниях. В предпочтительных осуществлениях синтетические гены способны экспрессировать белок млекопитающего или эукариотический белок на уровне, который составляет, по меньшей мере, 110%, 150%, 200%, 500%, 1000%, 5000% или даже 10000% от уровня, который экспрессируется “природным” (или “нативным”) геном в in vitro культуральной системе клеток млекопитающих в идентичных условиях (т.е. тот же тип клеток, те же культуральные условия, тот же экспрессионный вектор). Ниже описаны подходящие клеточные культуральные системы для измерения экспрессии данного синтетического гена и соответствующего природного гена. Другие подходящие экспрессионные системы, использующие клетки млекопитающих, хорошо известны специалистам в данной области техники и описаны, например, в указанных ниже ссылках на классические работы по молекулярной биологии. Векторы, подходящие для экспрессии данного синтетического и природного генов, описаны ниже и в ссылках на классические работы, также описанных ниже. Под “экспрессией” подразумевается экспрессия белка. Экспрессия может быть измерена с использованием антител, специфичных к интересующему белку. Такие антитела и методы измерения хорошо известны специалистам в данной области техники. Под “природным геном” и “нативным геном” подразумевается генная последовательность (включая природные аллельные варианты), которая кодирует данный белок в природе, т.е. нативная или природная кодирующая последовательность. В других предпочтительных осуществлениях, по меньшей мере 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% или 90% кодонов в природном гене представляют собой непредпочтительные кодоны. В других предпочтительных осуществлениях, по меньшей мере 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% или 90% непредпочтительных кодонов в данном природном гене заменены предпочтительными кодонами или менее предпочтительными кодонами. В других предпочтительных осуществлениях, по меньшей мере, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% или 90% непредпочтительных кодонов в данном природном гене замещены предпочтительными кодонами. В предпочтительном осуществлении белок представляет собой ретровирусный белок. В более предпочтительном осуществлении белок представляет собой лентивирусный белок. В еще более предпочтительном осуществлении белок представляет собой белок HIV. В других предпочтительных осуществлениях белок представляет собой gag, pol, env, gp 120 или gp l60. В других предпочтительных осуществлениях белок представляет собой человеческий белок. В более предпочтительных осуществлениях белок представляет собой человеческий Фактор VIII и белок с делецией В-области человеческого Фактора VIII. В другом предпочтительном осуществлении белок представляет собой зеленый флуоресцентный белок. В различных предпочтительных осуществлениях, по меньшей мере, 30%, 40%, 50%, 60%, 70%, 80%, 90% и 95% кодонов синтетического гена представляют собой предпочтительные или менее предпочтительные кодоны. В настоящем изобретении представлен также экспрессионный вектор, включающий синтетический ген. Следующий аспект настоящего изобретения представляет клетку, несущую данный синтетический ген. В различных предпочтительных вариантах осуществления настоящего изобретения данная клетка является прокариотической клеткой, и данная клетка является клеткой млекопитающего. В предпочтительных осуществлениях данный синтетический ген включает менее 50, менее 40, менее 30, менее 20, менее 10, менее 5 или не содержит “сg” - последовательностей. В настоящем изобретении охарактеризован также способ получения синтетического гена, кодирующего белок, обычно экспрессируемый клеткой млекопитающего или иной эукариотической клеткой. Данный способ включает идентификацию не предпочтительных или менее предпочтительных кодонов в данном природном гене, кодирующем данный белок, и замену одного или нескольких данных непредпочтительных или менее предпочтительных кодонов на предпочтительный кодон, кодирующий ту же данную аминокислоту, что и замещаемый кодон. В некоторых обстоятельствах (напр., чтобы дать возможность ввести сайт рестрикции) может оказаться желаемым заменить непредпочтительный кодон на менее предпочтительный кодон, а не на предпочтительный кодон. Нет необходимости заменять все менее предпочтительные или непредпочтительные кодоны предпочтительными кодонами. Повышение экспрессии может быть достигнуто даже при неполной замене менее предпочтительных или непредпочтительных кодонов предпочтительными кодонами. В некоторых обстоятельствах может оказаться желаемым лишь частичная замена непредпочтительных кодонов предпочтительными или менее предпочтительными кодонами с целью получить промежуточный уровень экспрессии. В других предпочтительных осуществлениях настоящее изобретение представляет векторы (включая экспрессионные векторы), включающие один или несколько синтетических генов. Под “вектором” подразумевается молекула ДНК, полученная, например, из плазмиды, бактериофага или из вируса млекопитающего или насекомого, в которую могут быть вставлены или клонированы фрагменты ДНК. Вектор будет содержать один или несколько уникальных сайтов рестрикции и может обладать способностью к автономной репликации в определенном хозяине или организме-носителе, таком, в котором может быть воспроизведена клонируемая последовательность. Таким образом, под "экспрессионным вектором" подразумевается любой автономный элемент, способный управлять синтезом белка. Такие экспрессионные ДНК-векторы включают плазмиды и вирусы, вводимые в клетки млекопитающих. В настоящем изобретении представлены также фрагменты синтетического гена, которые кодируют желаемую часть данного белка. Такие фрагменты синтетического гена аналогичны синтетическим генам настоящего изобретения за тем исключением, что они кодируют лишь часть данного белка. Такие генные фрагменты предпочтительно кодируют, как минимум, 50, 100, 150 или 500 смежных аминокислот данного белка. При конструировании синтетических генов настоящего изобретения желательно избегать CpG-последовательностей, так как эти последовательности могут вызывать умолкание генов. Поэтому в предпочтительном варианте осуществления настоящего изобретения кодирующая область данных синтетических генов не включает последовательность “сg”. Неоднозначность кодона, присутствующая в гене env gp120 HIV, присутствует также в генах gag и pol. Поэтому замена части непредпочтительных и менее предпочтительных кодонов, находящихся в этих генах, на предпочтительные кодоны должна произвести ген, способный к более высокопродуктивной экспрессии. Большая доля кодонов человеческих генов, кодирующих Фактор VIII и Фактор IX, является непредпочтительными кодонами или менее предпочтительными кодонами. Замена части данных кодонов на предпочтительные кодоны должна произвести гены, способные к более высокопродуктивной экспрессии в культуре клеток млекопитающих. Синтетические гены настоящего изобретения могут быть интродуцированы в клетки живого организма. Например, векторы (вирусные или невирусные) могут использоваться для введения синтетического гена в клетки живого организма для генной терапии. И наоборот, возможно желаемым окажется заменить предпочтительные кодоны в природном гене на менее предпочтительные кодоны в целях снижения экспрессии. Ссылки на классические работы, описывающие общие принципы метода рекомбинантной ДНК, включают Watson et at., Molecular Biology of the Gene, Volumes I and II, the Benjamin/Cummings Publishing Company, Inc., publisher, Menio Park, CA (1987); Darnell et al., Molecular Cell Biology, Scientific American Books, Inc., Publisher, New York, N.Y. (1986); Old et al., Principles of Gene manipulation: An Introduction to Genetic Engineering, 2d edition. University of California Press, publisher, Berkeley, CA (1981); Maniatis et al., Molecular Cloning: A Laboratory Manual, 2nd Ed. Cold Spring Harbor Laboratory, publisher. Cold Spring Harbor, NY (1989); и Current Protocols in Molecular Biology, Ausubel et al., Wiley Press, New York, NY (1992). Под “трансформированной клеткой” подразумевается клетка, в которую (или в предка которой) интродуцировали методами рекомбинантной ДНК выбранную молекулу ДНК, например синтетический ген. Под “расположенной для экспрессии” подразумевается, что молекула ДНК, например синтетический ген, располагается по соседству с последовательностью ДНК, которая управляет транскрипцией и трансляцией данной последовательности (т.е. способствует образованию белка, кодируемого данным синтетическим геном). На фиг.1 А - фиг.1D изображена последовательность синтетического гена gр120 и синтетического гена gр160, в которой кодоны были заменены на кодоны, обнаруженные в высокопродуктивно экспрессируемых человеческих генах. На фиг.2 схематически изображен синтетический ген gр120 (HIV-1 MN). Заштрихованные части, отмеченные как v1-v5, изображают гипервариабельные области. Заполненный точками прямоугольник указывает сайт связывания с CD4. Показано небольшое количество сайтов рестрикции: Н (Hind3), Nh (Nhel), P (Pst1), Na (Nael), M (Mlu1), R (EcoR1), A (Age1) и No (Not1). Химически синтезированные фрагменты ДНК, которые служили в качестве матриц для ПЦР, показаны ниже последовательности gp120, наряду с локализацией праймеров, используемых для их амплификации. Фиг.3 представляет собой фотографию результатов анализов неустойчивой трансфекции, используемых для измерения экспрессии gр120. Гель-электрофорез иммунопреципитированных супернатантов клеток 293Т, трансфицированных плазмидами, экспрессирующими gр120, кодируемого участком IIIB, выделенным из HIV-1 (gp120IIIB), участком MN, выделенным из HIV-1 (gp120mn), участком MN, выделенным из HIV-1, модифицированного путем замены эндогенного лидерного пептида на пептид из антигена CD5 (gp120mnCD5L), или химически синтезированным геном, кодирующего MN-вариант HIV-1, на CDSLeader человека (syngp120im). Супернатанты собирали после 12-часового периода мечения после 60 часов трансфекции и иммунопреципитации гибридным белком CD4:IgG1 и белок-А.сефарозой. На фиг.4 графически изображены результаты анализов ELISA, используемых для измерения содержания белка в супернатантах временно трансфицированных клеток 293Т. Супернатанты клеток 293Т, трансфицированные плазмидами, экспрессирующими gp120, кодируемого участком IIIB из HIV-1 (gp120 IIIb), участком MN из HIV-1 (gp120mn), участком MN из HIV-1, модифицированного путем замены эндогенного лидерного пептида на пептид из CD5-антигена (gp120mn CD5L), или химически синтезированным геном, кодирующим MN-вариант HIV-1, на человеческий лидерный пептид CDS (syngp 120 mn), собирали через 4 суток и тестировали в gp120/CD4 ELISA. Содержание gр120 выражали в нг/мл. Фиг.5 представляет собой фотографию геля, иллюстрирующую результаты анализа иммунопреципитации, используемого для измерения экспрессии нативного и синтетического gр120 в присутствии rev в транс и RRE в цис. В данном эксперименте клетки 293Т временно трансфицировали путем кальцийфосфатной копреципитации 10 мкг плазмиды, экспрессирующей: (А) синтетическую gр120МN-последовательность и RRE в цис, (В) часть gp120 HIV-1 IIIB, (С) часть gp120 HIV-1 IIIB и RRE в цис, все в присутствии или в отсутствие экспрессии rev. RRE-конструкты gp120IIIbRRE и syngp120mnRRE конструировали с использованием фрагмента RRE Eag/Hpa1, клонируемого с помощью ПЦР из провирусного клона HIV-1 НХВ2. Каждую экспрессионную плазмиду gp120 котрансфицировали с помощью 10 мкг плазмидной ДНК pCMVrev или CDM7. Через 60 часов после трансфекции собирали супернатанты, иммунопреципитировали с помощью гибридного белка CD4:IgG и белок-А агарозы, а затем разгоняли в 7%-ном восстанавливающем SDS-PAGE. Время экспонирования полученного геля удлиняли, чтобы дать возможность индуцировать демонстрацию gp120IIIbrre с помощью rev. На фиг.5В представлен результат более короткого экспонирования аналогичного эксперимента, в котором syngp120mnrre котрансфицировали с или без pCMVrev. На фиг.5С представлена схематичная диаграмма конструктов, используемых на фиг.5А. Фиг.6 представляет собой сравнение последовательности гена ratTHY-1 дикого типа (wt) и синтетического гена ratTHY-1 (env), сконструированного путем химического синтеза и обладающего преобладающими кодонами, обнаруженными в гене HIV-1 env. На фиг.7 представлена схематичная диаграмма синтетического гена ratTHY-1. Зачерненный прямоугольник обозначает сигнальный пептид. Заштрихованный прямоугольник обозначает последовательности предшественника, который управляет присоединением фосфатидилинозитолгликанового якоря. Уникальные сайты рестрикции, используемые для сборки конструктов THY-1, обозначены как Н (Hind3), M (Mlu1), S (Sacl) и No (Notl). Положения синтетических олигонуклеотидов, используемых для данного конструирования, показаны внизу данноой фигуры. На фиг.8 представлено графическое изображение результатов проточно-цитометрического анализа. В этом эксперименте клетки 293Т временно трансфицировали экспрессионной плазмидой ratTHY-1 дикого типа (жирная линия), экспрессионной плазмидой ratTHY-1 с кодонами, кодирующими оболочку, (тонкая линия) или только вектором (пунктирная линия) путем кальцийфосфатной копреципитации. Клетки окрашивали анти-ratTHY-1 моноклональными антителами OХ7 с последующим поликлональным ФИТЦ-конъюгированным антителом против мышиного IgG через 3 дня после трансфекции. Фиг.9А представляет собой фотографию геля, иллюстрирующую результаты анализа иммунопреципитации человеческих клеток 293Т, трансфицированных syngp120mn (A) или конструктом syngp120mn. rTHY-1env, который содержит ген rTHY-1env в 3'-нетранслируемой области гена syng120mn (В). Конструкцию syngp120mn.rTHY-1env получали путем вставки Not1-адаптера в затупленный Нind3-сайт плазмиды rTHY-1env. Затем Not1-фрагмент 0,5 т.п.н., содержащий ген rTHY-lenv клонировали в Not1-сайт плазмиды syngp120mn и проверяли на правильность ориентации. Супернатанты клеток, меченых 35S, собирали через 72 часа после трансфекции, преципитировали с помощью гибридного белка CD4:IgG и белка-А агарозы и разгоняли в 7%-ном восстанавливающем SDS-PAGE. На фиг.9B представлена схематичная диаграмма конструктов, используемых в эксперименте, представленном на фиг.9А. Фиг.10А представляет собой фотографию клеток COS, трансфицированных вектором, не испускающим лишь GFP-флуоресценцию. Фиг.10В представляет собой фотографию клеток COS, трансфицированных экспрессионной плазмидой CDM7, кодирующей нативный GFP, сконструированный таким образом, чтобы включать консенсусную последовательность инициации трансляции. Фиг.10С представляет собой фотографию клеток COS, трансфицированных экспрессионной плазмидой, содержащей те же фланкирующие последовательности, и консенсусом инициации, как и на фиг.10В, но содержащей генную последовательность с оптимальными кодонами. Фиг.10D представляет собой фотографию клеток COS, трансфицированных экспрессионной плазмидой, такой же как и на Фигуре 10С, но несущей остаток Thr в положении 65 вместо Ser. Фиг.11 изображает последовательность синтетического гена, кодирующего зеленые флуоресцентные белки (SEQ ID NO:40). Фиг.12 изображает последовательность нативного гена человеческого Фактора VIII, не имеющего центрального В-домена (аминокислоты 760-1639 включительно) (SEQ ID NO:41). Фиг.13 изображает последовательность синтетического гена человеческого Фактора VIII, не имеющего центрального В-домена (аминокислоты 760-1639 включительно) (SEQ ID NO:42). Описание предпочтительных осуществлений ПРИМЕР 1 Конструирование синтетического гена gp120, содержащего кодоны, обнаруженные в высокопродуктивно экспрессируемых человеческих генах. Частотную таблицу кодона оболочечного предшественника LAV-субтипа HIV-1 получали с использованием программного обеспечения, разработанного The University of Wisconsin Genetics Computer Group. Полученные результаты, которые сведены в таблицу, сопоставлены в табл.1 с профилем использования кодонов коллекцией высокопродуктивно экспрессируемых человеческих генов. Для любой аминокислоты, кодируемой вырожденными кодонами, наиболее предпочтительный кодон высокопродуктивно экспрессируемых генов отличается от наиболее предпочитаемого кодона оболочечного предшественника HIV. Кроме того, простое правило описывает профиль предпочтительных - оболочечных кодонов, где оно применяется: предпочтительные кодоны максимизируют количество адениновых остатков в вирусной РНК. Во всех случаях подразумевается, что данный кодон, в котором третье положение представляет собой А, используется наиболее часто. В конкретном случае серина, три кодона одинаково обеспечивают один А-остаток в данной мРНК; вместе эти три кодона включают 85% сериновых кодонов, реально используемых в оболочечных транскриптах. Особенно яркий пример А-смещения обнаружен при выборе кодона для аргинина, в котором триплет AGA включает 88% аргининовых кодонов. Кроме данного преимущества А-остатков, отчетливое предпочтение среди вырожденных кодонов отдается уридину, третий остаток которого должен являться пиримидином. Наконец, несовместимость среди менее часто используемых вариантов может быть отнесена на счет наблюдения, что возникает динуклеотид CgG; поэтому третья позиция маловероятна для G всякий раз, когда вторая позиция представляет собой С, как в кодонах для аланина, пролина, серина и треонина; а триплеты CGX для аргинина почти совсем не используются. Частоту встречаемости кодона вычисляли с использованием программы GCG созданной The University of Wisconsin Genetics Computes Group. Значения представляют собой процентную долю случаев, когда используется отдельный кодон. Частоты использования кодонов оболочечных генов из других участков вируса HIV-1 сравнимы и показывают аналогичное смещение. С целью получения гена gр120, способного к высокопродуктивной экспрессии в клетках млекопитающих, сконструировали синтетический ген, кодирующий сегмент gр120 из HIV-1 (syngp120mn), на основе последовательности наиболее распространенного североамериканского субтипа, HIV-1 MN (Shaw et al., Science 226:1165, 1984; Gallo et al.,. Nature 321:119, 1986). В данном синтетическом гене gр120 почти все нативные кодоны были систематически заменены кодонами, более часто используемыми в высокопродуктивно экспрессируемых человеческих генах (фиг.1). Данный синтетический ген собирали из химически синтезированных олигонуклеотидов по 150-200 оснований в длину. Если химически синтезировали олигонуклеотиды, превышающие 120-150 оснований, процент полноразмерного продукта мог быть низким, а значительный избыток материала состоял из более коротких олигонуклеотидов. Так как эти более короткие фрагменты ингибируют процессы клонирования и ПЦР, может быть весьма затруднительно использовать олигонуклеотиды, превышающие определенную длину. Чтобы использовать сырой синтетический материал без предварительной очистки, перед клонированием одноцепочечные олигонуклеотидные пулы подвергали ПЦР-амплификации. Продукты ПЦР выделяли очисткой на агарозных гелях и использовали в качестве матриц для следующей стадии ПЦР. Два близких фрагмента могли быть коамплифицированы вследствие перекрывающихся последовательностей на конце каждого фрагмента. Данные фрагменты, которые обладали размером от 350 до 400 п.н., субклонировали в полученную из pCDM7 плазмиду, содержащую лидерную последовательность поверхностной молекулы CD5 с последующим полилинкером Nhe1/Pst1/Mlu1/EcoR1/BamH1. Каждый из ферментов рестрикции в этом полилинкере представляет сайт, который представлен либо на 5'-, либо на 3'-конце полученных в ходе ПЦР фрагментов. Поэтому последовательное субклонирование каждого из 4 длинных фрагментов позволяло собрать целый ген gp120. По каждому фрагменту субклонировали от трех до шести разных клонов и перед сборкой секвенировали. Схематичное изображение способа, примененного для конструирования синтетического gp120, показано на фиг.2. Последовательность синтетического гена gp120 (и синтетического гена gp160, созданного с использованием того же подхода) представлена на фиг.1. Скорость мутаций была значительной. Наиболее часто возникавшие мутации представляли собой короткие (1 нуклеотид) и длинные (до 30 нуклеотидов) делеции. В некоторых случаях необходимо было заменить части в данной конкретной области на любые синтетические адаптеры или фрагменты из других субклонов без мутаций. Некоторые отклонения от точного наследования в сторону использования оптимальных кодонов осуществляли для обеспечения внесения сайтов рестрикции в полученный ген, чтобы облегчить замену различных сегментов (фиг.2). Данные уникальные сайты рестрикции вводили в ген приблизительно со 100 п.н. интервалами. Нативную лидерную последовательность HIV заменяли высокопродуктивным лидерным пептидом человеческого антигена CD5 для облегчения секреции (Aruffo et al., Cell 61:1303 1990). Плазмида, используемая для конструирования, представляет собой производное экспрессионного вектора млекопитающего pCDM7, транскрибирующего встроенный ген под контролем мощного человеческого предраннего промотора CMV. Для сравнения кодирующих последовательностей gp120 дикого типа и синтетической синтетическую последовательность, кодирующую gp120, встраивали в экспрессионный вектор млекопитающего и тестировали в анализах неустойчивой трансфекции. В качестве контроля использовали различные нативные гены gp120 для исключения различий в уровнях экспрессии между различными вирусными участками и артефактов, индуцированных определенными лидерными последовательностями. Конструкт gp120 HIV IIIb, используемый в качестве контроля, получали путем ПЦР с использованием в качестве матрицы оболочечного фрагмента НХВ2 Sal1/Xho1 HIV-1. Для исключения мутаций, индуцируемых ПЦР, фрагмент Kpn1/Ear1, содержащий приблизительно 1,2 т.п.н. из данного гена, заменяли на соответствующую последовательность из провирусного клона. Конструкты gp120 дикого типа, используемые в качестве контролей, клонировали с помощью ПЦР из клеток С 8166, инфицированных HIV-1 MN (AIDS Repository, Rockville, MD) и экспрессировали gp120 либо с нативной оболочкой, либо с лидерной последовательностью CD5. Так как провирусные клоны в данном случае были не доступны, тестировали два клона каждого конструкта во избежание артефактов ПЦР. Для проведения полуколичественного анализа секретируемого gp120 в супернатантах клеток 293Т, временно трансфицированных кальцийфосфатной копреципитацией, иммунопреципитировали растворимым гибридным белком CD4: иммуноглобулин и протеин-А сефарозой. Результаты данного анализа (фиг.3) показывают, что продукт данного синтетического гена экспрессируется с высокой продуктивностью в сравнении с уровнями нативных контролей gp120. Молекулярная масса синтетического гена gp120 была сравнима с таковой контрольных белков (фиг.3), лежит в диапазоне от 100 до 110 кДа. Несколько более быструю миграция может быть объяснена тем фактом, что в некоторых линиях опухолевых клеток, например 293Т, гликозилирование либо осуществляется не полностью, либо изменено до некоторой степени. Для более точного сравнения уровней экспрессии белка gp120 осуществляли количественный анализ с использованием gp120-ELISA с CD4 в неподвижной фазе. Данный анализ свидетельствует (фиг.4), что данные ELISA сопоставимы с данными, полученными в ходе иммунопреципитации, с концентрацией gp120, составляющей 125 нг/мл для синтетического гена gp120 и меньше фонового порога (5 нг/мл) для всех нативных генов gp120. Поэтому экспрессия данного синтетического гена gp120, как минимум, на один порядок превышает наивысшее значение для генов дикого типа gp120. В эксперименте показано, как минимум, 25-кратное увеличение. Роль rev в экспрессии gp120 Так как rev, по-видимому, оказывает свое действие на нескольких стадиях экспрессии вирусного транскрипта, была проверена возможная роль нетрансляционных эффектов в повышенной экспрессии синтетического гена gp120. Прежде всего, контролировали уровни цитоплазматической мРНК, чтобы исключить возможность, при которой элементы негативных сигналов вызывают повышенную деградацию мРНК или нуклеиновый захват, осуществляли изменение нуклеотидной последовательности. Цитоплазматическую РНК получали путем лизиса NP40 кратковременно трансфицированных клеток 293Т и последующим удалением ядер путем центрифугирования. Цитоплазматическую РНК затем получали из лизатов множественными фенольными экстракциями и осаждением, наносили на нитроцеллюлозу с использованием слот-блот-устройства и, наконец, гибридизовали с оболочечно-специфичным зондом. Вкратце, цитоплазматическую мРНК клеток 293, трансфицированных CDM&, gp120IIIВ или syngp120, выделяли через 36 часов после трансфекции. Цитоплазматическую РНК клеток He1a, инфицированных вирусом коровьей оспы дикого типа или рекомбинантным вирусом, экспрессирующим gp120 IIIb или синтетический ген gp120, находящийся под контролем промотора 7, 5, выделяли через 16 часов после инфицирования. Равные количества наносили на нитроцеллюлозу с использованием слот-блот-устройства и гибридизовали со случайно меченым 1,5 т.п.н. фрагментами gp120IIIb и syngp120 или человеческим бета-актином. Уровни экспрессии РНК оценивали количественно путем сканирования гибридизованных мембран фосфорсодержащей меткой. Более подробно используемые методы описаны ниже. Данный эксперимент продемонстрировал, что нет существенной разницы в содержании мРНК в клетках, трансфицированных нативным или синтетическим геном gp120. На самом деле, в некоторых экспериментах уровень цитоплазматической мРНК синтетического гена gp120 был даже ниже, чем нативного гена gp120. Эти данные были подтверждены путем измерения экспрессии рекомбинантных вирусов коровьей оспы. Человеческие клетки 293 или клетки Hela, инфицированные вирусом коровьей оспы, экспрессировали gp120 IIIb дикого типа или syngp120mn при, как минимум, множественности инфицирования 10. Через 24 часа после заражения и иммунопреципитации с помощью гибридного белка CD4:иммуноглобулин и протеин-А сефарозы собирали супернатанты. Методики, используемые в данном эксперименте, описаны более подробно ниже. Данный эксперимент показал, что повышенная экспрессия данного синтетического гена все еще наблюдалась, когда продукт эндогенного гена и продукт синтетического гена экспрессировались в рекомбинантах коровьей оспы под контролем сильного смешанного раннего и позднего 7,5 k-промотopa. Поскольку молекулы мРНК вируса коровьей оспы транскрибируются и транслируются в данной цитоплазме, повышенная экспрессия данного синтетического оболочечного гена в этом эксперименте не может приписываться его повышенному экспорту из ядра. Данный эксперимент повторяли в двух дополнительных типах человеческих клеток, клеточной линии злокачественной опухоли 293 и клеток HeLa. Как и в случае трансфицированных клеток 293Т, уровни мРНК были аналогичными в клетках 293, инфицированными любым рекомбинантным вирусом коровьей оспы. Применение кодонов у лентивируса Поскольку ясно, что применение кодонов оказывает существенное воздействие на экспрессию в клетках млекопитающих, изучали частоту встречаемости кодонов в генах белков оболочки других ретровирусов. В целом, в данном исследовании не обнаружили четкого примера кодонового предпочтения среди ретровирусов. Однако, когда вирусы из рода лентивирусов, к которому относится HIV-1, анализировались раздельно, использование кодоновой неоднозначности почти идентично тому, которое обнаружено для HIV-1. Была получена таблица частоты встречаемости кодонов для оболочечных гликопротеинов разнообразных (преимущественно типа С) ретровирусов, за исключением лентивирусов, и создали таблицу сравнения частоты встречаемости кодона с помощью последовательностей белков оболочки четырех лентивирусов, отдаленно родственных HIV-1 (вирус артритного энцефалита коз, вирус инфекционной анемии лошадей, вирус иммунодефицита кошачьих и вирус висны) (табл.2). Профиль кодонового применения у лентивирусов поразительно аналогичен таковому у HIV-1 во всех случаях, кроме одного, предпочтительный кодон для HIV-1 является тем же, что и предпочтительный кодон для других лентивирусов. Исключением является пролин, который кодируется с помощью ССТ для 41% не относящихся к HIV лентивирусных остатков белков оболочки и с помощью ССА для 40% остатков, ситуация, которая ясно отражает существенное предпочтение для триплета, заканчивающегося А. Пример использования кодона для нелентивирусных белков оболочки не показывает аналогичного преимущества остатков А, а также не обладает такой же асимметрией в пользу третьего положения остатков С и G, как и при использовании кодона для продуктивно экспрессируемых человеческих генов. В целом, нелентивирусные ретровирусы используют различные кодоны в более равной степени, их профиль совпадает с менее продуктивной экспрессией человеческих генов. Частоту встречаемости кодона вычисляли с использованием программы GCG, разработанной The University of Wisconsin Genetics Computer Group. Числа соответствуют процентной доле использования отдельного кодона. Кодон, используемый нелентивирусными ретровирусами, составляли из последовательностей предшественника белка оболочки вируса лейкоза крупного рогатого скота, вируса лейкоза кошачьих, вируса Т-клеточного лейкоза человека I типа, лимфотропного вируса Т-клеток человека II типа; культуры, образующие очаг в клетках норки, вируса мышиного лейкоза (MuLV); культуры Раушера, образующие очаг в селезенке, культуры 10А1, амфотропной культуры 4070А и миелопролиферативной культуры вируса лейкоза, и из вируса лейкоза крыс, вируса саркомы человекообразных обезьян, вируса лейкоза Т-клеток человекообразных обезьян, лейкозогенного ретровируса Т1223/В, вируса лейкоза длинноруких обезьян. Таблицы частот встречаемости кодонов для лентивирусов, не относящихся к HIV, SIV составляли из последовательностей предшественника белка оболочки вируса артритного энцефалита коз, вируса инфекционной анемии лошадей, вируса иммунодефицита кошачьих и вируса висна. Кроме преобладания кодонов, содержащих А, лентивирусные кодоны присоединяются к весьма представительному паттерну CpG в HIV, так, что третье положение для триплетов аланина, пролина, серина и треонина редко представляет собой G. Ретровирусные триплеты для белков оболочки демонстрируют сходство, но менее выражены представляемым CpG. Наиболее явное различие между лентивирусами и другими ретровирусами, в отношении преобладания CpG заключается в использовании варианта CGX в аргининовых триплетах, которые довольно часто представлены среди кодирующих последовательностей оболочки ретровируса, но почти никогда не присутствуют среди сопоставляемых лентивирусных последовательностей. Различия в rev зависимости между нативным и синтетическим gp120 Чтобы установить, действительно ли регуляция с помощью rev связана с использованием кодона HIV-1, изучали влияние rev на нативный и синтетический ген. Так как регуляция с помощью rev нуждается в rev-связывающем сайте RRE в cis, были созданы конструкты, в которых этот связывающий сайт клонировали в 3'-нетранслируемую область данного нативного и данного синтетического гена. Эти плазмиды котрансфицировали с rev или с контрольной плазмидой в trans в клетки 193Т и проводили полуколичественный анализ уровня экспрессии gp120 в супернатантах путем иммунопреципитации. Методики, используемые в данном эксперименте, описаны более подробно ниже. Как показано на фиг.5А и фиг.5В, rev положительно регулирует нативный ген gp120, но не оказывает влияния на экспрессию синтетического гена gp120. Следовательно, действие rev на субстрат, в котором отсутствует последовательность из эндогенных вирусных оболочечных последовательностей, не очевидно. Экспрессия синтетического гена ratTHY-1 с кодонами для белков оболочки HIV Вышеописанный эксперимент позволяет предположить, что фактически “последовательности оболочки” присутствуют для rev-регуляции. Для того чтобы проверить эту гипотезу, получали синтетический вариант гена, кодирующего небольшой, обычн