Рекомбинантный полипептид pgh(a) с n-концевым аланином

Реферат

 

Использование: биотехнология, сельское хозяйство. Сущность изобретения: из штамма E.coli, предварительно трансформированного рекомбинатным вектором, в котором непосредственно после сайта инициации трансляции, представленного метиониновым кодоном, встроен фрагмент ДНК, кодирующий свиной гормон роста с N-концевым аланином pGH (А), получен без дополнительной обработки полипептид pGH(A), не содержащий на N-конце остатка метионина. 8 ил., 2 табл.

Изобретение относится к pGH(A), полученному путем стадий: а) культивирования одноклеточного организма, содержащего рекомбинатный вектор, включающий фрагмент ДНК, кодирующий указанный гормон, и б) выделения указанного гормона из культуры.

Экспрессия генов эукариотами и прокариотами, хотя и использует одни и те же основные стадии транскрипции генов в информационную PHK (иPHK) и последующей трансляции этой иРНК в протеины, использует при этом различные совокупности внутриклеточных регуляторов для этих стадий.

Кроме того, у эукариотов многие зрелые протеины сначала транслируются как предпротеины, то есть как полипептиды, содержащие последовательность зрелого протеина, слитую с сигнальной последовательностью. Эукариотная иPHK кодирует полный предпротеин, в котором после трансляции удаляется предпоследовательность и получается "зрелый" протеин. Несмотря на то, что эукариотные клетки снабжены всем необходимым для того, чтобы специальной обработкой превратить такие предпротеины в зрелые протеины, прокариотические клетки в общем случае не способны распознавать сигналы обработки, содержащиеся в эукариотических протеинах. Таким образом, если полные транскрипты комплементарной ДНК (кДНК) эукариотической иРНК используются в качестве ДНК-последовательностей для экспрессии в прокариотах, то получают в результате предпротеин, а не зрелый протеин. Имеется возможность превратить предпротеин в зрелые протеины в лабораторных условиях, но эта стадия требует значительных затрат.

В том случае, когда для экспрессии зрелого протеина в прокариотах используют ДНК-последовательность, кодирующую зрелый протеин, эта последовательность не содержит эукариотических сигналов послетрансляционной обработки. Следовательно, для экспрессии клонированных эукариотических генов или других последовательностей гетерологичной ДНК в прокариотических системах, как было установлено, желательно использовать прокариотические контрольные сигналы ввиду их эффективности и вследствие того, что эукариотические сигналы не могут распознаваться прокариотической клеткой-хозяином.

Термин "гетерологичная ДНК", как он используется в соответствии с настоящим изобретением, означает ДНК, по крайней мере часть которой не содержится в общем случае внутри генома клетки-хозяина. Примеры гетерологичной ДНК включают, но ими не исчерпывается полный список, вирусные и эукариотические гены, фрагменты генов, аллели и синтетические последовательности ДНК. Термин "гетерологичный протеин" или "гетерологичный полипептид" означает здесь протеин или полипептид, по крайней мере часть которого в общем случае не кодируется геном клетки-хозяина.

Прокариотические регуляторные сигналы содержат промотор, который способствует инициации транскрипции, регулирующие трансляцию сигналы, содержащие сайт связывания рибосомы, сигнал начала трансляции и сигнал завершения трансляции. Все эти сигналы, за исключением сигнала завершения трансляции, должны быть расположены перед геном или другой ДНК, которые должны быть экспрессированы.

Известны несколько подходов с целью экспрессии гетерологичной ДНК (например, эукариотических генов) в прокариотах. В соответствии с одним из подходов сегмент ДНК, кодирующий искомый протеин, подвергают лигированию с ДНК, кодирующей полный бактериальный протеин или его некоторую часть под контролем бактериального промото ра. Эндогенная прокариотическая ДНК обязательно содержит также сайт связывания с рибосомой и сигнал начала трансляции. Экспрессия такой лигированной ДНК дает то, что называют протеином слияния, содержащим эукариотический полипептид, связанный с полным или частью бактериального протеина. Выделение эукариотического протеина затем можно осуществлять при помощи ориентированного на определенный сайт ферментного или химического расщепления в сайте слияния.

Примерами опубликованных работ, касающихся получения в бактериях эукариотических протеинов слияния, являются: Европейская патентная заявка N 47600 (опубликованная 17 марта 1982г.), которая относится к протеинам слияния и "однородным" протеином, содержащим бычий предгормон роста или бычий гормон роста ("бГР") на карбокси (С-) конце с порцией прокариотического протеина на амино (N)-конце; патентная заявка Великобритании N 2073245А (опубликованная 14 октября 1981г. ), касающаяся протеинов слияния бГР и -лактамазы Е. соIi; (Кешент и др. Nucleic Acid Research, 9:19 30 (1981), касающаяся протеина слияния бГР и b-лактамазы Е.coli; Европейская патентная заявка N 95361 (опубликованная 30 ноября 1983г.), касающаяся протеина слияния, содержащего последовательно эндогенный протеин на N-конце, аминокислоту сигнала начала трансляции, сайт расщепления энтерокиназой и экзогенный протеин (например, гормон роста) на C-конце.

Однако преимущества этого подхода оказываются недостаточными ввиду необходимости в последующем расщеплять гетерологичный протеин из эндогенного полипептида в соответствии с описанием, приведенным выше.

В соответствии с другим подходом сигнал начала трансляции, ATG, под контролем бактериального промотора расположен непосредственно перед ДНК-последовательностью, кодирующей гетерологичный (например, эукариотический) протеин. Хотя протеины, полученные при помощи таких генных конструкций, не требуют последующего расщепления для образования искомого протеина, они в общем случае включают метионин (в некоторых случаях формилметионин) на N-конце, так как стартовый сигнал ATG также является кодоном метионина. Таким образом, если целевой зрелый протеин не начинается с метионина, то такой протеин будет иметь N-конец, измененный включением метионинового остатка.

К примерам таких генных конструкций относятся: работа Гарента и др. Cell, (1980), т. 20, с. 543-553, в соответствии с которой ген b-глобина кролика, который обладает N-концевым валином, экспрессируется в Е.coli с использованием только что описанной генной конструкции. В результате исследований ими было установлено, что, в то время, как в b-глобине кролика отсутствует амино-концевой метионин, а лейцины содержатся в позициях 3, 14, 28, 31, 32, в меченом протеине лейцины были обнаружены в позициях 4, 15, 29, 32 и 33, а метионин был найден в позиции I. Этот результат показывает, что этот протеин является b-глобином кролика плюс амино-концевой метионин, которые не удаляются в Е.coli (см. там же, с.546-547).

Другой пример относится к получению гормонов роста в бактериях с использованием описанной выше генной конструкции. Номер и др. Proc. Nat'L Acad. Sci. USA, (1984) т.81, с. 5403-5407 описывают систему с высокой степенью экспрессии в бактерии для получения бГР, которая приводит к получению N-Met бГР, то есть соединения, содержащего аминокислотную последовательность, подобную аминокислотной последовательности одного из встречающихся в природе видов бГР плюс метионин на его N-конце. Присоединение N-концевого метионина к различным видам гормона роста, производимого бактериями, уже обсуждалось в Европейской патентной заявке N 103395, опубликованной 21 марта 1984г.) и Европейской патентной заявке N 74444 (опубликованной 30 марта 1983г.) для бГР Сибургом и др. DNA (1983) т.2, с.37-45, для бГР и свиного гормона роста ("сГР").

Присоединение N-концевого метионина к природному N-концу может быть нежелательным по нескольким причинам. Во-первых, вполне возможно (хотя в настоящее время представляется мало правдоподобным), что метионин имеет тенденцию превращать протеин в антигенный в организме, в котором протеин без N-метионина является эндогенным. Во-вторых, присоединение метионина к N-терминальной части протеина может оказать нежелательный эффект на его биологическую активность или его физические свойства. В-третьих, эта измененная форма протеина может служить препятствием для научных исследований, направленных на определение связи между функцией природного протеина и его структурой.

Способность таких прокариотов, как бактерии удалять N-концевой метионин из протеинов либо во время их получения, либо уже после их получения, привлекает в последнее время большое внимание. Например, Уоллер, J. Mol. Biol. (1963), т. 7, с. 483-496 исследовал состав N-терминальных аминокислот "растворимых" и рибосомальных протеинов их экстракта Е.coli, не содержащего клеток, а в Европейской заявке N 103395 (опубликованной 21 марта 1984г.) предложен способ удаления N-концевого метионина из эукариотического протеина, синтезированного культурой Е.coli. В частности, метионин удаляется из одного из двух упомянутых, производимых бактериями протеинов бГР, причем оба они содержат остаток серина сразу же после содержащегося с самого начала N-концевого метионина. Генная конструкция, которая была использована в этих исследованиях, однако содержала синтетическую стартовую последовательность, кодирующую 5'-метионин-серин-лейцин-3', восстановленную непосредственно рядом с 5'-концом бГР-кодирующей последовательности, в которой предварительно были удалены основания, кодирующие первые 4 или 9 встречающихся в естественных условиях аминокислот. Таким образом, полученный в результате протеин, синтезированный в культуре Е.coli отличался от природного. В патентной заявке Великобритании N 2073245А (опубликованной 14 октября 1981г.) указано, что если met pro заменить ala в зрелом бГР-протеине, то "Met" может быть переработан бактерией таким образом, что в результате получается модифицированный бГР, начинающийся в аминокислотной последовательности Pro Phe Ala Pro.

Таким образом, имеется необходимость в экономическом и предсказуемом средстве для получения в таких микроорганизмах, как бактерии гетерологичных (например, эукариотических) протеинов, которые не содержат N-концевого метионина. Особенно желательно разработать такой способ, в соответствии с которым такие протеины, полученные в бактериях, не требовали бы в лабораторных условиях обработки после ферментации и не содержали бы дополнительного, неприродного N-концевого метионина.

Гормоны роста (называемые также самототропинами) представляют собой полипептиды, продуцируемые и секретируемые клетками гипофиза и в значительной степени видоспецифичные. Наряду с их ролью в ускорении роста скелета, гормоны роста оказывают влияние на многочисленные метаболические процессы, включая стимулирование выделения молока, увеличение высвобождения инсулина из поджелудочной железы и выделения глюкогона, кроме того, они оказывают эффект мобилизации липидов. Экзогенное применение бГР к крупному рогатому скоту, например, приводило к увеличению надоев молока, эффективности корма и/или скорости роста, снижению времени откармливания и увеличению отношения: постная часть мяса/жир. Однако до сих пор не полностью ясно, как этот гормон вызывает столь многочисленные эффекты.

Известно, что бГР (бычий гормон роста) имеет несколько форм. В частности, синтезируется четыре вида бГР, которые отличаются в двух позициях протеина N-концевая аминокислота может варьировать из-за вероятной неоднозначности при удалении сигнальной пептидной последовательности таким образом, что зрелый протеин начинается с NH2-phe-pro, либо с NH2-ala-phe-pro. Кроме того, имеется некоторая неоднородность в аминокислоте 126, которая является либо лейцином, либо валином.

Четыре молекулярные формы (вида) гипофизарного бГР здесь обозначаются и эти обозначения сокращаются следующим образом: Сокращения Структура бГР (Л) NH2-phe (I)-pro (2).Leu(126).COOH бГР (А,Л) NH2-ala (-I)-phe (I) -pro(2). Leu(126).COOH бГР (В) NH2-phe(I)-pro(2).Val(126).COOH бГР (A,В) NH2-ala(-I)-phe(I)-pro(2).Val(126).COOH Миллс и др. (1970) J. Biol. Chem, 245, с.3407-3415, в точности так же идентифицировал два N-концевых фрагмента свиного гормона роста (сГР). В частности, один фрагмент содержал N-концевой фенилаланин, а другой - дополнительный N-концевой аланин. Эти молекулярные формы сГР в дальнейшем коротко обозначаются через сГР(Ф) и сГР(А) соответственно.

Полные ДНК-кодирующие последовательности и соответствующие аминокислотные последовательности для бГР(Л) и сГР(Ф) были опубликованы Сибургом и др. DNA(1983), 2, с.37-45 и эта работа используется здесь в качестве ссылки.

Целью настоящего изобретения является получение в бактериях аланиновой формы свиного гормона роста pGH(A), не содержащей дополнительного N-концевого метионина и свободной от формы с phe на N-конце. При этом осуществляют следующие стадии: а) культивирования одноклеточного организма, содержащего рекомбинантный вектор, включающий фрагмент ДНК, кодирующий указанный гормон, и б) выделения указанного гормона из культуры.

На приведенных фигурах штриховым контуром изображена кодирующая последовательность ДНК бактериального промотора, зачерненный контур представляет кодирующую последовательность гетерологичной ДНК, черточками изображены дополнительные кодирующие последовательности ДНК (они конкретно указаны на рисунках), а направленная стрелка указывает на ориентацию от 5' и 3' кодирующих последовательностей ДНК. Указаны также соответствующие сайты рестрикции эндонуклеаз. Отмеченные области ДНК приведены только с целью наглядного представления и они не связаны с реальными размерами этих областей.

На фиг.1 представлена конструкция M13mp8/Xbal, содержащая вектор M13mp8, имеющий вставленный в сайт рестрикции Sma I сайт рестрикции Xbal.

На фиг. 2 представлена конструкция M13mp 8/BG Hex-I, содержащая M13mp8/Xbal, несущую кодирующую бГР(Л) последовательность ДНК.

На фиг.3 представлена конструкция кодирующей бГР(А,Л) последовательности ДНК, полученная при помощи сайт-направленного мутагенеза.

На фиг. 4 представлена конструкция кодирующей бГР(А,B) последовательности ДНК, полученной при помощи сайт-направленного мутагенеза.

На фиг. 5 представлена конструкция M13mp9/PG Hex-I, содержащая M13mp 9 и кодирующую сГР(Ф) последовательность ДНК.

На фиг. 6 представлена конструкция кодирующей сГР(А) последовательности ДНК, полученной при помощи сайт-направленного мутагенеза.

На фиг. 7 представлена конструкция pBGHex-*I , соответствующая pBGHex-I, в которой сайт рестрикции EcoRI, расположенный по направлению вверх от 5' - конца кодирующей ptrp последовательности ДНК, был предварительно удален.

На фиг. 8 представлена конструкция вектора экспрессии pMON 3213, содержащего вектор pBGHex-I, несущий кодирующую сГР(А) последовательность ДНК вместо кодирующей бГР(Л) последовательности ДНК.

Настоящее изобретение представляет важный способ получения в прокариотах гетерологичного полипептида такого, как эукариотический (например, млекопитающего или птиц) протеин, который содержит N-концевой аланин. Таким образом, непосредственно получают полипептид без N-концевого метионина, что исключает необходимость в обработке предшественника в лабораторных условиях. Устойчивое получение такого полипептида без N-концевого метионина, не содержащегося в исходно кодирующей последовательности гена, является новым и совершенно неожиданным результатом.

Настоящее изобретение представляет весьма эффективный способ получения существенно чистых протеинов, которые имеют N-концевой аланин. К таким протеинам относятся без каких-либо ограничений упомянутые виды бычьего и свиного самототропина и его варианты, растительные протеины, а именно, малая субъединица рибулозо-1,5-бисфосфаткарбоксилазы, S-трансфераза глутатиона и протеин 70 теплового шока. Кроме того, настоящее изобретение можно эффективно использовать для получения других полипептидов, когда желательно иметь на N-конце аланин, а не метионин.

До сих пор во всех работах, посвященных экспрессии бГР и сГР в бактериальных клетках, в которых N-конец содержит N-концевую аминокислотную последовательность, гомологичную встречающимся в природе бГР, описано присутствие N-концевого метионина.

В статье Сибурга и др. DNA (1983) 2, с.37-45, на с.44 указано, что последовательность гена для N-концевых фенилаланиновых видов бГР, например бГР(Л), умышленно выбирается для экспрессии в культуре E.coli частично, чтобы избежать ожидаемого присоединения второй гидрофобной аминокислоты (метионина) к гидрофобному N-концевому аланину. Таким образом, доступные до настоящего времени исследования указывают на наличие N-концевого метионина в синтезированных бактериями видах ГР.

Как это более подробно описано в примерах реализации настоящего изобретения, подход заявителя с целью получения с ГР(А) или pGH(A) в бактериях, если очень коротко, заключается в следующем. Кодирующие вышеупомянутые протеины последовательности ДНК получают при помощи сайт-направленного мутагенеза последовательностей ДНК, кодирующих бычьи и свиные виды самототропина, содержащие N-концевой фенилаланин, как это показано на фиг. 3, 4 и 6. Затем полученные последовательности вставляют в векторы экспрессии таким образом, что окончательная последовательность содержит последовательно промотор, сайт связывания с рибосомами, стартовый кодон ATG (метионин), непосредственно примыкающий к последовательности ДНК, кодирующей pGH(A), и, наконец, стоп-кодон трансляции. Культуру E.coli затем подвергают трансфекции полученным вектором экспрессии, несущим искомую последовательность гена, и культивируют при условиях, которые позволили бы осуществить экспрессию искомой гетерологичной ДНК, и получить тем самым искомый гетерологичный протеин. Затем полученные таким образом протеины анализируют с точки зрения анализа их последовательности и соответствующей биологической активности.

Таким образом, в соответствии с настоящим изобретением устанавливается что, когда ДНК-последовательность, содержащая стартовый кодон (метионин), а затем сразу же кодоны гетерологичного N-аланилового полипептида, подвергаемого экспрессии, то протеин, выделенный из прокариотического организма, действительно содержит аланин на N-конце, а не метионин. Представляется правдоподобным, что аналогичный результат может быть получен, если этот аланиновый кодон расположен вслед за примерно тремя соседними метиониновыми кодонами, которые включают сигнал начала трансляции иРНК, кодирующей целевой полипептидный продукт. Например, ДНК, включающая этот сигнал начала трансляции и кодоны целевого полипептидного продукта, может включать любую последовательность, которая соответствующим образом кодирует met ala, met met ala, met met met ala или любой его функциональный эквивалент.

В предпочтительном варианте воплощения настоящего изобретения три различных штамма E. coli K12, каждый из которых был депонирован в Американской коллекции Типов Культур, Роквил, Мерилэнд, под номерами ATCC 39936, 53010 и 53009 соответственно обладают способностью удалять N-концевые метионины в том случае, когда после вышеупомянутых N-концевых метионинов следует сразу же аланин.

Это открытие представляется значительным, так как оно дает способ получения в прокариотах гетерологичных полипептидов, которые содержат N-концевые аланины.

В одном из предпочтительных вариантов осуществления способа, являющегося предметом настоящего изобретения он используется для получения двух видов бГР, бГР(А,Л) и бГР(А,В), и особенно одного вида сГР(А), которые не содержат других бычьих и свиных протеинов и/или сГР видов соответственно. В частности, этот способ обеспечивает получение pGH(A), как одного единственного вида.

В соответствии с одной из своих самых широких реализаций настоящее изобретение представляет собой углубление в использовании технологии рекомбинантной ДНК с целью непосредственного получения в прокариотах гетерологичных полипептидов.

Таким образом, описание настоящего изобретения предполагает знакомство с основными приемами, которые используются в технологии рекомбинантной ДНК с целью изоляции и клонирования последовательностей ДНК, кодирующих полипептид, с перераспределением или изменением клонированных последовательностей ДНК и экспрессией клонированных или модифицированных последовательной ДНК в трансформированных микроорганизмах. С приемами знаком любой специалист в этой области техники (например, Молекулярное клонирование. Лабораторное Руководство, под ред. Маниатиса и др. 1982г.).

Выделение или/и конструирование гетерологичной ДНК В соответствии с одним из воплощений настоящего изобретения ДНК-последовательность, кодирующую искомый гетерологичный полипептид, подлежащий продуцированию в прокариоте, выбирают и выделяют, или ДНК-последовательность, которая его кодирует, конструируют или синтезируют химически. Во многих важных вариантах воплощения таким полипептидом является эукариотический протеин. Если полипептид является небольшим и известна полная аминокислотная последовательность, то можно построить синтетическую ДНК-молекулу или последовательность, кодирующую этот полипептид. Если аминокислотная последовательность полипептида неизвестна или ее размеры слишком велики для того, чтобы практически реализовать синтез соответствующей ДНК-последовательности, можно получить последовательность кДНК при помощи обратной транскрипции из соответствующей иРНК, полученной из тканей или клеток, экспрессирующих этот полипептид. Например, в одной из реализаций настоящего изобретения такая последовательность для бГР может быть получена из бычьих гипофизов при помощи известных в настоящее время приемов, описанных Гудмэном и др. в Методах Ферментологии, т.68, с.75-90 (1979). В качестве альтернативы кДНК-последовательность может быть получена из иРНК, выделенной из клеток, трансформированных геномной ДНК, выделенной из нативного генного белка при помощи соответствующего зонда. Геномная ДНК может быть также модифицирована в различных векторных системах таким образом, что ДНК может быть экспрессирована в прокариотах. Эти приемы известны каждому специалисту в этой области техники.

После того, как получена гетерологичная ДНК-последовательность, содержащая кодоны искомого полипептида, может оказаться желательным осуществить некоторые модификации в нуклеотидной последовательности этой молекулы. Например, если эта молекула была получена при помощи обратной транскрипции из матрицы иРНК, то она будет часто содержать по крайней мере часть ДНК, кодирующую главную последовательность предпротеина. Таким образом, необходимо удалить всю ДНК главной последовательности перед первым кодоном искомого протеина. В некоторых случаях может оказаться необходимым добавить или включить кодон аланина взамен другого кодона в начале последовательности, кодирующей искомый протеин, если он еще имеет кодона N-концевого аланина. Затем вводят сигнал начала трансляции (который также является кодоном метионина) перед и непосредственно рядом с кодоном аланина. Несмотря на то, что комплекс стартовый сигнал/кодон метионина будет в общем случае и в предпочтительном варианте нуклеотидной последовательности ATG, последовательность GTC может также иногда служить в качестве комплекса стартовый сигнал/кодон метионина. Кроме того, присутствие более одного кодона метионина, например, двух, трех, и может быть еще большего количества соседних кодонов метионина, необходимо рассматривать как незначительную модификацию в рамках способа, предлагаемого в соответствии с настоящим изобретением.

По крайней мере один сигнал прекращения трансляции должен быть введен после кодона-C-концевой аминокислоты, если его там не было до этого. Примерами сигналов прекращения трансляции являются дезоксинуклеотидный триплет TAA, TGA, TAG. Таким образом, по существу, применяются методы рекомбинантной ДНК с целью конструирования последовательности рекомбинантной ДНК, содержащей последовательно сигнал начала трансляции/кодон метионина, кодоны для искомого полипептида с кодоном N-концевого аналина, примыкающим к стартовому сигналу, и по крайней мере один сигнал прекращения трансляции, примыкающий к кодону C-концевой аминокислоты.

Было установлено, что эффективной экспрессии иРНК могут препятствовать вторичные структуры, образованные водородом, связывающим две комплементарные серии нуклеотидов внутри иРНК. Исключение этих комплементарных последовательностей, в частности, в той части молекулы, которая кодирует N-конец, упрощает связывание рибосом с иРНК и, следовательно, увеличивает степень экспрессии. Может оказаться, следовательно, желательным заменить кодоны, которые участвуют в образовании таких вторичных структур, кодонами той же аминокислоты, но состоящими из другого нуклеотидного триплета (см. ЕП N 75444, опубликованный 30 марта 1983, Сибург и др. 1983, DNA 2, с.37-45, и Шонер и др. 1984, Proc. Nat'l. Acad Sci.USA, 81, с.5403-5407).

Другие подходы к построению гетерологичных последовательностей ДНК будут очевидны каждому специалисту в этой области техники. Например, если имеется в распоряжении молекула ДНК, которая кодирует полипептид, который подвергается экспрессии N-концевой структурой типа NH2-met-X-y. где x является аминокислотой, отличной от аланина, то кодон аланина может быть вставлен между комплексом сигнал начала трансляции/кодон метионина и кодоном для x. В качестве альтернативы, кодон для x может быть изъят, а кодон аланина вставлен вместо него. Таким образом, при помощи способа, являющегося предметом настоящего изобретения, получили бы протеин, имеющий N-концевую структуру NH2-ala-x-y, или NH2-ala-y, соответственно.

В точности так же можно осуществить удаления, добавления и/или замены в любом из кодонов аминокислоты внутри данной последовательности гена таким образом, что при помощи способа, являющегося предметом настоящего изобретения, можно осуществить экспрессию вариантного полипептида. "Вариантный" полипептид, содержит один или несколько аминокислотных пробелов, замен и/или добавлений по сравнению с встречающейся в природе аминокислотной последовательностью данного полипептида. Примеры таких вариантов включают (но ими не ограничивается весь список) е бГР/Л и е бГР(В), в которых аминокислотная последовательность этих вариантных видов бГР идентична бГР(Л) и бГР(В) соответственно полученным при помощи бычьих гипофизарных клеток, за исключением присутствия дополнительного метионина на N-конце. Эти вариантные полипептиды получают как имеющие аминокислотную последовательность, существенно такую же, что и аминокислотная последовательность встречающегося в природе полипептида, если только биологическая активность не снижается до недопустимого предела. Конструирование и экспрессия вариантных полипептидов может оказаться желательной для того, чтобы добиться более значительного накопления, более высокой стабильности протеина, чтобы упростить стадию очистки полипептида и/или оптимизировать его биологическую активность.

Описанные выше модификации молекулы ДНК, кодирующей целевой полипептид, могут быть осуществлены с использованием ферментов рестрикции, экзонуклеаз, эндонуклеаз и т. д. при помощи приемов, известных в этой области техники. Можно также использовать общие приемы сайт-направленного мутагенеза с тем, чтобы осуществить вышеуказанные модификации в структуре или последовательности молекулы ДНК, эти приемы также известны каждому специалисту в этой области техники. См. например, Золлер Смит (1982) Nac. Acids. Res. т.10, с. 6487-6500; Золлер и Смит (1983) Meth.Enzymol. 100, с.468-500, Норрис и др. (1983) Nuc. Acids. Res. т.11, с.5103-5112.

В соответствии с известными приемами технологии рекомбинантных ДНК после того, как получена искомая последовательность гетерологичной ДНК, далее эту последовательность вставляют в соответствующий клонирующий вектор, который обеспечивает средство для репликации ДНК-последовательности. При этом можно использовать любой подходящий клонирующий вектор в предпочтительном варианте, содержащий маркерную функцию, например, плазмидные векторы E.coli, которые содержат Col EI Херифилд и др. Proc. Nat'l. Acad. Sci. USA, (1974), т. 71, с.3455, pEP322; Боливар и др. Gene, (1977), т.2, с.95, pBP325; Себерон и др. Gene, (1978), т.4, с.122, и pkc7; Рао и др. Gene (1979), т.7 с.79; и векторы бактериофага E.coli, которые включают L 47.1, Шарон, Лоенен и др. Gene, (1980), т.10, с.249; и M13mp8 и M13m p9, Мессинг и др. Gene (1982), т. 19, с. 269. Общие приемы введения вышеупомянутой последовательности ДНК в клонирующий вектор с целью создания рекомбинантного вектора известны каждому специалисту в этой области техники. См. например, книгу "Молекулярное клонирование Лабораторное Руководство", под ред. Маниатиса, и др. 1982 г.

После того, как получены несколько копий искомой последовательности гетерологичной ДНК, эти последовательности можно выделить из рекомбинантных векторов и вставить в систему экспрессии с целью получения и выделения целевого гетерологичного протеина в соответствии с описанием, которое более детально дано ниже. Перед вставкой этих последовательной ДНК в вектор экспрессии можно осуществить различные модификации последовательности гетерологичной ДНК при помощи приемов, известных каждому специалисту в этой области техники, при помощи известных приемов модификации можно также осуществить уже после вышеупомянутой вставки.

В примерах реализации настоящего изобретения наряду с M13mp9, описанным Мессингом и др. Gene (1982), т.19, с.269, а качестве клонирующего вектора был выбран M13mp8, описанный там же, модифицированный таким образом, чтобы он содержал сайт рестрикции Xbal, как это указано на фиг. 1. Векторы M13mp8 и M13mp9, которые вместе именуются как "векторы M13", позволяют изолировать рекомбинантные векторы как в двухнитевой или репликативной форме (РФ), так и однонитевой форме ДНК. Изоляция рекомбинантных векторов РФ ДНК упрощает последующее введение искомых последовательностей ДНК после репликации в векторы экспрессии, как это показано например, на фиг. 8. В качестве альтернативы изоляция однонитевой формы этих рекомбинантных векторов упрощает как изоляцию рекомбинантных векторов, которые содержат искомую последовательность ДНК с правильной 5' --> 3' ориентацией для экспрессии, так и построение любой модификации последовательности ДНК при помощи таких приемов, как сайт-направленный мутагенез, как это показано на черт. 2, 4 и 6. Кроме того, эти векторы M13 могут "согласовывать" фрагменты ДНК или гены длиной до 4 килооснований (кб), которые обеспечивают клонирование типичной, полной, эукариотической генетической последовательности.

Маркерная функция, используемая в векторах M13, как это описано Мессингом и др. Gene, (1982), т.19, с.269, включает фермент галактозидазу. В частности, искомую последовательность гетерологичной ДНК вставляют во фрагмент lac z гена, который содержится на векторе M13, что нарушает нормальную комплектацию фрагмента lac z гена, содержащегося на векторе M13, частичным фрагментом lac z гена, содержащегося в хромосомной ДНК клетки-хозяина (например, jMIOI E. coli), так, что вышеупомянутый хозяин уже не способен включать в обмен веществ лактозу, содержащуюся в среде для роста бактерий E.coli после инфицирования векторами M13, которые не содержат инородной генетической последовательности, вставленной во фрагмент lac z гена, способны включать в обмен веществ лактозу, содержащуюся в среде для выращивания бактерий, и вырабатывают характерные голубые бляшки, если эти бактерии выращиваются на агаре, включающем среду I x YT, содержащую 0,8% (в/о) триптона, 0,5% (в/о) экстракта дрожжей, 0,5% (в/во) NaCl и цветовой индикатор для b галактозидазы. Когда бактерии растут на вышеупомянутой среде, бляшки E. coli после инфицирования рекомбинантными векторами, несущими вставленную последовательность гетерологичной ДНК в генном фрагменте lac z вектора M13, прозрачны или бесцветны. Следовательно, положительная вставка последовательности гетерологичной ДНК в эти клонирующие векторы устанавливается в результате образования бесцветных бляшек инфицирования клетки-хозяина E.coli рекомбинантным вектором. Вставка последовательностей ДНК, кодирующих бГР(Л) и сГР(Ф), в векторы М13 представлена на фиг. 2 и 7, соответственно.

В предпочтительном варианте воплощения настоящего изобретения последовательности ДНК, кодирующие бГР(Л) и сГР(Ф), содержащиеся на бактериальных плазмидах pBGHex-I и pPGHex-I соответственно, как это описано у Сибурга и др. DNA (1983), 2(1), с. 37-45, выделяют из этих плазмид при помощи рестриктазы в специальном сайте. Необходимо отметить, что бактерии после трансфекции бактериальными плазмидами pBGHex-I или pPGHex-I соответственно и последующего культивирования при условиях, которые позволяют получить экспрессию последовательностей, кодирующих бГР(Л) и сГР(Ф) соответственно продуцируют соматотропин с N-концевым метионином (например, met-бГР(Л)met-сГР(Ф) соответственно). Соответствующие последовательности затем вставляют в РФ ДНК модифицированного вектора М13mp8 (M13mp8/Xbal) и вектора М13mp9, как это показано на фиг. 2 и 5, соответственно. Вставка искомых последовательностей ДНК бГР(Л) и сГР(Ф) и РФ ДНК M13mp8/Xbal и М13mp9 подтверждалась при помощи рестрикционного анализа, как это снова показано на фиг. 2 и 5 соответственно jMIOI E.coli затем подвергают трансфекции одним из этих рекомбинантных векторов, как это описано Мессингом и др. Methods in Enzymology (1983), т.101, с. 20, и однонитевую ДНК рекомбинатных векторов изолируют в соответствии с описанием, данным Мессингом и др. Gene (1982), т.19, с.269. Соответствующие абзацы этих работ Мессинга и др. используются здесь в качестве ссылок.

После выделения различные однонитевые ДНК этих рекомбинантных векторов модифицируют при помощи сайт-направленного мутагенеза с тем, чтобы получить кодирующие последовательности ДНК для бГР(А,В), бГР(А,Л), бГР(В) и сГР(А). В частности, бГР(Л) модифицируют добавлением кодона аланина, например, GCC, на 5' конце кодирующей бГР(Л) последовательности, как это показано на фиг. 3. Следует ожидать, что таким образом можно добавлять любой из четырех кодонов аланина. Предпочтительным кодоном аланина для оптимального выхода соматотропина в системе экспрессии, используемой в соответствии с настоящим изобретением, является GCC. Подтверждение присоединения кодона аланина при конструировании кодирующей бГР(А, Л) последовательности достигается в результате анализа полной последовательности ДНК бГР(А,Л) или ее 5'-конца с использованием метода Сэнгера и др. Proc. Nat'l. Acad. Sci. USA, (1077), т.74, с.5468.

Кодирующая бГР(А,В) последовательность конструируется при помощи сайт-направленного метагенеза кодирующей бГР(А, Л) последовательности, как это показано на фиг. 4, при помощи превращения кодона лейцина в аминокислотной позиции 127 [в бГР(А,Л)] в кодон валина, например, GTG. Снова можно ожидать, что при таком превращении можно использовать любой кодон для валина. Правильность конструкции кодирующей бГР(А,В) последовательности снова подтверждается при помощи анализа результирующей кодирующей бГР(А,В) последовательности.

Кодирующая бГР(В) последовательность, которая проявляется в синтезе протеинов met-бГР(В) бактериями после трансфекции векторами экспрессии, содержащими кодирующую бГР(В) последовательность, конструируется аналогично при помощи сайт-направленного мутагенеза кодирующей бГР(Л) последовательности при помощи превращения кодона лейцина в аминокислотной позиции 126[бГР(Л)] в кодон валина, например, GTG.

Конструирование кодирующей сГР(А) последовательности при помощи сайт-направленного мутагенеза кодирующей сГР(В) последовательности осуществляют в точности так же, как это показано на фиг. 6 и описано более полно ниже, а правильность конструкции подтверждается анализом последовательности ДНК.

После выделения и конструирования искомых последовательностей гетерологичной ДНК по аналогии с примерами для бГР(А,Л), бГР(А,В) и сГР(А), эти последовательности могут быть подвернуты репликации и получены многочисленные копии в результате амплификации соответствующих рекомбинантных векторов с использованием приемов, известных каждому специалисту в этой области техники, и которые уже были указаны выше. Такие последовательности гетерологичной ДНК могут быть вставлены в любые подходящие векторы экспрессии с целью продуцирования в прокариотах искомых гетерологичных полипептидов.

Получение полипептидов с N-концевым аланином.

Как уже было указано выш