Нуклеотидная последовательность гена xpr 2 yarrowia lipolytica (варианты), штамм дрожжей yarrowia lipolytica (варианты)

Реферат

 

Данное изобретение относится к технологии получения протеинов с использованием рекомбинантных штаммов дрожжей Yarrowia lipolytica. Предложены нуклеотидные последовательности гена ХРR2: сигнальная, рrо-1 последовательность, рrо-2 последовательность, промотор, терминирующая последовательность. Также предложены штаммы дрожжей Yarrowia lipolytica, продуцирующие прореннин и человеческий анафилатоксин С5а. Изобретение позволяет получать высококачественный продукт в легко отделяемой форме. 15 с.п. ф-лы, 13 ил., 9 табл.

Заявка является частичным продолжением заявки, серийный номер 789206, поданной 18 октября 1985 г.

Данное изобретение относится к технологии выделения протеинов дрожжей. Более конкретно оно относится к рекомбинантным векторам клонирования Yarrowia lipolytica содержащим чужеродную ДНК, кодирующую экспрессию и выделение протеинов млекопитающих (напр., прохимозина) и других полипептидов; к векторам экспрессии, содержащим промотор гена Y. lipolytica /напр., XPR2 или LEU2/, сигнальную /или предсигнальную/ последовательность щелочной протеазы, прорегион и участок терминатора XPR2 и их варианты и функциональные эквиваленты, возникающие при вырождении генетического кода или использования других генных компонентов Y. lipolytica. Кроме того, изобретение относится к трансформантам дрожжей, несущим указанные векторы экспрессии и выделения, их использованию для получения чужеродных протеинов в их нативной, функциональной форме и методам осуществления вышеуказанного.

Экономическая привлекательность как надежного и с достаточно высоким выходом метода производства множества протеинов или полипептидов, представляющих интерес для промышленности (напр. прореннина, бычьего гормона роста) или для медицинских целей (напр. урогастрона, активатора тканевого плазминогена, человеческого анафилатоксина C5a) и в особенности как источника, дающего высококачественный продукт в легко отделяемой функциональной форме, привели многих исследователей к приложению ДНК-рекомбинантной технологии к микроорганизмам как "фабрикам" для производства чужеродных протеинов.

Обширные исследования сконцентрированы на секреции протеинов как потенциальном разрешении трудностей, встретившихся при извлечении чужеродных /нетерологичных/ или экзогенных протеинов в биологически активной форме из внутриклеточных скоплений и рекомбинантных клетках хозяина, в особенности Escherichia coli B E.coli чужеродный протеин часто производится в клетке в форме преломляющих тел включения. Эти протеины обычно имеют низкую растворимость в воде и малую биологическую активность или не имеют ее. Извлечение данных протеинов из преломляющих тел включения обычно требует жесткой химической обработки, которая может быть дорогостоящей и может приводить к малому извлечению или отсутствию извлечения протеина в желаемой нативной, биологически активной форме. Кроме того, возможность загрязнения протеина нежелательными веществами, производимыми E.coli, увеличивается ввиду необходимости разрушения клеток для освобождения преломляющих тел. Другие организмы, кроме E.coli также производят чужеродные протеины в нерастворимой внутриклеточной форме. Например, патент Великобритании N 2091271, опубликованный 28 июля 1982, описывает генетическую модификацию S.cerevisiae путем ДНК-рекомбинантной технологии для экспрессии телячьего реннина, или химозина; эти термины используются в патенте взаимозаменяемо. Ввиду этих трудностей обратились к секреции упомянутых протеинов в попытке получения протеинов в нативной, активной конфигурации.

Выделяется ли какой-либо протеин, включая чужеродные протеины, или полипептид данным организмом, как представляется, зависит от протеина. В большинстве эукариотических клеток часть аппарата синтеза протеинов связана с эндоплазмичной сетчатой мембраной, и последовательность аминокислот /называемая "сигнальной последовательностью"/ у аминоконца растущей полипептидной цепи служит для направления пересечения протеином мембраны. Сигнальная последовательность затем расщепляется протеолитически, давая активный готовый протеин. Для ускорения процессов выделения чужеродных протеинов было сделано несколько попыток использовать сигнальные последовательности в микроорганизмах, включая Bacillus subtilis, Sacoharomyces serevisiae и культуры клеток млекопитающих. Однако данные организмы оказались не идеальными.

Присущие B. subtilis свойства, например выделение многих протеинов, включая многочисленные протеазы, которые способны деградировать выделяемый чужеродный протеин, нестабильность трансформированных штаммов, возникающая вследствие потери чужеродной ДНК, препятствуют его использованию.

Клетки млекопитающих успешно модифицировать генетически для экспрессии и выделения чужеродных протеинов, но эти системы технологически сложны и дорогостоящи для обработки и не имеют практического применения для коммерческого производства большинства протеинов.

Хотя исследования выделения протеинов были более успешны с S. cerevisiae , чем с B. Subtilis, даже S. cerevisiae, как представляется, имеет внутренние ограничения как система выделения протеинов. Европейская патентная заявка N 0123544, опубликованная 31 октября 1984, описывает изолирование - фактор-генов и использование промотирующих и/или сигнальных пептидных частей их в сочетании с ДНК, кодирующей чужеродные для дрожжей протеины, в плазмиде для трансформации клеток дрожжей, способных производить отдельный готовый протеин в клеточной культуре. Европейская заявка N 0088632, опубликованная 14 сентября 1983, описывает способ экспрессии и выделения чужеродного протеина в S. cerevisiae. Однако размер протеинов, которые S.cerevisiae эффективно выделяет с данной и другими системами выделения, как представляется, ограничен примерно 20000 дальтон. Преодоление этой неэффективности S.cerevisiae как организма выделения потребовало многих мутационных изменений, как описано Smith и др., Science 229, 1219 - 1224 /1985/. Единственным исключением для этого направления является наблюдение, что ферменты Aspergillus величиной более 20000, видимо, могут выделяться S. cerevisiae, но эти ферменты сильно гликозирируются S. cerevisiae, и это может влиять на эффективность выделения.

Особый интерес заключается в Yarrowia lipolytica, промышленно важном виде дрожжей, используемом для производства лимонной кислоты и клеточных протеинов. Он также может быть использован для получения эритрита, таннита и изопропиляблочной кислоты. В противоположность S. cerevisiae, Y. lipolytica представляет особый интерес и ценность из-за своей способности эффективно выделять высокомолекулярные протеины (щелочную протеазу, кислую протеазу и ДНК-азу) в культурную среду, предоставляя таким образом потенциальную возможность извлечения чужеродных протеинов в нативном состоянии без необходимости разрушения продуцирующих клеток. Кроме того, Y. lipolytica количественно выделяет очень мало протеинов, таким образом предоставляя возможность получения нужного чужеродного протеинов в питательной среде в качестве доминирующей разновидности протеинов и облегчая извлечение указанного чужеродного протеина.

Y. lipolytica производит большое количество внеклеточной протениазы. Это доминирующий протеин, выделяемый Y. lipolytica. Вид протеазы /щелочной, кислый или нейтральный/ зависит от штамма использованной Y. lipolytica /Ogrydziak и др. J. Gen. microbiol /1982/ 128, 1225 - 1234/. Частичный анализ N-концевой аминокислотной последовательности щелочной внеклеточной протеазы описан Ogrydziak и др. /ук. соч./.

Рассматриваемая заявка серийный N 634505, поданная 25 июля 1984, описывает методы трансформации Y. lipolytica и клонирования генов Y. lipolytica путем комплементации мутаций. В ней описано клонирование гена XPR2, который кодирует выделяемую щелочную протеазу, путем комплементации XPR2 мутаций Y. lipolytica. Метод включает трансформацию штамма-хозяина Y. lipolytica с частичным дайджестом BglII библиотеки генов Y. lipolytica в вектор pID40, описанный в Европейской заявке N 0138508, опубликованной 24 апреля 1985 г., являющейся дубликатом вышеуказанной заявки США.

Данное изобретение предусматривает: рекомбинантные векторы клонирования Y. lipolytica, содержащие чужеродную ДНК, кодирующую протеины млекопитающих и другие полипептиды, включая плазмиды, пригодные для трансформации клеток хозяина Y. lipolytica и в особенности интегративные векторы экспрессии, содержащие ген-промотор LEU2, ген-промотор XPR2, препрорегион щелочной протеазы и концевой регион XPR2; и плазмиды экспрессии, имеющие чужеродную кодирующую последовательность с сигналами выделения XPR2 ниже по течению от промотора LEU2, которые способны вызывать экспрессию и выделение чужеродного протеина в Y. lipolytica, трансформируемой при этом.

Изобретение, таким образом, иллюстрирует процесс экспрессии и выделения готовых чужеродных протеинов, в особенности прореннина и человеческого анафилатоксина C5a, из генетически измененных клеточных культур Y. lipolytica, установление точной идентичности аминокислотной последовательности, а также последовательности ДНК для внеклеточной щелочной протеазы Y. lipolytica позволило предположить, что чужеродный протеин может быть экспрессирован и выделен с помощью ДНК-рекомбинантной технологии для производства в клеточной культуре. В случае прореннина готовая форма зимогена/предшественник реннина/ выражается и выделяется.

Было обнаружено, что Y. lipolytica может быть генетически модифицирована с помощью ДНК-рекомбинантной технологии с получением трансформантов, способных к экспрессии и выделению чужеродных протеинов в их нативной форме. Это достигается путем конструирования векторов, несущих сигнальную последовательность или сигнальную и первую /про1/ или обе пропоследовательности /про1, про2/ гена XPR2, связанные со структурной генной последовательностью для чужеродного протеина, который необходимо выделить.

Трансформанты, получаемые интеграцией в локусе XPR2 вектора ДНК, содержащей фрагмент гена XPR2 с отсутствующими регуляторами или структурными компонентами на обоих концах гена, не выделяют более щелочной протеазы, характеристика, не только желательная для выделения чужеродного протеина, но и которая может быть использована для скрининга транcформантов.

Кроме того, векторы, несущие промотор XPR2 и последовательности для сигнальной последовательности выделение щелочной протеазы, способны в трансформированной клетке вызвать выделение готового чужеродного протеина. Некоторые ДНК-рекомбинантные векторы этого типа способны вызвать экспрессию/выделение независимо от сайта интеграции в геноме дрожжей. Вообще, векторы, содержащие подходящие 5' и 3' - боковые ДНК, вызывают экспрессию продукта независимо от сайта интеграции.

Кроме того, было неожиданно обнаружено, что интеграция pBR322 производной плазмиды в хромосомную ДНК Y. lipolytica создает область гомологии, способную благоприятствовать дальнейшей сайт-направленной интегративной трансформации. Интегрированная копия pBR322 служит, таким образом, "доком" для входящей трансформирующей ДНК. Интеграция резидент-копии pBR322 в хромосомную ДНК Y. lipolytica, несмотря на то, что pBR322 не является нативной ДНК Y. lipolytica, таким образом создает известную мишень для интеграции. Трансформированные реципиенты Y. lipolytica, содержащие такой сайт, обладают двумя главными преимуществами перед реципиентами, у которых подобный сайт отсутствует, а именно: наличие региона с известной последовательностью и известной рестрикционной картой в качестве мишени для сайт-направленной интеграции и возможность определить, используя pBR322 как мишень для интеграции, содержит ли входящая плазмида полную функциональную единицу или ген или только часть нужного гена. Например, плазмида, содержащая только 3'-фрагмент гена XPR2, может трансформировать реципиент XPR2 - 1002, если она содержит кодон дикого типа и интегрирована в локусе XPR2. Однако та же плазмида не будет трансформировать клетку-хозяина XPR2-1002 к положительному фонотипу протеазы, если интегрирована в pBR322, так как в ней отсутствует целая функциональная единица.

Таким образом, в трансформантах Y. lipolytica, содержащих область гомологии к чужеродному вектору ДНК, указанная область, содержащая экзогенную ДНК, служит в качестве принимающего сайта во время интегративной трансформации Y. lipolytica. В дополнение к pBR322 и ее производным, космиды, бактериофаги, такие как M13 и лямбда, синтетические ДНК и обычные плазмиды, такие как p и C13, могут быть использованы для получения трансформантов Y. lipolytica, имеющих "док".

Под промотирующей последовательностью LEU2 понимается нетранслированный участок вверх по течению от ATG, который содержит большинство, если не все, черты, требуемые для экспрессии. Под промотирующей последовательностью XPR2 понимается нетранслированный участок вверх по течению перед сигнальной /или предсигнальной/ последовательностью, которая необходима для экспрессии. Кроме того, сигнал, с или без пропоследовательности, из гена XPR2 может быть использован для выделения протеинов под контролем экспрессии промоторов Y. lipolytica иных, чем гена XPR2. Таким образом, векторы, несущие промотор LEU3 и последовательности для сигнала выделения щелочной протеазы, способны в трансформированной клетке Y. lipolytica вызвать выделение готовых чужеродных протеинов.

Человеческий анафилатоксин C5a, также известный как человеческий дополнительный протеин C5a /человеческий C5a/, представляет собой биоактивный полипептидный фрагмент, генерируемый in vivo в результате комплементарной активации. Он функционирует как иммуномодулятор при регулировании определенных аспектов гуморальной и клеточной иммунореакции. Изучена первичная структура его и других анафилатоксинов. Обзор химических, физических и биологических характеристик представлен Hugli в "Complement", под редакцией H.J. Muller-Eberhard и P.A.Mcischer, cc. 73-99, 1985, Springer-Verlag, New-York.

Специалистам в данной области понятно, что в настоящем изобретении может быть использована с соответствующими необходимыми изменениями чужеродная ДНК, кодирующая фактически любую известную аминокислотную последовательность. Методика, описанная здесь, может быть применена с соответствующими необходимыми изменениями для получения и выделения любых известных чужеродных протеинов, представители которых перечислены в патенте США N 4532207, опубликованном 30 июля 1985 г. Кроме того, любой другой ген Y. lipolytica для выделения протеинов, такой как гены рибонуклеазы и кислой протеазы, может быть использован вместо гена XPR2, а также гибридные гены, сконструированные путем объединения фрагментов двух или более указанных генов, например сигнальная последовательность гена XPR2 и промотирующая последовательность гена рибонуклеазы.

Также включены в объем данного изобретения функциональные эквиваленты вышеописанных ДНК или нуклеотидных последовательностей. Вырожденность генетического кода дает возможность замещения определенных кодонов другими, которые кодируют ту же самую аминокислоту и, следовательно, приводят к тому же протеину. ДНК или нуклеотидная последовательность могут значительно изменяться, так как, за исключением метионина и триатофана, известные аминокислоты могут кодироваться более чем одним кодоном. Так, часть или весь ген XPR2 могут быть синтезированы для получения последовательности ДНК, существенно отличающейся от показанной на фиг. 3. Кодируемая аминокислотная последовательность для него будет, однако, сохранена. Подобные функциональные изменения данной ДНК или нуклеотидной последовательности дают возможность промотировать выделение и/или обработку чужеродных протеинов, кодируемых чужеродными ДНК-последовательностями, привитыми к ним. Все изменения нуклеотидной последовательности гена XPR2 и фрагментов его, разрешенные генетическим кодом, следовательно, включены в данное изобретение. Кроме того, возможно ликвидировать кодоны или заменить один или более кодонов, иными чем вырожденные кодоны, для получения структурно модифицированного полипептида, но по существу имеющего ту же полезность или активность, что и полипептид, полученный с помощью немодифицированной молекулы ДНК. Данные два полипептида функционально эквивалентны, как две молекулы ДНК, вызывающие их появление, даже если разница между этими молекулами ДНК не относится к вырождению генетического кода. Наиболее простой пример этому относится к прореннину A и прореннину B, двум аллольным формам прореннина, которые различаются только присутствием остатка аспарагиновой кислоты в положении 286 прореннина A и остатка глицина в этом положении у прореннина B.

Используя данную методику, достигнута экспрессия и секреция в Y. lipolytica чужеродных протеинов млекопитающих прореннина и человеческого анафилатоксина C5a при применении сигналов экспрессии и выделения из генов Y. lipolytica XPR2 и/или LEU2. ДНК-последовательности для прореннина и человеческого анафилатоксина C5a были пришиты с помощью синтетических олигонуклеотидов к генной последовательности XPR2 в сайтах, предполагаемых для кодирования сигнального пептида щелочной протеазы, или в сайтах, обрабатывающих предшественника протеазы, обозначенных здесь как про1 и про2, и использованы для получения генных конструктов, которые были затем введены в Y. lipolytica путем интегративной трансформации. Рекомбинантные культуры экспрессировали и выделяли в питательную среду чужеродные протеины, имеющие молекулярный вес и иммунореактивность прореннина и человеческого анафилатоксина C5a. Прореннин, полученный таким образом, как представляется, сложен в нативной конфигурации, так как после удаления пропептида он обнаруживает полную ферментативную активность.

Термин "рекомбинантный ДНК материал" используемый здесь, включает любой материал, который содержит по крайней мере одно из следующего: ген XPR2 Y. lipolytica сигнал/или предсигнал/, про1- и про2- /которые вместе содержат прорегион/, промотор или его концевую последовательность; промотор LEU2; и функциональные эквиваленты вышеуказанных последовательностей, допускаемые вырожденностью генетического кода.

Представителями указанного рекомбинантного ДНК материала являются фрагменты ДНК, плазмиды или векторы или трансформанты, содержащие любую или все из вышеуказанных последовательностей.

Материалы. Рестрикционные эндонуклеазы и T4 дигаза были получены из New England Biolabs бактериальная щелочная фосфатаза из Bethesda-Research Laboratories T4 полинуклеотидкиназа из PL-Biochemicals, и [гамма-32p] АТФ из New England Nuclear. Все ферменты использовались при условиях, рекомендованных поставщиком.

Среды. Среда ГПП /среда глицерин/протеоза-пептон/ содержала /на литр/: 6,7 г глицерина, 1,6 г Difco протеозы-пептона, 1,7 г Difco азотистого основания дрожжей без аминокислот и сульфата аммония, 30 г урацила и 0,5 мл/л полипропиленгликоля мол. в. 2000 (Polysciences), в 40 мМ-фосфатном буфере /pH 6,8/ полипропиленгликоль не был включен, когда среда использовалась для выращивания культур для анализа ферментной активности реннина. Протеаза-пептон был отдельно обработан в автоклаве в фосфатном буфере.

Среда ДЭПД /среда-дрожжи-экстракт/пептон/декстроза/ содержала /на литр/: 5 г экстракта дрожжей, 10 г пептона и 20 г декстрозы. E.coli выращивалась в среде LB при 37oC. Среда LB содержала /на литр/: 10 г Бактотриптона, 10 г Бактодрожжевого экстракта, 10 г хлористого натрия, доводилась до pH 7,5 гидроокисью натрия.

Анализ последовательности ДНК. Фрагменты ДНК из различных здесь описанных плазмид изолировались на геле полиакриламида и секвентировались по методу Maxam и др. Methods in Enzymology 65, 499 /1980/.

Процедуры связывания. Фрагменты ДНК, включая расщепленные векторные плазмиды, связывались путем смешения нужных компонентов фрагменты ДНК с концевыми участками, специально сконструированными для обеспечения правильного спаривания с T4 ДНК дигазой. Добавлялось примерно 10 единиц лигазы на мкг количества вектора и вводимых фрагментов. Возникающая реакция связывания трансформировалась в компетентные клетки штаммов MM294 /АТСС-33625/ или HBIOI /АТСС-33694/ E. coli K12.

Получение химически синтезированной ДНК. Для конструирования гибридных генов для экспрессии и выделения прореннина восемь олигонуклеотидов были синтезированы по модифицированной фосфорамидатной методике /Sinha и др., Tetrahedron letters 24, 5843 /1983/ на Genetie Dezign 6500 /watertown MA/ автоматическом ДНК-синтезаторе и очищены на 6M мочевина-20% полиакриламидном геле. Аликвоты комплементарных олигонуклеотидов смешивались и сшивались друг с другом при 4oC в течение ночи в ТЭ /10 мМ триc-HCl, pH 8,0, 1 мМ натриевой соли этилендиаминтетрауксусной кислоты/. Аликвоты /около 2 мкг/ двухцепочечных олигонуклеотидов фосфорилировались в 20 мкл реакционной смеси, содержащей 70 мМ трис /pH 7,6/, 10 мМ MgCl2, 5 мМ дитиотрейтола, 5 мМ АТФ, при 37oC, используя T4 полинуклеотидкиназу.

Получение плазмидной ДНК. Плазмидная ДНК в больших количествах получалась по методике Holmes и др., anal. Biochem. 114, 195-197 /1981/, с последующим центрифугированием при градиенте плотности в этидиум-бромид-CSCI. Миниколичества плазмидной ДНК получались по щелочной SDS методике Birnboim и др., NAR 1,1513/1979/.

Конструирование векторов экспрессии/выделения для прореннина. Была приготовлена серия различных конструкций для получения конечных векторов экспрессии. Все стадии представлены в виде схемы на прилагаемых чертежах. В общем, фрагменты ДНК изолировали путем гель-электрофореза и сшивали с другими фрагментами или расщепленной плазмидной ДНК в 20 мкл 50 мМ трис-HCl /pH 7,5/, 1M мМ MgCl2, 20 мМ дитиотрейтола, 1 мМ АТФ, и 200 единиц T4 лигазы при 4oC. Если требовалось частичное расщепление ДНК рестрикционной эндонуклеазой, оптимальное время расщепления устанавливалось экспериментально.

Идентификация прореннина в культуральной жидкости.

Трансформанты дрожжей, содержащие векторы экспрессии, выращивались в течение ночи в среде ГПП /см.выше/. После ценрифугирования для удаления клеток дрожжей, добавляли 1 мл 50% трихлоруксусной кислоты в каждой 5 мл аликвоте культуральной жидкости и выдерживали при 4oC 60 минут. Центрифугированием получали шарики, которые дважды промывали 2 мл холодного ацетона. Осажденный протеин растворяли в 100 мкл стандартного SDS буфера и аликвоты подвергали электрофорезу на 10% SDS-полиариламидных гелях /Laemmli, ИК /1970/ Nature 227, 680/. Освобожденные из геля протеины электрофоретически переносили на нитроцеллюлозу /Schleicher и Schuell 0,22 мкм/ и прореннин определяли иммуноточечным анализом на пластинке геля /Hawkes R. и др., 1982, Cinal.Biochem 119, 142/. Фильтр покрывали антипрореннин-антителом кролика с последующей инкубацией с сопряженным с пероксидазой антителом козел-кролик /gG/ Cappel, Malvern Pa. Связанные антитела определялись окрашиванием смесью 4-xлоp-1-нафтол и перекись водорода.

Активность по свертыванию молока прореннина в культуральной жидкости. Культуральная жидкость различных трансформантов Y.lipolytica исследовалась на активность по свертыванию молока по модифицированному методу Ernstrom J. Dairy Sci 41, 1664 /1958/. Коротко говоря, исследование включало измерение времени, требуемого реннину в активированных супернанантах культуры для свертывания буферного снятого молока и соотношения значений со стандартными для очищенного реннина. Культуры дрожжей /25 мл/ выращивались в течение ночи в среде ГПП. После центрифугирования для удаления клеток 5 мл аликвоты супернатантов культуры высушивались замораживанием под вакуумом. Каждый диофилизированный супернатант был ресуспендирован в 300 мкл дистиллированной воды. Серия разбавлений очищенного прореннина теленка была также приготовлена в качестве контрольного стандарта. Прореннин в среде концентратов и контрольные образцы активировались добавлением примерно 5-10 мкл конц. HCl до получения pH приблизительно 2 и инкубировались один час при 22oC. Снятое молоко приготовляли путем прибавления 60 г сухого порошка снятого молока /Difco/ к 500 мл 41,5 мМ ацетата натрия /pH 6,3/ и 13,6 мМ CaCl2 и перемешивания 20 минут при 4oC. Субстрат был использован для анализа немедленно после приготовления. Аликвоту 60 мкл /эквивалент 1 мл супернатанта культуры/ каждого препарат фермента добавляли к 1 мл аликвоты снятого молока при 37oC и регистрировали время свертывания.

Получение синтетических олигонуклеотидов для гена C5a.

Олигодезоксинуклеотиды, используемые в синтезе структурного гена C5a, получали по модифицированной фосфорамидатной методике /Sinka и др., ук. соч. / с использованием контролируемой опоры из пористого отекла на Cienetic Design 6500 /Watertown MA/ автоматическом ДНК-синтезаторе. При получении использовали 3% /вес/объем/ дихлоруксусную кислоту в дихлорметане для удаления тритильной группы, активирование фосфорамидатов насыщенным тетразолом в ацетонитриле, обработку ди-этоксифосфинтетразолидом и окисление водным раствором иод/ТГФ/Mattеucci и др., 1981, J.Am.Chem.Soc. 105, 3183/. Полное время на цикл добавления составляло 14 минут. Девять 47-мер сегментов A-J фиг. 9 получали с 98,9% средним выходом на стадию /по тритильному анализу/, деблокировали по методике Matteucci и др. ук.соч., осаждали этанолом из 0,3 М ацетата натрия и выделяли путем препаративного гельэлектрофореза на 10% денатурированном геле полиакриламид-мочевина перед сшиванием.

Сборка, клонирование и секвентирование человеческого гена C5A. На фиг. 9 показана аминокислотная последовательность нужного протеина и расположение синтетических олигонуклеотидов, необходимых для изготовления гена, кодирующего человеческий протеин C5a. Все олигомеры, кроме A и F, фосфорилировались по их 5'-концам T4 полинуклеотидкиназой. Сборка гена включала две первичных реакции расщепления/сшивания, включающих: олигомеры A, B, I и J и олигомеры C, D, E, F, G и H. Образующиеся B 94 п.ос. и 141 п.ос. двухцепочечные фрагменты ДНК изолировались после электрофореза на 10% полиаклирамидном геле, сшивались вместе и их B 235 п.ос. продукт изолировался гель-электрофорезом. В 235 п.ос. фрагмент ДНК, содержащий структурный ген, кодирующий C5a, вводился между E.coRI и Hind III байтами ДНК вектора pBP322 и трансформировался в компетентные клетки штамма HBIOI E.coli K-12. Рестрикционный анализ плазмидной ДНК, изолированной из 6 трансформантов, показал, что 5 из 6 клонов содержали E. coRI/HindIII фрагмент правильного размера. Нуклеотидную последовательность участка гена C5a каждой из этих плазмид определяли до методу Maxam и др. Methods Enzymology 65, 499 /1980/.

Конструирование и характеризация плазмиды экспрессии C5a для E.coli. Методика изолирования фрагментов ДНК и условия реакции свивания были такими же, как описаны Manialis и дp., /1982/, Molecular Cloning: a Laboratory Mannual, Cold Spring Harbor. E.coli trp промотор-оператор был первоначально получен из ptrpL1/Edman и др., /1981/ Nature 291, 503/. 360 п.ос. фрагмент E.coRI, содержащий trp промотор-операторную последовательность, используемый в плазмиде экспрессии C5a /pC5a-48/, изолировался из плазмиды экспрессии прореннина pPFZ-P2, описанной в Европейской заявке N 0147178, опубликованной 3 июля 1985 г.

Плантификация C5a в культуральной жидкости Y.lipolytica. Методика была такой же, как описана выше для прореннина, за исключением того, что в иммуноанализе были использованы козел-анти-C5a- и кролик-анти-козел /gG/ Cappel/ Антитело козел-анти-человеческий C5a получали методом Manderino и др., J. Immunol. Methods 53, 41-50 /1982/.

Векторы pLD40 - описанный в Европейской заявке N 0128508, опубликованной 24 апреля 1985 г. (см. табл. A) Они были депонированы в соответствии с Будапештским договором в Коллекции американского типа культур, Rochille Maryland призванная коллекция, гарантирующая неизменность депозитов и быстрый доступ к ним заинтересованных лиц, если будет выдан патент по данной заявке. В период рассмотрения данной заявки депозиты доступны лицам, которые определяются Комиссионером Ведомства по патентам и товарным знакам США в соответствии с 37 СГР 1.14 и 35 US C 122, и в соответствии с иностранными патентными законодательствами в странах, куда поданы дубликаты данной заявки или основанных на ней последующих заявок. Все ограничения на доступ к депонированным микроорганизмам будет окончательно сняты после выдачи патента.

Таксономическое исследование Y.lipolytica ATCC 20774 /идентифицированного в коллекции культур Pfizer Inc как PC 30869/ проведено д-ром J.R.DeZeeuw, который подготовил следующее описание. Использовались методики, рекомендованные J.L.Lodder в " The Yeasts", второе издание, N.Holland Publishing Co., Амстердам, 1970.

CHS599, типовая культура для вида Candida lipolytica /The Yeasts второе издание, N.Holland Publishing Co., Амстердам, 1970/ и CBS 6124, типовая культура для Saccharomcopsis lipolytica в "The Yeasts", третье издание, были взяты для сравнения. Ранее вид был также сопоставлен с Endomycopsis lipolytica. Его неполное состояние - Candida lipolytica. Таксономическое положение вида было установлено van der Walt u von Arx., Antonie van Leucwenbock 46, 517-521 /1980/. Предпочитаемое название в настоящее время Yarrowia lipolytica.

Культуральные, морфологические и физиологические характеристики штамма PC 30869 согласуются со стандартным описанием вида, указанного как Saccharomycopsis lipolytica в "The Yeasts" третье издание, под редакцией Kreger-van Rij cc. 406-408, Elsevier Science Publishing B.Y. Амстердам, 1984 (см. табл. 1) PC-30869 был сконструирован с помощью генетически рекомбинированных подходящих мутантов Y. lipolytica PC-22208, Pfizer почвенный изолят, и Y.lipolytica PC-30026, субкультура NRRLY-1094. PC-30869 фенотипически отличается от своих родителей дикого типа следующим: /1/ не производит активной внеклеточной щелочной протеазы, /2/ требует биотина для роста и /3/ требует источник L-лейцина.

В течение дог-фазы роста PC-30869 в бульоне дрожжевой экстракт-пептон-глюкоза /ДЭНГ/ почкующиеся клетки имеют яйцевидную форму и средний размер 2,6х5,5 микрон. На ДЭНГ- агаре доминируют псевдо- и истинные мицелии. Бластоспоры присутствуют в большинстве как одиночки в плевральных положениях. Не обнаруживается каротеноидных пигментов. Культура ведет себя как "B" спаривающийся гиплоид в скрещивании с аутентичными тестовыми штаммами для вида /таблица 5/. Типичная аскоспоруляция наблюдается на агаре VB. Особенности ассимиляции углерода указаны в таблице 2 ферментация отсутствует. Ион аммония и мочевина, но не нитрат, утилизируются как единственные источники азота /таблица 3/. Штамм PC-30869 требует витаминов тиамина и D-биотина /таблица 4/. Только тиамин требуется для родителей культуры дикого типа. Никакого роста не наблюдается при 37oC.

PC-30869 отличается от других штаммов Y.lipolytica, описанных в патентной литературе, как это следует из сравнения их фенотипов /таблицы 7 и 8/.

ATCC 20228 /Nubel и др. Патент США N 4155811/ обнаруживает вид питания дикого типа, подобно типовым штаммам для вида, CBS 599 и CBS 6124. Конкретно, он не нуждается для роста в урациле, лейцине или биотине, и он разжимает желатину.

ATCC 20620 /Dezecuw и др., патент США N 4407953/ в отличие от ATCC 20228 требует дополнительного лейцина для роста. Подобно ATCC 20228 он не нуждается в урациле или биотине. Он также разжижает желатину.

ATCC 20688 /европейская заявка N 0138508/ растет, только если в среду добавлены как урацил, так и лейцин. Эта необходимость в урациле отличает ATCC 20688 как от ATCC 20228, так и ATCC 20620, ATCC 20688 не требует биотин и разжижает желатину.

Культура PC-30869 отличается от всех вышеуказанных. Она нуждается для роста в биотине и лейцине, но не в урациле. Она не разжижает желатину.

Краткое описание чертежей Фиг. 1 - Частичная линейная растрикционная карта перекрывающихся плазмид pLD57, pLD58 и pLD62, изолированных из штамма Y.lipolytica DL 112.

Фиг. 2 - Пробы синтетических олигонуклетидов для генар XPR2.

Из описанной последовательности для большинства первых 25 аминокислотных остатков активной протеазы /Ogrydziak и др., ук. соч./ два участка, отмеченные I и II, дают возможность конструирования 14-мер олигонуклеотидных проб с 32-кратным или меньшим вырождением. Эти два участка начинаются соответственно у аминокислот 7 и 18. Четыре различные восьмикратко вырожденные смешанные пробы были приготовлены для каждого участка, они получили номера от 170 до 186, кал показано. В изображенной предсказанной последовательности нуклеиновой кислоты "X" означает все 4 основания, "U " означает оба пурина и "Y" означает оба пиримидина.

Фиг. 3 - Нуклеотидная последовательность гена XPR2, с указанием промотора, пре /от -157 до -136/, про1 /от -135 до -98/, про2 /от -97 до -1/, щелочной внеклетечной протеазы и концевых последовательностей.

Фиг. 4 - Сконструированная последовательность для вектора-терминатора pterm 4.

Фиг. 5 - Сконструированная последовательность и рестрикционная карта плазмиды pLS - 3.

Фиг. 6 - Сконструированная последовательность и рестрикционная карта плазмиды pXX-33.

Фиг. 7 - Сконструированная последовательность и рестрикционная карта плазмиды pXX-22.

Фиг. 8 - Сконструированная последовательность и рестрикционная карта плазмиды pXX-11.

Фиг. 9 - Аминокислотная последовательность человеческого анафилатоксина C5a.

Фиг. 10 - Рестрикционная карта плазмиды pC5a-48.

Фиг. 11 - Сконструированная последовательность и рестрикционная карта плазмиды pC5aX-3.

Фиг. 12 - Нуклеотидная последовательность гена LEU2.

Фиг. 13 - Сконструированная последовательность и рестрикционная карта плазмиды pLX-34.

Анализ последовательности гена XPR2. Анализ ДНК-последовательности клонированного гена XPR2 проводился методом химической деградации /Maxam и др., 1980, Methods Enzymol, 65, 499/ на перекрывающихся фрагментах рестрикции, полученных из плазмид pLD57, pLD58, pLD62 /фиг. 1/ и pLD84 и pLD86 /см.ниже/. Результаты показали, что клонированные геномные ДНК дрожжей действительно содержат ген для внеклеточной щелочной протеазы. Нуклеотидная последовательность гена XPR2 и аминокислотная последовательность предшественника щелочной протеазы с ее сигнальной последовательностью, выведенная из нуклеотидной последовательности, показаны на фиг. З. Значительная часть аминокислотной последовательности внеклеточной протеазы была неизвестна /Ogrydziak и дp., ук.соч./ и представлена здесь впервые. Более того, последовательности, требуемые для экспрессии и выделения внеклеточной протеазы, описаны здесь в первый раз. Последовательность ДНК, кодирующая щелочную протеазу, ее предшествениика и сигнальные последовательности, состоит из 1362 пар оснований /фиг. 3/. Первичная структура этой полипептидной цепи, выводимая из нуклеотидной последовательности, должна содержать 454 аминокислотных остатка. Щелочная протеаза синтезируется в клетке в форме предшественника, который протеолитически переводится в выделяемую или готовую форму. Анализ N-концевой аминокислотной последовательности, выведенной из нуклеотидной последовательности, показал наличие сигнального пептида в молекуле предшественника. Этот сигнальный пептид содержит 22 аминокислотных остатка, и его структурные особенности подобны особенностям сигнальных пептидов высших эукариотов и прокариотоз /Perlman и др., 1983, J.mol. Biol. 167, 391. Участку в выведенной аминокислотной последовательности в согласии с известными 25 П-концевыми аминокислотами активной щелочной протеазы /Ogrydziak и др., 1982, J. Gen. Microbiol 128, 1225/ предшествуют 157 аминокислотных остатка, содержащих сигнальный пептид и два сайта расщепления трипсинового типа /Lys-Arg/. Эти сайты расщепления использовались для разделения прорегиона на про1 /от -135 до -98/ и про2 /от -97 до -1/. См.фиг. 2. Активная щелочная протеаза имеет 297 аминокислот, как следует из нуклеотидной последовательности. Аминокислотные последовательности для различных форм протеазы, выведенные из нуклеотидной последовательности, находятся в соответствии с размерами очищенных форм фермента. В дополнение к структурной последовательности предшественника щелочной протеазы были определено примерно 700 п.ос.5'-боковой последовательности и 600 п.ос. 3'-боковой последовательности. Анализ этих участков показал, что они содержат последовательности, аналогичные другим эукариотическим промоторами и терминаторам, и, вероятно, они играют существенную роль в экспрессии щелочной протеазы.

Как указано выше, методика трансформации Y.lipolytica и клонирования генов Y. lipolytica путем комплементации мутаций, включая клонирование гена XPR2, который кодирует выделяемую щелочную протеазу, путем комплементации мутации xpr2, описаны в Европейской заявке N 0138508. Методика, описанная в ней, включает трансформацию клетки-хозяина штамма Y.lipolytica частичным дайджестом BgIII библиотеки генов Y.lipolytica в вектор pLD 40. Данный вектор характеризуется тем, что он содержит в себе малый сегмент, содержащий LEU2 участок Y. lipolytica и сайты рестрикции эндонуклеазы 3EcoRI, 4EcoPV, 6AVaI, IBgIII, INcoI, IApaI, 2XLOI и IBS+XI. Один из транcформантов XPR2 Y. lipolytica был использован для извлечения гена дикого типа /pLD84 и pLD86/ из Y. lipolytica NRRL Y-1094 для применения в векторе конструирования экспрессии/выделения, как описано в Примере 1.

Анализ последовательности гена LEU2. Анализ последовательности ДНК клонированного гена LEU2 в pLD5 /Европейская заявка N 0138508/ проводился методом химической деградации /Maxam и др., 1980, Methods Enzymol 65, 499/ на перекрывающихся ф