Способ получения гетерологичного полипептида в дрожжах saccharomyces cerevisiae

Реферат

 

Изобретение относится к способу получения гетерологичного полипептида в дрожжах Saccharomyces cerevisiae. Дрожжи трансформируют рекомбинантным экспрессирующим вектором, содержащим конструкцию ДНК, кодирующую полипептид, включающий сшитые сигнальный пептид, лидерный пептид и гетерологичный полипептид. Проводят культивирование трансформированных дрожжей в подходящей для экспрессии среде и выделение конечного продукта из культуральной среды. Изобретение позволяет получать более высокий выход правильно процессированного целевого протеина. 20 з.п.ф-лы, 18 ил., 2 табл.

Изобретение относится к полипептидам, экспрессированным и процессированным в дрожжах, к векторной ДНК, включающей ДНК последовательность, кодирующую такие полипептиды, к векторам несущим такие ДНК фрагменты и к дрожжевым клеткам, трансформируемым векторами, а также к способу продуцирования гетерологических протеинов в дрожжах.

Дрожжевые организмы продуцируют ряд протеинов, синтезируемых внутриклеточно, но функционирующих вне клетки. Такие внеклеточные протеины относятся к секретируемым /выделяемым/ протеинам. Эти секретируемые протеины первоначально экспрессируются внутри клетки на предшественнике или пре-протеиновой структуре, содержащей предпоследовательность, определяющей эффективное направление экспрессируемого продукта через мембрану эндоплазматического ретикулума /ЭР/. Пред-последовательность, обычно называемая сигнальным пептидом, как правило отщепляется от желаемого продукта в процессе транслокации. Вступив на секреторный путь, протеин транспортируется к аппарату Гольджи. Из аппарата Гольджи протеин может далее следовать различными путями, попадая либо в клеточную вакуоль, либо - клеточную мембрану или выйти за пределы клетки, выделившись во внешнюю среду /Pfefer, S.R., Rothman, J. Ann. Rev. Biochem, 56/1987/, 829-852/.

Были предложены некоторые подходы для объяснения экспрессии и секреции в дрожжах протеинов, гетерологических дрожжам. Европейская опубликованная патентная заявка 008632 А содержит описание способа, согласно которому происходит экспрессирование протеинов, гетерологических дрожжам, их процессирование и секретирование путем трансформирования организма дрожжей с экспрессией оболочки, несущей ДНК, кодирующую желаемый протеин и сигнальный пептид, подготовка культуры трансформируемого организма, выращивание культуры и выделение протеина из среды клеточной культуры. Сигнальный пептид может быть как сигнальным пептидом самих желаемых протеинов, гетерологическим сигнальным петидом или гибридом нативного и гетерологического сигнального пептида.

Проблема, которая может неожиданно возникнуть в связи с использованием сигнальных пептидов, гетерологических дрожжам, возможно состоит в том, что гетерологический сигнальный пептид не гарантирует эффективной транслокации и/или расщепления после сигнального пептида. MFI/ - фактор S. cerevisiae синтезируют в предпроформе из 165 аминокислот, включающих 19 аминокислот длинного сигнального или пред-пептида, за которым следуют 64 аминокислоты длинного "лидирующего" или пропептида, окруженных тремя N-связанными гликозилированными сайтами, за которым следует (лизарг(асп/глу,ала)2-3 - фактор /4/Kurjah J., Herzkowitz, J. Cell 30 /1982/, 933-943. Участок сигнал-лидер предпро-MF-1 широко использовался для осуществления синтеза и секреции гетерологических протеинов в S. cerevisiae.

Использование сигнальных и лидирующих пептидов, гомологических дрожжам, известно из спецификации патента США 4546082, Европейской опубликованной патентной заявке 0116201 А, 0123294 А, 0123544 А, 0163529 А и 0123289 А и ДК патентные описания 2484/84 и 3614/83.

В ЕП 0123289А описано использование предшественника - фактора S. cerevisiae, в то время как в ДК 2484/84 описано использование сигнального пептида инвертазы Saccharomyсes cerevisiae, а ДК 3614/83 описывает использование сигнального пептида РН05 Saccharomyсes cerevisiae для секреции чужеродных протеинов.

В спецификации патента США 4564082, ЕП 0016201 А, 0123294 А, 0123544 А и 0163529 А описаны способы, согласно которым - фактор сигнал-лидера из Saccharomyсes cerevisiae /MF1 или МF2/ используется в процессе секреции экспрессированного гетерологического протеина в дрожжах. При включении ДНК последовательности, кодирующей S. cerevisiae MF1 сигнал/лидер последовательность у 5 конца гена желаемого протеина, было продемонстрировано процессирование и секреция желаемого протеина.

В ЕП 206783 раскрывается система секреции полипептидов из S. cerevisiae, в которой - фактор лидирующей последовательности усечен таким образом, чтобы устранить четыре - факторных пептида, присутствующих в нативной лидирующей последовательности таким образом, чтобы оставить лидирующий пептид слитым с гетерологическим полипептидом через - фактор процессингового сайта лиз-арг-глу-ала-глу-ала. Эта конструкция приводит к эффективному процессированию небольших пептидов/содержащих менее 50 аминокислот/. Для секреции и процессирования больших полипептидов нативный - фактор усекают так, чтобы оставить один или два - факторных пептида между лидирующим пептидом и полипептидом.

Ряд секретируемых протеинов направляется к протеолитической процессирующей системе, которая может расщеплять пептидную связь у карбоксильного конца двух последовательных основных аминокислот. Эта ферментативная активность, присущая S. cerevisiae, закодирована КЕХ2 геном /Julius, D, А и др. Cell 37/ 1984b/, 1075/. Процессинг продукта геном КЕХ2 необходим для секреции скрещивающего фактора 1 (MF1 или - фактора), активным и S. cerevisiae, но не включен в секрецию скрещивающего фактора а, активными S. cerevisiae.

Секреция и корректный процессинг полипептида, предназначенного к выделению, достигается в некоторых случаях при культивировании дрожжей нового организма, который трансформируют вектором, сконструированным так, как это сказано в ссылках, приведенных выше. Во многих случаях, однако, уровень секреции очень низок или секреция вообще не имеет места, или протеолитический процессинг не верен или незавершен. Настоящие изобретатели полагают, что это может быть связано в какой-то степени с недостаточной доступностью процессингового сайта, расположенного между С-терминальным концом лидирующего пептида и N-терминальным концом гетерологического протеина, так, что он оказывается бесполезным, или, по крайней мере, менее восприимчивым к протеолитическому расщеплению.

Неожиданно было обнаружено, что при осуществлении некоторых модификаций вблизи процессингового сайта в С-терминальном конце лидирующего пептида и/или N-терминального конца гетерологического полипептида, слитого с лидирующим пептидом, возможно получить более высокий выход правильно процессированного протеина, чем в случае с немодифицированными конструкциями, лидирующий пептид - гетерологический полипептид.

Итак, настоящее изобретение относится к полипептиду, включающему слияние сигнального пептида, лидирующего пептида и гетерологического протеина или полипептида, полипептида, который модифицирован в его аминокислотной последовательности, примыкающей к процессинговому сайту дрожжевой клетки, расположенному между С-терминальным концом лидирующего пептида и N-терминальным концом гетерологического протеина таким образом, чтобы обеспечить представление процессингового сайта, в результате которого становится возможным протеолитическое расщепление, к полипептиду, имеющему следующее строение: сигнальный пептид-лидирующий пептид-Х1-X2-X34- гетерологический протеин, в котором Х1 - это пептидная связь или Х1 представляет одну или более аминокислот, которые могут быть одинаковыми или различными, Х2 и Х3 одинаковы или отличаются друг от друга и представляют основную аминокислоту, выбранную из группы, состоящей из лизина и аргинина, Х2 и Х3 вместе определяют процессинговый сайт дрожжевой клетки, и X4 - это пептидная связь или Х4 представляет одну или более аминокислот, которые могут быть одинаковы или различны, при условии, что Х1 и Х4 представляют одну или более аминокислот, и, что, по крайней мере, одна из аминокислот, представленных Х1 и/или Х4 - это отрицательно заряженная аминокислота, выбранная из группы, состоящей из глутаминовой и аспарагиновой кислот. В настоящем контексте термин "сигнальный пептид" означает предпоследовательность, преимущественно гидрофобную по природе и присутствующую в виде N-терминальной последовательности на форме предшественнике внеклеточного протеина, экспрессированного в дрожжах. Функция сигнального пептида состоит в том, чтобы обеспечить вход секретируемого гетерологического протеина в эндоплазматический ретикулум. В течение этого процесса сигнальный пептид обычно отщепляется. Сигнальный пептид может быть гетерологическим или гомологическим по отношению к дрожжевому организму, продуцирующему протеин, но, как объяснялось выше, более эффективно отщепление сигнального пептида происходит в том случае, когда он гомологичен к дрожжевому организму, о котором идет речь.

Под выражением "лидирующий пептид" подразумевается преимущественно гидрофильный пептид, функция которого состоит в том, чтобы обеспечить направление секретируемого гетерологического протеина от эндоплазматического ретикулума к аппарату Гольджи и далее в секреторную везикулу для секреции в среду /т.е. в том, чтобы обеспечить прохождение экспрессированного протеина или полипептида через стенку клетки или, по крайней мере, через клеточную мембрану в околоплазменное пространство клетки/.

Выражение "гетерологический протеин или полипептид" выбрано для обозначения протеина или полипептида, который не продуцируется в природе организмом дрожжевой клетки - хозяина. Термин "протеин" и "полипептид" в последующем описании по существу взаимозаменяемы.

Модификация полипептида в процессинговом сайте/сайт-место отделения лидирующего пептида от гетерологического протеина при протеолитическом отщеплении под действием протеолитических ферментов дрожжей/ представлена Х1 и/или Х4 и может быть осуществлена как за счет удлинения, замещения или утраты одной или более аминокислот в С-терминальном конце лидирующего пептида, так и/или в N-терминальном конце гетерологического протеина.

В данном изобретении было обнаружено, что более эффективное и корректное процессирование гетерологического протеина может быть достигнуто в том случае, когда, по крайней мере, одна из аминокислот, участвующих в удлинении последовательности полипептида или которой замещают одну или более из нативных аминокислот последовательности - это отрицательно заряженная аминокислота, например, одна из указанных выше. Аналогичный эффект наблюдается, когда отрицательно заряженную аминокислоту располагают в близости с процессинговым сайтом за счет того, что одну или более аминокислот убирают от C-терминального кольца лидирующего пептида или от N-терминального конца последовательности протеина до тех пор, пока отрицательно заряженная аминокислота не окажется примыкающей к процессинговому сайту.

Не желая ограничиться какой-либо частной теорией, предположили, что этот эффект может быть объяснен возросшей гидрофильностью вызванной отрицательно заряженными аминокислотами, примыкающими к процессинговому сайту, что приводит к увеличению экспонирования третичной структуры полипептида в процессинговом сайте в водном внутриклеточном окружении и вследствие этого становится более восприимчивой к протеолитическому отщеплению под действием процессингового фермента. Преимущественное влияние отрицательно заряженных аминокислот в отличие от положительно заряженных или нейтральных аминокислот может быть отнесено за счет того, что отрицательно заряженная сторона цепочек этих аминокислот увеличивает гидрофильность третичной структуры в процессинговом сайте, никоим образом не увеличивая потенциал ингибирования процессингового фермента.

Возможно также, что отрицательно заряженные аминокислоты содействуют созданию и поддержанию третичной структуры в процессинговом сайте /например, оборотных, петлевых или "шпилечных" структур/ тем или иным способом, например, таким как взаимодействие с другими аминокислотными остатками в полипептиде. Далее, может иметь место также непосредственное взаимодействие отрицательно заряженных аминокислот и процессингового фермента. Таким образом полагают, что отрицательно заряженные аминокислоты, позиционно примыкающие к двум основным аминокислотам процессингового сайта, могут направлять процессинговый фермент таким образом, чтобы осуществить корректное и эффективное расщепление при взаимодействиях заряда протеинов и/или протеина и растворителя.

С другой стороны, настоящее изобретение относится к векторной ДНК, включающей ДНК последовательность, кодирующую полипептид, определенный выше.

Кроме того, данное изобретение относится к рекомбинантному вектору экспрессии, способному реплицироваться в дрожжах и несущему векторную ДНК, кодирующую вышеупомянутый полипептид, а также к дрожжевому штамму, способному экспрессировать гетерологический протеин или полипептид и трансформируемому этим вектором.

Помимо всего, данное изобретение относится к способу получения /продуцирования/ гетерологического протеина или полипептида в дрожжах, включающему культивацию трансформированного дрожжевого штамма в подходящей среде для достижения экспрессии и секреции гетерологического протеина или полипептида, с последующим выделением протеина или полипептида из среды.

Согласно объяснению, данному выше, в тех случаях когда Х1 представляет единственную аминокислоту, то ею является глутаминовая или аспарагиновая кислота. Х1 и/или Х4 соответственно представляют 1-6 аминокислот.

Если Х1 представляет последовательность двух аминокислот, то она может иметь структуру ВА, в которой А - это глу или асп, а В - это глу, асп, вал, гли или лей, например лей,глу.

Если Х1 представляет последовательность трех аминокислот, то она может иметь структуру СВА, в которой А и В определены выше, а С - это асп, глу, про, вал, лей, арг, или лиз, например, асп, лей, глу.

Если Х1 представляет последовательность, состоящую из более чем двух аминокислот, то одна из дополнительных аминокислот может соответственно быть про или гли, поскольку известно, что эти аминокислоты представляют и/или образуют часть витков, "шпилечных" или петлевых структур, возможно облегчающих доступ процессингового сайта к протеолитическому ферменту.

Если Х1 представляет последовательность четырех аминокислот, то она может иметь структуру ДСВА, в которой А, В и С определены выше, а Д имеет те же значения, что и С, например, Х1 - это Глу, Арг, Лей, Глу или Лей, Асп, Лей, Глу или Лиз, Глу, Лей, Глу.

Если Х1 представляет последовательность пяти аминокислот, то она может иметь структуру ЕДСВА, в которой А, В, С и Д определены выше, а Е имеет те же значения, что и С, например, Х1 - это Лей, Глу, Арг, Лей, Глу.

Если X1 представляет последовательность шести аминокислот, то она может иметь структуру ФЕСДВА, в которой А,В,С,Д и Е определены выше, а Ф имеет те же значения, что и С, например, Х1 - это Вал, Лей, Глу, Арг, Лей, Глу.

Нужно иметь ввиду, что возможны и другие последовательности аминокислот, определяющих Х1, в рамках данного изобретения, при условии, что, по крайней мере, одна из аминокислот в последовательности - это отрицательно заряженная аминокислота, как это объяснялось выше.

Соответствующие значения Х4 могут быть теми же, что значения, приведенные выше для Х1, хотя порядок аминокислот в последовательности будет, как правило, обратным /т.е. вместо АВС-СВА и т.д./.

В тех вариантах полипептида настоящего изобретения, в которых гетерологический протеин инициирован одной или более положительно заряженными аминокислотами или гидрофобными аминокислотами, Х4 преимущественно представляет одной или более аминокислот, а не пептидную связь, так как полагают, что в этом случае достигается большая доступность процессингового сайта для протеолитичесиих ферментов.

В тех случаях, когда Х4 представляет N-терминальное удлинение из 1-6 аминокислот, он может соответственно обеспечить дополнительный процессинговый сайт между аминокислотой или кислотами, представленными X4 и N-терминальным концом гетерологического протеина. Это, в частности, важно тогда, когда протеин должен использоваться для целей, в которых необходимо присутствие протеина, не имеющего N-терминального удлинения /удлиняющего сегмента/. Дополнительные N-терминальные аминокислоты могут быть удалены in vitro при противолитическом отщеплении в присутствии соответствующего протеолитического фермента, например трипсин-подобной протеазы, или путем химической обработки, например, бромистым цианом. Возможно также осуществление отщепления у дополнительного процессингового сайта организма дрожжевой клетки хозяина за счет выбора процессингового сайта, специфичного для другого протеолитического фермента дрожжей.

В некоторых случаях, однако, возможно лучше сформировать N-терминальный удлиненный сегмент для решения специфической задачи. Так, удлинение может служить маркером, определяющим протеин, может способствовать очистке протеина или может служить средством, позволяющим осуществлять контроль за действием in vivo фармацевтического препарата, например пролонгировать полупериод существования лекарства в организме или направлять лекарственное вещество в конкретное место в теле.

В предпочтительном варианте полипептида настоящего изобретения Х1 и/или Х4 представляют аминокислотную последовательность их 1-4 аминокислот. В таком варианте аминокислота, непосредственно примыкающая к X2 - это предпочтительно глутаминовая или аспарагиновая кислота, аминокислота, непосредственно примыкающая к Х3 - это предпочтительно глу или асп, или обе вместе, так как в этом случае обеспечивается предпочтительное представление процессингового сайта, обусловленное гидрофильной природой этих аминокислот, как уже детально объяснялось выше. Аминокислотная последовательность, представленная Х1 и Х4, может соответственно включать более одной Глу или Асп.

В другом, представляющем интерес, варианте полипептида настоящего изобретения Х1 и Х4 обе представляют одну или более аминокислот, другими словами, полипептид модифицирован как у С-терминального конца лидирующего пептида, так и у N-терминального конца гетерологического протеина. В этом варианте Х1 и Х4 могут быть симметрично идентичны, это значит, что аминокислота или кислоты, представленные Х1 и Х4, одинаковы и удлиняются в направлении от Х2 и Х3 соответственно.

Последовательность сигнального пептида полипептида настоящего изобретения может быть любым сигнальным пептидом, который обеспечивает эффективное направление экспрессированного полипептида в секреторный канал /путь/ клетки. Сигнальный пептид может представлять сигнальный пептид естественного происхождения или быть его частью, или он может быть синтетическим пептидом. Обнаружено, что соответствующие сигнальные пептиды представляют - фактор сигнального пептида, например сигнальный пептидамилазы слюны мыши, модифицированный сигнальный пептид карбоксипептидазы или сигнальный пептид дрожжей BARI. Сигнальная последовательность амилазы слюны мыши описана в работе O. Hagenbuchee и др. Nature 2891981, 643-646. Сигнальная последовательность карбоксипептазы описана в работе L.A. Valls и др., Cell 48, 1987, стр.887-897. Сигнальный пептид BARI раскрыт в WO 87/02670.

Лидирующим пептидом полипептида настоящего изобретения может быть любой лидирующий пептид, функцией которого является направление экспрессированного полипептида в эндоплазматический ретикулум и далее по секреторному пути. Возможные лидирующие последовательности, которые подходят для этой цели, это природные лидирующие пептиды, выделяемые из дрожжей или других организмов, например, лидер - фактора или его функционального аналога. Лидирующий пептид может быть также синтетическим лидирующим пептидом, например, один из синтетических лидирующих пептидов раскрыт в Международной патентной заявке, публикация WO 89/02463. Ниже приведены аминокислотные последовательности: А. Ala-Pro-Val-Thr-Gly-Asp-Glu-Ser-Ser-Val-Glu-Ile-Pro-Glu-Glu-Ser-Leu-Ile-Gly-Phe-Leu-Asp-Leu-Ala-Gly-Glu-Glu-Ile-Ala-Glu-Asn-Thr-Thr-Leu-Ala В. Ala-Pro-Val-Thr-Gly-Asp-Glu-Ser-Ser-Val-Glu-Ile-Pro-Glu-Glu-Ser-Leu-Ile-Ile-Ala-Glu-Asn-Thr-Thr-Leu-Ala С. Ala-Pro-Val-Thr-Gly-Asp-Glu-Ser-Ser-Val-Glu-Ile-Pro-Ile-Ala-Glu-Asn-Thr-Thr-Leu-Ala D. Ala-Pro-Val-Thr-Gly-Asp-Glu-Ser-Ser-Val-Glu-Ile-Pro-Glu-Glu-Ser-Leu-Ile-Ile-Ala-Glu-Asn-Thr-Thr-Leu-Ala-Asn-Val-Ala-Met-Ala and Е. Gln-Pro-Val-Thr-Gly-Asp-Glu-Ser-Ser-Val-Glu-Ile-Pro-Glu-Glu-Ser-Leu-Ile-Ile-Ala-Glu-Asn-Thr-Thr-Leu-Ala-Asn-Val-Ala-Met-Ala и производные на их основе.

Гетерологический протеин, продуцированный по методу настоящего изобретения, может быть любым протеином, преимущественно продуцируемым в дрожжах. Примерами таких протеинов являются апротинин или любые другие ингибиторы протеазы, инсулин/ включая предшественники инсулина/, гормоны роста человека или бычьи, интерлейкин, глюкагон, плазминогенный активатор ткани, фактор УП, фактор VIII, фактор ХIII, фактор роста из тромбоцитов, ферменты и т.д. или их функциональные аналоги. В настоящем контексте термин" функциональный аналог" означает полипетид с такой же функцией, как у нативного протеида /под функцией следует понимать природу действия, а не уровень биологической активности нативного протеина/. Такой полипептид может иметь такой же аминокислотный состав, что и у нативного протеина, а может быть получен из нативного протеина путем добавления одной или более аминокислот как к одному концу, так и к обоим к С-терминальному и N-терминальному концам нативного протеина, замещением одной или более аминокислоты в одном или ряде различных мест/сайтов/ в нативной аминокислотной последовательности, путем делении /вычитания, утраты/ одной или более аминокислоты с одного или с обоих концов нативного протеина или из одного или различных сайтов в аминокислотной последовательности, или путем включения в один или более сайтов в нативной аминокислотной последовательности одной или более аминокислот. Также модификации хорошо известны для различных протеинов, которые были упомянуты выше.

В соответствии с настоящим изобретением было установлено, что модификации у С-терминального конца лидирующего пептида или у N-терминального конца гетерологического протеина согласно вышеприведенным описаниям позволяют получить с высокими выходами корректно процессированный апротинин/ или его функциональный аналог, в соответствии с вышеприведенным определением/. Апротинин - это протеин, ингибирующий протеазу, свойства которого дают возможность использовать его при лечении ряда заболеваний /например, при лечении панкреатитов, синдрома септического шока: гиперфибринолитического кровотечения и инфарктов миокарда/. Введение апротинина в больших дозах резко снижает потери крови при операциях на сердце или других крупных операциях. Апротинин также полезен в качестве добавки, вводимой в культурную среду, поскольку он ингибирует протеазы клеток-хозяев, которые, в свою очередь, могут вызывать нежелательное отщепление экспрессированных протеинов. При использовании в качестве лидирующего пептида при синтезе в дрожжах корректно процессированного протинина имелись трудности, связанные с получением высокого выхода продукта, известных природных лидирующих последовательностей, например, - факторного лидера. Нативный апротинин зарождается у N-терминала основной аминокислотой - аргинином /арг/, и, в связи с этим, предшествующий процессинговый сайт может быть менее доступен /подвержен/ для протеолитического расщепления /как объяснено выше/, когда один из известных лидирующих пептидов /например, - факторный лидер/ используют без того, чтобы модифицировать согласно настоящему изобретению, что приводит к низким выходам корректно процессированного апротинина.

Согласно настоящему изобретению особенно хорошие результаты при продуцировании апротинина достигаются тогда, когда Х1 представляет Глу, лей или Глу, лей, асп, лей /см. нижеследующие примеры/, хотя можно ожидать приличных выходов апротинина и при других значениях Х1 и Х4, при условии, что, по крайней мере, одна аминокислота, а наиболее предпочтителен вариант, когда ближайшая к процессинговому сайту аминокислота является отрицательно заряженной аминокислотой, как объяснено выше.

Также в настоящем изобретении установлено, что модификации у С-терминального конца лидирующего пептида или у N-терминального конца гетерологического протеина в соответствии с вышеприведенным описанием позволяют получать с высоким выходом корректно процессированный предшественник инсулина /или функциональный аналог на его основе/. В этом варианте осуществления изобретения, если Х1 представляет глу-арг-лей-глу или лиз-глу-лей-глу, то Х4 представляет пептидную связь Альтернативно, когда Х4 представляет глу, то Х1 обычно представляет пептидную связь. В частности, полезные результаты были получены согласно настоящему изобретению при экспрессии предшественника аналога инсулина В/1-29/ала-ала-лиз-А/1-29/, когда Х1 представляет лиз-глу-лей-глу, или, когда Х4 представляет предшественник инсулина, в котором первая аминокислота-фенилаланин /фен/ замещена на глутаминовую кислоту /глу/ /см. следующие далее примеры/. Вполне приличные выходы предшественника аналога инсулина В/1-29/ сер-асп-асп-ала-лиз -А/1-29/ были получены, когда Х1 представлял лиз-глу лей-глу. Кроме того, ожидают, что высокие выходы предшественника инсулина могут быть получены и при других значениях Х1 и Х4 при условии, что, по крайней мере, одна аминокислота, а наиболее предпочтителен вариант, когда ближайшая к процессинговому сайту аминокислота является отрицательно заряженной аминокислотой.

Векторная кислота настоящего изобретения, кодирующая полипептид настоящего изобретения, может быть получена синтетическим путем с использованием традиционных методов синтеза, например, фосфоамидитного метода, описанного в работе S. L. Beaucage и M.N. Caruthers, Tetrahedron Letters 22, 1981, стр. 1859-1869 или согласно методу, описанному Matthes и др., ЕМВО Journal 3,1984, стр. 801-805. Согласно фосфоамидитному способу синтезируют олигонулкеотиды, например, в автоматическом ДНК синтезаторе, очищают, удваивают и лигируют, получая синтетическую векторную ДНК.

Векторная ДНК настоящего изобретения может быть также геномного или кДНК происхождения, например, получена при создании банка /библиотеки/ геномных или кольцевых ДНК и скрининга последовательностей ДНК, кодирующих весь или часть полипептида данного изобретения, путем гибридизации с использованием проб синтетического олигонуклеотида в соответствии со стандартной техникой /см. Т. Maniatis и др., Molecular Cloning; Alobarotary Manual, Cold Spring Harbor, 1982/. В этом случае последовательность геномной или кДНК, кодирующая сигнальный и лидирующий пептид, может быть соединена с последовательностью геномной или кДНК, кодирующей гетерологический протеин, после чего ДНК последовательность может быть модифицирована у сайта, соответствующего аминокислотной последовательности Х12-X3-X4 полипептида, например сайт-направленного мутагенеза, использующего синтетические олигонуклеотиды, кодирующие нужную аминокислотную последовательность при гомологической рекомбинации в соответствии с хорошо известными способами.

И, наконец, векторная ДНК может представлять смесь синтетической и геномной, смесь синтетической и кДНК или смесь геномной и кДНК, полученной при ренатурации фрагментов синтетической, геномной или кДНК, фрагментов, соответствующих различным частям полной векторной ДНК в соответствии со стандартными методами. Следовательно, можно представить, что ДНК последовательность, кодирующая гетерологический протеин может быть геномного происхождения, в то время как последовательность, кодирующая лидирующий пептид, может быть получена синтетическим путем.

Предпочтительными векторными ДНК, кодирующими апротинин, являются ДНК, представленные на фиг.4,7,9,11 и 12, или соответствующие из модификации, кодирующие апротинин или его функциональные аналоги. Примерами подходящих модификаций ДНК служат нуклеотидные замены, которые не дают возможности возникнуть другой аминокислотной последовательности протеина, но которые могут соответствовать использованию кодона организма дрожжей, в который проведена вставка векторной ДНК или нуклеотидных замен, которые могут привести к возникновению отличной аминокислотной последовательности и, следовательно, возможно, к отличной структуре протеина, однако, без ослабления антипротеазных свойств нативного протеина. Другими примерами возможных модификаций являются вставка одного или более нуклеотидов в последовательность, дополнение одного или более нуклеотидов у одного и другого конца последовательности и деления одного или более нуклеотидов у концов последовательности или внутри последовательности. Примерами конкретных аналогов апротинина являются те, что приведены в Европейской патентной заявке, публикация 339942.

Предпочтительные векторные ДНК, кодирующие предшественников инсулина, приведены на фиг. 16 и 17, здесь же даны соответствующие им модификации.

Рекомбинантный вектор экспрессии, несущий ДНК последовательность, кодирующую полипептид настоящего изобретения, может представлять любой вектор, который способен реплицироваться в организмах дрожжей. В векторе ДНК последовательность, кодирующая полипептид настоящего изобретения, должна быть связана с подходящим промотором /стимулятором/ последовательности. Стимулятор может быть любой последовательностью ДНК, проявляющей транскрипционную активность в дрожжах и может быть выделен из генов, кодирующих протеины, как гомологических, так и гетерологических дрожжам. Предпочтительно выделение стимулятора из гена, кодирующего протеин, гомологический дрожжам. Примерами соответствующих стимуляторов служат M1, TPI, АДН или PGК стимуляторы Saccharomyces cerevisiae.

ДНК последовательность настоящего изобретения, кодирующая полипептид настоящего изобретения, должна быть также оперативно связана с соответствующим терминатором, например ТР1 терминатором /см. T. Alber и Kawasaki, J. Moll Appl. Genet 1, 1982, стр.419-434/.

Рекомбинантный вектор экспрессии данного изобретения кроме того, включает ДНК последовательность, дающую возможность вектору реплицировать в дрожжах. Примеры таких последовательностей - это дрожжевая плазмида 2, репликация генов REP 1-3 и источник репликации. Вектор может также включать селективный маркер, например ТРI ген, Schizosaccharomyces pombe, как это описано P.R. Russel Gene 40, 1985, стр.125-130.

Процедуры, используемые для легирования /сшивания/ ДНК последовательностей, кодирующих полипептид данного изобретения, стимулятора и терминатора соответственно и для того, чтобы осуществить их вставки в подходящие дрожжевые векторы, содержащие информацию, необходимую для репликации дрожжей, хорошо известны специалистам в данной области /см., например, Maniatis и др. /. Следует понять, что вектор может быть сконструирован либо путем получения вначале векторной ДНК, содержащей полную ДНК последовательность, кодирующую полипептид настоящего изобретения и последующей вставкой этого фрагмента в соответствующий экспрессионный вектор, либо путем последовательной вставки ДНК фрагментов, содержащих генетическую информацию для индивидуальных элементов /таких как сигнальный, лидирующий или гетерологический протеин/ с последующим их лигированием.

Дрожжевой организм, использованный в процессе данного изобретения, может быть любым подходящим дрожжевым организмом, который, при культивировании, продуцирует большие количества гетерологического протеина или полипептида. Примерами подходящих дрожжевых организмов могут служить штаммы дрожжей вида Saccharomyces cerevisiae, Saccharomyces kluyveri, Schizosaccharomyces pombe, или Saccharomyces uvarum.

Трансформация дрожжевых клеток может быть осуществлена, например, при формировании протопласта /см. пример 1/ с последующей трансформацией per se. Среда, используемая для культивации клеток - это любая традиционная среда, подходящая для выращивания дрожжевых организмов. Секретированный гетерологический протеин значительная часть которого может присутствовать в среде в корректно процессированной форме, может быть выделен из среды стандартными методами, включая центрифугирование и фильтрацию для отделения дрожжевых клеток от среды, осаждение протеинообразных компонентов из супернатантного слоя или фильтрата добавлением соли, например сульфата аммония, последующую очистку с использованием различных хроматографических методов, например ионно-обменной хроматографии, афинной хроматографии и тому подобных методов.

Кроме вышеперечисленного, данное изобретение относится также к новому аналогу апротинина общей формулы Х4-апротинин /1-58/, в которой Х4 представляет N-терминальное удлинение одной или более аминокислотами, по крайней мере, одна из которых - это отрицательно заряженная аминокислота, выбранная из группы, состоящей из глутаминовой /глу/ и аспаргиновой /асп/ кислот. Х4 может представлять последовательность из 1-6 аминокислот, в частности 1-4 аминокислот, и может иметь значения, приведенные выше. Особенно предпочтительные значения Х4 - это глу-лей и глу-лей-асп-лей.

Далее изобретение раскрывается в следующих примерах и прилагаемых чертежах.

Фиг. 1 - ДНК и аминокислотная последовательность апротинина /1-58/. Зигзагообразные линии, изображенные на ДНК-последовательности, означают сайты, у которых осуществлялось сшивание /лигирование/ дуплексов, образованных из синтетических олигонуклеотидов.

Фиг.2 - схема конструирования плазмид pKFN-802 и pKFN-803.

Фиг.3 - схема конструирования плазмид pKFN-849 и рКFN-855.

Фиг. 4 - ДНК последовательность фрагмента bpEcoRI-XbaI из pKFN-849 и pKFN-855. Стрелка отмечает сайт, у которого происходит протеолитическое отщепление во время секреции.

Фиг. 5А и 5В - зависимости ингибирования трипсина и плазмина, соответственно, апротинином, - бычий апротинин из поджелудочной железы, x - глу-лей-протинин, глу-лей-асп-лей-апротинин.

Фиг.6 - конструирование плазмид pKFN-852 и pKFN-858.

Фиг.7 - ДНК последовательность фрагмента 412 bр ЕсоRI - ХbаI из pKFN-852 и рKFN-858. Стрелка отмечает сайт, у которого происходит протеолитическое отщепление во время секреции.

Фиг.8 - конструирование плазмид pKFN-995 и pKFN-998.

Фиг.9 - ДНК последовательность фрагмента 412 bр EcoRI-XbaI из pKFN-995 и рKFN-998. Стрелка отмечает сайт протеолитического отщепления во время секреции.

Фиг.10 - конструирование плазмид рKFN-1000 и pKFN-1003.

Фиг. 11 - ДНК последовательность фрагмента 412 bpEcoRI - XbaI из pKFN-1000 и рKFN-1003. Стрелка отмечает сайт, у которого происходит протеолитическое отщепление во время секреции.

Фиг. 12 - ДНК последовательность гена синтетического апротинина /3-58/. Зигзагообразные линии внутри последовательности указывают сайты, у которых лигируются пять дуплексов, сформированных 10 синтезированными олигонуклеотидами.

Фиг.13 - конструирование плазмид pKFN-305 и рKFN-374/375.

Фиг.14 - конструирование плазмиды рМТ-636.

Фиг.15 - конструирование плазмиды рLаС-240.

Фиг. 16 - ДНК последовательность гена модифицированного предшественника лидер-инсулина из рLаС-240.

Фиг.17 - ДНК последовательность фрагмен