Химерный белок, обеспечивающий образование биоактивной конформации, способ получения белка с инсулиновой активностью, способ идентификации пептидильного фрагмента

Реферат

 

Изобретение относится к биотехнологии и может быть использовано для получения правильно скрученного, содержащего предшественник инсулина химерного белка. Химерный белок содержит пептидильный фрагмент протяженностью 20-92 аминокислот, который на 60% идентичен первым 20 N-аминокислотным остаткам SEQ ID N:1 или SEQ ID N:2, и пептидильный фрагмент предшественника инсулина, содержащий цепь А и цепь В человеческого инсулина. С-конец первого пептидильного фрагмента связан с N-концом пептидильного фрагмента предшественника инсулина с помощью Arg или Lys. Инсулин получают путем контактирования экспрессированного химерного белка с хаотропным агентом или меркаптаном. Изобретение позволяет получать предшественник инсулина в биоактивной конформации, а также скринировать пептидильный фрагмент, способный улучшать укладку предшественника инсулина. 3 н. и 13 з.п. ф-лы, 3 ил.

1.1. Область техники, к которой относится изобретение

Данное изобретение относится к химерному белку, имеющему последовательность, сходную с последовательностью внутримолекулярного "наставника" (IMC), связанную с нацеленным белком. В особенности данное изобретение относится к химерному белку, содержащему IMC-подобную последовательность, связанную с предшественником инсулина. Данное изобретение также относится к способу получения химерного белка с правильной укладкой, содержащего предшественник инсулина, включающий, среди прочего, приведение в контакт химерного белка с неправильной укладкой, имеющего IMC-подобную последовательность, связанную с предшественником инсулина, с, по меньшей мере, одним хаотропным вспомогательным агентом (добавкой). Кроме того, данное изобретение относится к анализу с целью скрининга аминокислотной последовательности на способность усовершенствовать укладкой предшественника инсулина с помощью химерного белка, содержащего IMC-подобную последовательность, связанную с предшественником инсулина.

1.2. Предшествующий уровень техники

1.2.1. Внутримолекулярные "наставники" и укладка белков

Молекулярные "наставники" определяют как класс белков, которые способствуют правильной укладке других полипептидов, но не являются компонентами функциональной собранной структуры (Shinde and Inouye, TIBS, 1993, 18:442-446). Внутримолекулярные "наставники" (IMC) являются частью предшественников нацеленных подлежащих скручиванию белков, и в их отсутствии молекулы нацеленных белков не имеют достаточной информации для соответствующей самоукладки (самоскручивания) (Inouye, Enzyme, 1991, 45:314-321). Уникальные особенности IMC включают: a) IMC и нацеленный белок связаны пептидной связью, образуя отдельный полипептид; Ь) IMC безусловно необходим для образования активной конформации нацеленного белка, но не требуется для функционирования нацеленного белка; с) по завершении укладки (скручивания) белка IMC удаляют либо аутопроцессингом, либо с помощью другой эндопептидазы; d) IMC не функционирует как катализатор, т.е. одна молекула IMC способна раскрутить только одну молекулу нацеленного белка; и е) IMC является в высшей степени специфическим приспособленным полипептидом, который работает только в случае нацеленных белков (Inouye, Enzyme, 1991, 45:314-321).

Было показано, что IMC или пропептид может межмолекулярно помочь нацеленному белку скручиваться, т.е. IMC или полипептид не связан с нацеленным белком пептидной связью, но скорее вводится в реакцию скручивания в виде отдельного пептида (патент США 5719021). Однако следует заметить, что пропептид, используемый в патенте США 5719021, представляет собой природный пропептид нацеленного белка или пропептид полипептида, который имеет ту же функцию, что и нацеленный белок, и полипептид также имеет аминокислотную последовательность, подобную последовательности нацеленного белка. Кроме того, межмолекулярную реакцию, описанную в патенте США 5719021, нужно проводить в забуференной ионной водной среде, более подходящей для гидрофобного взаимодействия.

Примеры IMC включают пропептиды субтилизина, а-литической протеазы, карбоксипептидазы Y и убихитина (Shinde and Inouye, TIBS, 1993, 18:442-446). Некоторые особенности IMC-последовательности субтилизина включают: а) IMC содержит более высокий процент заряженных аминокислотных остатков, чем нацеленный белок; b) распределение этих заряженных остатков внутри IMC чрезвычайно неравномерное, т.е. на N-концевой половине содержится больше положительно заряженных остатков, чем отрицательно заряженных остатков, а на С-концевой половине содержится больше отрицательно заряженных остатков, чем положительно заряженных остатков; с) остатки Ser и Thr в IMC всегда распределены неравномерно; d) IMC содержит реакционноспособно высокую долю ароматических остатков; и е) IMC содержит гидрофобную последовательность из 9 остатков (Inouye, Enzyme, 1991, 45:314-321). Сходная склонность к заряженным остаткам наблюдается также у а-литической протеазы и карбоксипептидазы Y (Inouye, Enzyme, 1991, 45:314-321).

1.2.2. Аминокислотная последовательность зрелого человеческого гормона роста

Аминокислотная последовательность зрелого человеческого гормона роста (hGH) описана в: Ikehara et al., Proc. Natl. Acad. Sci. USA, 1984, 81:5956-5960. В литературе (технике) нет доказательства, что зрелый hGH или его любая часть может функционировать как IMC или пропептид. Действительно, зрелый hGH или его любая часть совсем не могут рассматриваться как пропептид, так как, по определению, любая пре-, про- или препропоследовательность удаляется из зрелой последовательности.

1.2.3. Строение человеческого инсулина

Инсулин является четко определенным белком с известной аминокислотной последовательностью и структурными характеристиками (Watson et al., Recombinant DNA - A Short Course; Scientific American Books, W.H. Freeman Co., New York, 1983, pp. 231-235; Norman and Litwack, In Hormones, Academic Press, New York, 1987, pp. 264-317). Этот гормон состоит из двух отдельных пептидных цепей, представляющих собой А-цепь (21 аминокислота) и В-цепь (30 аминокислот), связанных дисульфидными мостиками, как показано на фиг.1В. Проинсулин является биологическим предшественником инсулина и представляет собой отдельную цепь, образующуюся, когда цепи А и В связываются с помощью С-пептида (фиг.1А).

1.2.4. Человеческий инсулин, получаемый методами рекомбинантной ДНК

Человеческий инсулин был первым животным белком, полученным в бактериях с последовательностью, идентичной последовательности человеческого панкреатического пептида (Watson et al., Recombinant DNA - A Short Course; Scientific American Books, W.H. Freeman Co., New York, 1983, pp. 231-235). О первой успешной экспрессии человеческого инсулина в лаборатории было объявлено в 1978 году, и человеческий инсулин был утвержден как терапевтическое лекарственное средство в 1982 году (Johnson, Science, 1983, 219:632-637).

1.2.4.1. Двухцепочечный метод

Согласно этому методу каждую цепь инсулина получают в виде слитого белка с b-галактозидазой (b-gal) раздельной ферментацией с применением Е. Coli, трансформированных плазмидами, имеющими ДНК-последовательность, кодирующую цепь А или В человеческого инсулина, соответственно. Продукты являются внутриклеточными и видны в заметных цитоплазматических тельцах включения (Williams et al., Science, 1982, 215(5): 687-689). Рекомбинантные белки, продуцируемые в Е. Coli, обычно соответствуют 10-40% тотального белка (Burgess, Protein Engineering; Oxender, D.L., Fox, C.F., Eds.; Alan R Liss, Inc.; New York, 1987; pp.71-82).

После выделения из телец включения, химического расщепления с помощью CNBr по остатку Met между b-галактозидазой и цепью А или В с последующей очисткой получают отдельные А и В-пептиды. Затем пептиды объединяют и инициируют скручивание А-В цепи (S-сульфонатные формы) в соотношении 2:1 в присутствии ограниченного количества меркаптана для получения активного гормона (Chance et al., In Peptides: Synthesis-Structure-Function, Rich D.M., Gross, E., Eds., Pierce Chemical Co., Rockford, II 1981, pp. 721-728; Frank and Chance, In Quo Vadis? Therapeutic Agents Produced by Genetic Engineering, Joyesuk et al., Eds., Sanoff Group, Toulouse-labege, trance, 1985, pp. 137-148). Через 24 часа выход составляет, примерно, 60% в расчете на взятое количество В-цепи (Chance et al., In Insulins, Growth Hormone and Recombinant DNA Technology, Raven Press, New York, 1981, pp. 71-85; Johnson, Fluid Phase Equilib., 1986, 29:109-123). Goeddel et al., Proc. Natl. Acad. Sci. U.S.A., 1979, 76(1): 106-110, получили аналогичные результаты с 20% тотального клеточного белка, экспрессированного в виде слитого белка цепи А или цепи В. Последующее скручивание S-сульфонатных цепей дает 50-80% правильной укладкой.

Большой размер слитого белка b-gal ограничивает выходы, так как слитой белок b-gal (-1000 аминокислот) и цепь А или В инсулина (21 аминокислота или 30 аминокислот, соответственно) стал обособленным от клеточной рибосомы (преждевременная терминация цепи во время трансляции) и, следовательно, дает неполные пептиды инсулина (Burnett, Experimental Manipulation of Gene Expression, Inouye, Ed., Academic Press, New York, 1983, pp. 259-277; Hall, Invisible Frontiers - The Race to Synthesize a Human Gene, Atlantic Monthly Press, New York, 1987). Главным усовершенствованием этого способа является использование триптофан (Тrр)-оперона вместо lac-оперона (система b-gal) для получения меньшего по размеру слитого белка. Тrр-оперон содержит ряд из пяти бактериальных генов, которые последовательно синтезируют ферменты, ответственные за анаболизм триптофана. Один из этих ферментов, Trp E, содержит только 190 аминокислот по сравнению с 1000 аминокислот для b-gal. Trp Е-ген с последующими генами А или В цепей инсулина имеет дополнительные преимущества для повышения продуцирования слитого белка от 5-10% до 20-30% от тотального белка (Hall, Invisible Frontiers - The Race to Synthesize a Human Gene, Atlantic Monthly Press, New York, 1987), так как промотор Trp является сильным промотором в E. Coli. Это в конечном счете приводит к в 10 раз более высокой экспрессии полипептида по сравнению с lac (т.е. b-gal-системой (Burnett, Experimental Manipulation of Gene Expression, Inouye, Ed., Academic Press, New York, 1983, pp. 259-277). Тrр-оперон вводится в действие (включается), когда E. Coli ферментация истощается по триптофану (Hall, Invisible Frontiers - The Race to Sinthesize a Human Gene, Atlantic Monthly Press, New York, 1987; Etienne-Decent, In Genetic Biochemistry: From Gene to Protein, Ellis Horwood Limited, Chichester, U.K., 1988, pp.125-127). Эта особенность полезна в процессе ферментации, так как сначала может быть максимизирована клеточная масса. Затем, когда это нужно, клеточную систему продуцирования инсулина можно включать, позволяя ферментативным средам истощаться по Тrр.

По завершении ферментации клетки регенерируют и измельчают. Клеточный дебрис отделяют затем от телец включения и тельца включения растворяют в растворителе, хотя конкретные подробности неизвестны (Wheelwright, Protein Purification, Oxford University press; New York, 1991, p.217). Тельца включения иногда растворяют в 6 М солянокислом гуанидине и 0.1 мМ дитиотреитоле (Burgess, Protein Engineering; Oxender, D.L., Fox, C.F., Eds.; Alan R Liss, Inc.; New York, 1987; pp.71-82). Далее цепь Trp-LE-Met-A и цепь Trp-LE-Met-В подвергают расщеплению с помощью CNBr с целью выделения цепей А и В инсулина. Дальнейшие модификации А и В цепей включают окислительный сульфитолиз, очистку и соединение (комбинацию) с получением сырого инсулина. Сырой инсулин подвергают ионнообменной, по размеру молекул и обращенно-фазовой высокоэффективной жидкостной хроматографии (RP HPLC, ОФ ВЭЖХ), получая очищенный рекомбинантный человеческий инсулин (Frank and Chance, Munch Med. Wschr, 1983, 125(Suppl. 1):514-520).

1.2.4.2.Проинсулиновый метод (внутриклеточный)

Человеческий инсулин также можно получать с помощью рекомбинированных микроорганизмов, которые продуцируют интактный проинсулин, вместо раздельных цепей А и В (Kroeff et al., J. Chromatogr., 1989, 481:45-61). Сначала мРНК реплицируют в кДНК, а метиониновый кодон синтезируют и присоединяют к 5'-концу кДНК проинсулина. кДНК вставляют в бактериальный ген в плазмидном векторе, который вводится, а затем выращивается в Е. Соli. Проинсулин может быть выделен из фрагмента бактериального фермента (b-gal) (или же, в качестве альтернативы, из проинсулина Trp-LE/Met (Trp проинсулина) при разрушении метионинового линкера. Цепь проинсулина подвергают процессу скручивания с образованием правильных внутримолекулярных дисульфидных мостиков, а С-пептид можно затем расщепить ферментами, получая человеческий инсулин (Frank and Chance, Munch Med. Wschr, 1983, 125 (Suppl.1):514-520). В сравнении с этим методом ранее описанный двухцепочечный метод более сложен.

Dorschung et al. построили рекомбинантную плазмиду, кодирующую слитые белки, содержащие мини-проинсулин (B-Arg-A), экспрессировали слитые белки в Е. Coli (тельце включения) и дрожжах (секретированные), получили правильно скрученный мини-проинсулин BrCN-расщеплением и окислительным сульфитолизом и превратили правильно скрученный мини-проинсулин в человеческий инсулин обработкой трипсином и карбоксипептидазой В (ЕР 0347781 В1; Израильский патент 9562511 В и Австралийский Патент 611303 В2).

Tottrup and Carlsen, Biotechnol. Bioeng., 1990, 35:339-348 использовали систему дрожжей в оптимизированной ферментации с периодической подпиткой; сообщалось, что выходы слитого белка супероксид-дисмутаза-человеческий проинсулин (SOD-PI) составляют 1500 мг/л. SOD-PI предлагается в качестве исходного материала для получения рекомбинантного человеческого инсулина; выходы конечного продукта не сообщались.

Недавно Castellanos-Serra et al., FEBS Letters, 1996, 378:171-176 экспрессировали в Е. Coli слитой белок проинсулина, несущий модифицированный интерлейкин-2 N-концевой пептид (1-22 аминокислотных остатков), связанный с N-концом проинсулина с помощью остатка лизина. Химерный проинсулин был выделен из телец включения, раскручивался окислительным сульфитолизом и затем превращался в инсулин в виде правильно слитых белков продолжительной реакцией с трипсином и карбоксипептидазой В. Слитой белок IL2-проинсулин может быть правильно скручен без предварительного удаления IL2-фрагмента, таким образом исключаются стадии цианогенбромида и связанной с ним очистки. Однако стадии окислительного сульфитолиза и связаной с ним очистки нельзя избежать при использовании слитого белка IL2-проинсулина.

1.2.4.3.Проинсулиновый метод (секретированный проинсулин)

Villa-Komaroff et al., Proc. Natl. Acad. Sci. U.S.A., 1978, 75(8):3727-3731 первыми описали систему секреции человеческого проинсулина в Е. Coli. Thim et al. построили рекомбинантные плазмиды, кодирующие слитые белки, содержащие модифицированную лидерную последовательность фактора al-спаривания дрожжей и предшественника инсулина (Thim et al., Proc. Natl. Acad. Sci. USA, 1986, 83:6766-6770). Лидерная последовательность служит для того, чтобы направлять слитой белок по секреторному пути обмена в дрожжевых клетках и чтобы экспонировать слитой белок с Lys-Arg ферментной системой процессирования. Частичное процессирование (процессинг) также происходило в одной или обеих двухосновных последовательностях между цепями В и А в инсулине и других предшественниках инсулина, содержащих короткий спейсерный пептид (состоящий из 6 или более аминокислотных остатков) вместо С-пептида. Напротив, никакого процессирования не наблюдается в отсутствие спейсерного пептида в молекуле предшественника инсулина, например, В-Arg-Arg-A (где А и В являются А и В цепью человеческого инсулина, соответственно). Этот тип одноцепочечного предшественника инсулина ферментативно можно превратить в инсулин обработкой трипсином и карбоксипептидазой В. Diers et al., Drug Biotechnjlogy Regulation (Scientific Basis and Practices), Chiu and Gueriguan, Eds., Marcel Dekker, Inc., New York, 1991, pp. 167-177, описывают нескрученный пептид как лидерную последовательность или просегмент, далее Lys-Arg последовательность, В цепь (аминокислоты 1-29), короткий пептидный мостик с последующей А цепью (аминокислоты 1-21). У этого предшественника аминокислота 29 цепи В инсулина связана с аминокислотой 1 цепи А коротким связывающим пептидом, содержащим одну основную аминокислоту, соединенную с А цепью. Человеческий инсулин получают транспептидилированием с последующим гидролизом образовавшейся сложноэфирной связи. С целью дополнительной очистки несколько раз хроматографируют.

1.2.5. У кладка предшественников инсулина

Человеческий инсулин представляет собой белок, имеющий две аминокислотных цепи, содержащих в целом 51 аминокислотный остаток. Шесть остатков цистеина присутствуют в двух аминокислотных цепях, причем в каждом случае два цистеиновых остатка связаны друг с другом через дисульфидную связь. Статистически существует 15 возможностей образования дисульфидных мостиков внутри одной молекулы человеческого инсулина. Однако только одна из 15 возможностей реализуется в биологически активном человеческом инсулине со следующими дисульфидными мостиками: 1) А6-А11; 2) А7-В7; и 3) А20-В19.

На образование дисульфидных мостиков, которые имеются в человеческом инсулине, воздействуют с помощью интермедиата, причем остатки цистеина человеческого инсулина обеспечиваются серусодержащей защитной группой, например S-сульфонатной (-S-SO-3)-группой (ЕР 0037255). Кроме того, проинсулин свиньи, в котором остатки цистеина присутствуют в виде тиол(SН)-содержащих остатков, был использован для получения проинсулина с правильно связанными цистеиновыми мостиками (Biochemistry, 1968, 60:622-629). Obermeier et al. описали способ получения проинсулина с правильно соединенными цистеиновыми мостиками из соответствующей аминокислотной цепи проинсулина с концентрацией от 0,05 до 0,3 г на литр в присутствии меркаптана, хаотропных вспомогательных веществ и гидрофобных полимеров-адсорбентов (патент США 5473049). Стадия окислительного сульфитолиза исключена из процесса, описанного в Патенте США 5473049. Однако инсулиновый белок может скручиваться только при низких концентрациях, что в значительной степени снижает промышленное значение этого процесса. Кроме того, применение больших количеств меркаптана и гидрофобных полимеров-поглотителей осложняет процесс и увеличивает стоимость очистки стоков. Из описания в патенте США 5473049 неясно, превышает ли выгода от исключения стадии окислительного сульфитолиза повышенную стоимость очистки стоков.

Цитирование вышеуказанных ссылок не следует интерпретировать как допущение, что эти ссылки представляют состояние уровня предыдущей техники для данного изобретения.

2.СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Данное изобретение относится к химерному белку, включающему от N-конца до С-конца: а) первый пептидный фрагмент, состоящий из аминокислотной последовательности, которая, по меньшей мере, на 40% идентична домену, содержащему, по меньшей мере, 20 N-концевых аминокислот белка человеческого гормона роста (hGH), в котором процент идентичности определяется на протяжении аминокислотной последовательности, идентичной по длине домену hGH; b) остаток Arg, или остаток Lys, или второй пептидный фрагмент, состоящий, по меньшей мере, из 2 аминокислот, причем в этом пептидном фрагменте наибольшим С-концевым аминокислотным остатком является Arg или Lys; и с) третий пептидный фрагмент, состоящий из аминокислотной последовательности, содержащей более двух цистеиновых (Cys) остатков, причем этот пептидный фрагмент не является частью hGH-белка. В особенности изобретение относится к химерному белку, в котором третий пептидный фрагмент является предшественником инсулина.

Изобретение также относится к способу получения первого правильно скрученного химерного белка, содержащего предшественник инсулина, заключающемуся в приведении в контакт неправильно скрученного второго химерного белка, содержащего предшественник инсулина, - причем указанный второй химерный белок, содержащий предшественник инсулина, состоит из подобного внутримолекулярному "наставнику" (IMC-подобного) фрагмента, отделенного от предшественника инсулина одним или более расщепляемым аминокислотным остатком, - с, по меньшей мере, одним хаотропным вспомогательным веществом (добавкой) в водной среде; при этом указанный IMC-подобный пептидный фрагмент: а) содержит примерно от 20 до 200 аминокислотных остатков; b) не является предшественником инсулина или его частью; и с) улучшает скручивание предшественника инсулина таким образом, что выход правильно скрученного первого химерного предшественника инсулина, - в том случае, когда неправильно скрученный второй химерный белок, содержащий предшественник инсулина, контактирует с хаотропной добавкой, - выше, чем выход правильно скрученного предшественника инсулина в том случае, когда неправильно скрученный предшественник инсулина, который не содержит указанный IMC-подобный пептидный фрагмент, контактирует с той же хаотропной добавкой.

Далее, данное изобретение относится к анализу с целью скрининга аминокислотной последовательности на способность улучшать укладку предшественника инсулина, заключающемуся в: а) изменении аминокислотной последовательности первого пептидного фрагмента химерного белка, описанного в главе 4.2, который содержит предшественник инсулина, получении указанного химерного белка с указанными изменениями, приведении в контакт указанного химерного белка с указанными изменениями с, по меньшей мере, одной хаотропной добавкой в водной среде в условиях и в течение времени, достаточных для того, чтобы указанный химерный белок скручивался правильно, и измерении выхода при скручивании указанного химерного белка с указанными изменениями; b) получении химерного белка, используемого на стадии (а), но без каких-либо изменений аминокислотной последовательности, описанных на стадии (а), приведении в контакт химерного белка без каких-либо изменений аминокислотной последовательности, описанных на стадии (а), с теми же хаотропными добавками, используемыми на стадии (а) в водной среде в тех же условиях и в течение того же времени, что и на стадии (а), и измерении выхода при скручивании химерного белка; и с) сравнении выхода при скручивании химерных белков, измеренных на стадии (а) и (b), соответственно, при этом выход на стадии (а), практически равный или более высокий, чем выход на стадии (Ь), указывает, что аминокислотная последовательность улучшает укладку (скручивание) предшественника инсулина.

Фиг.1А и 1В. Структуры проинсулина и зрелого инсулина с правильно образованными дисульфидными мостиками. Фигура 1А изображает структуру проинсулина. Фигура 1В изображает структуру зрелого инсулина с правильно образованными дисульфидными мостиками.

Фигура 2. Карта вектора экспрессии hGH-мини-проинсулина (SEQ ID N0:6) (pZRhi-1).

4. ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Методы рекомбинантной ДНК позволяют получать человеческий проинсулин или проинсулин с аминокислотной последовательностью и/или длиной аминокислотной цепи, отличающимися от аминокислотной последовательности и/или длины аминокислотной цепи природного человеческого инсулина в микроорганизмах. Одной основной проблемой при получении человеческого проинсулина или его производных в микроорганизмах, таких как Е. Coli, является внутриклеточное расщепление (Ladisch and Kohlman, Biotechnol. Prog., 1992, 2:469-478). Кроме того, человеческий проинсулин или его производные, получаемые методом рекомбинантной ДНК в микроорганизмах, не содержат правильно связанных цистеиновых мостиков (патент США 5473049).

Процесс получения человеческого инсулина, известный до создания данного изобретения, основан на следующих операциях: 1) ферментация микроорганизмов, трансформированных вектором, экспрессирующим слитой белок, содержащий человеческий проинсулин или его производные; 2) измельчение клеток; 3) выделение слитого белка; 4) расщепление слитого белка цианогенбромидом (бромцианом); 5) выделение продукта расщепления, содержащего последовательность проинсулина; 6) окислительный сульфитолиз; 7) образование правильно связанных цистеиновых мостиков; 8) обессоливание проинсулина; 9) хроматографическая очистка проинсулина с правильно связанными цистеиновыми мостиками; 9) концентрация раствора проинсулина; 10) хроматографическая очистка концентрированного раствора проинсулина; 11) ферментативное расщепление проинсулина с целью получения человеческого инсулина; и 12) хроматографическая очистка полученного человеческого инсулина (ЕР 0055945). К недостаткам этого способа относятся многочисленные стадии и потери на стадиях очистки, что приводит к низкому выходу инсулина. На стадиях выделения слитого белка, расщепления цианогенбромидом, сульфитолиза и очистки проинсулина ожидаются потери проинсулина до 40% (ЕР 0055945). С другой стороны, выход получаемого рекомбинантным методом инсулина или его производных можно значительно увеличить, если резко сократить число необходимых стадий.

Одной целью данного изобретения явилось создание рекомбинантного способа получения человеческого инсулина с правильно связанными цистеиновыми мостиками с меньшим числом стадий и, следовательно, дающего более высокий выход человеческого инсулина. Другой целью данного изобретения было создать химерный белок, содержащий предшественник инсулина, который можно использовать в вышеуказанном способе. Еще одной целью данного изобретения было создать метод скрининга аминокислотной последовательности, которая, будучи связана с предшественником инсулина через пептидную связь, улучшала бы скручивание (укладку) предшественника инсулина.

Заявители изучили пептидные последовательности, которые не только защищают последовательность инсулина от внутримолекулярного разрушения микроорганизмом-хозяином, но также, по сравнению с существующей системой экспрессии человеческого инсулина, обладают следующими преимуществами: будучи связаны с предшественником инсулина через пептидную связь, 1) инициируют скручивание слитого предшественника инсулина; 2) облегчают растворимость слитого белка и уменьшают внутримолекулярные взаимодействия в слитых белках, таким образом позволяя скручивание слитого предшественника инсулина при высокой, имеющей промышленное значение концентрации; 3) исключают стадии расщепления бромцианом, окислительного сульфитолиза и связанные с ними стадии очистки; и 4) исключают применение высокой концентрации меркаптана или гидрофобных абсорбентов-полимеров.

Заявители неожиданно обнаружили, что связывание IMC-подобной последовательности с предшественником инсулина через один или более расщепляемый аминокислотный остаток служит осуществлению задач настоящего изобретения. IMC-подобная последовательность имеет определенные признаки IMC-последовательности, такие как содействие скручиванию нацеленного белка, более высокое процентное содержание заряженных аминокислотных остатков, чем в нацеленном белке, наличие "поляризованного" распределения заряженных аминокислотных остатков и наличие последовательности, которая, по-видимому, приспособлена специально для нацеленного белка. Однако IMC-подобная последовательность, используемая в данном изобретении, отличается от IMC-последовательности в некоторых основных аспектах. Во-первых, IMC-подобная последовательность гетерогенна с нацеленным белком, т.е. не с пропептидом нацеленного белка. Например, если предшественник инсулина является нацеленным белком, который должен скручиваться, IMC-подобная последовательность не является предшественником инсулина или его фрагментом. Кроме того, протяженность IMC-подобной последовательности составляет, примерно, от 20 до 200 аминокислотных остатков.

Далее, в противоположность тому, что утверждается в уровне предыдущей техники (Castellanos-Serra et al., FEBS Letters, 1996, 378:171-176), заявители неожиданно обнаружили, что включение в IMC-подобную последовательность одного или более расщепляемых аминокислотных остатков, идентичных одному или более расщепляемых аминокислотных остатков, которые разделяют IMC-подобную последовательность и предшественник инсулина, позволяет после скручивания удалять IMC-подобную последовательность в виде фрагментов, упрощая таким образом стадии очистки стоков (down-stream).

Для простоты описания описание изобретения разбито на представленные ниже подразделы.

4.1. Нуклеиновые кислоты, кодирующие химерный белок, описанный в Разделе 4.2.

Данное изобретение охватывает выделенную нуклеиновую кислоту, содержащую нуклеотидную последовательность, кодирующую химерный белок, описанный в Разделе 4.2.

В особом варианте данное изобретение предоставляет выделенную нуклеиновую кислоту, имеющую нуклеотидную последовательность, кодирующую химерный белок, имеющий последовательность SEQ ID NО:6.

В другом особом варианте данное изобретение предоставляет выделенную нуклеиновую кислоту, содержащую нуклеотидную последовательность, кодирующую химерный белок, имеющий последовательность SEQ ID NО:7.

В предпочтительном варианте данное изобретение охватывает выделенную ДНК с нуклеотидной последовательностью, кодирующей химерный белок, описанный в Разделе 4.2.

В другом предпочтительном варианте данное изобретение охватывает выделенную нуклеиновую кислоту с нуклеотидной последовательностью, комплементарной нуклеотидной последовательности, кодирующей химерный белок, описанный в Разделе 4.2.

Еще в одном особом варианте данное изобретение охватывает выделенную нуклеиновую кислоту, способную гибридизоваться с нуклеотидной последовательностью, кодирующей первый, второй и третий пептидные фрагменты кодируемого ДНК химерного белка, описанного в Разделе 4.2.

Нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую химерный белок, описанный в Разделе 4.2., или любые его фрагменты, аналоги или производные, может быть получена любым(и) известным(и) в технике способом(ами). Нуклеиновую кислоту можно полностью синтезировать химическим путем. Или же нуклеиновую кислоту, кодирующую каждый фрагмент химерного белка, т.е. первый, второй или третий пептидный фрагмент, можно получать молекулярным клонированием или можно очищать от заданных клеток. Нуклеиновую кислоту, кодирующую каждый фрагмент химерного белка, можно затем химическим или ферментативным способом лигировать вместе с образованием нуклеиновой кислоты с нуклеотидной последовательностью, кодирующей химерный белок, описанный в Разделе 4.2., или его любые фрагменты, аналоги или производные.

Любая человеческая клетка потенциально может служить источником нуклеиновой кислоты для выделения нуклеиновой кислоты, кодирующей hGH. Любая клетка млекопитающего потенциально может служить источником нуклеиновой кислоты для выделения нуклеиновых кислот, кодирующих инсулин. Нуклеотидные последовательности, кодирующие инсулин, можно выделить из млекопитающего, человека, свиньи, коровы, кошачьих, птиц, лошади, псовых, а также из грызунов или приматов и т.д.

ДНК можно получать стандартными методами, известными в технике, из клонированной ДНК (например, библиотека на основе ДНК), химическими синтезами, клонированием кДНК или клонированием геномной ДНК или ее фрагментов, очищенных от заданных клеток (см., например, Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, 2d Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York; Glover, D.M. (ed), 1985, DNA Cloning: A Practical Approach, MRL Press, Ltd., Oxford, U.K. Vol. I, II). Клоны, полученные из геномной ДНК, могут содержать регуляторные и интронные области ДНК, помимо кодирующих областей; клоны кДНК будут содержать только экзоны. Вне зависимости от источника генов, осуществляют их молекулярное клонирование в соответствующий вектор с целью (размножения) культивирования гена.

При молекулярном клонировании гена из кДНК кДНК получают из тотально (полностью) клеточной РНК или мРНК хорошо известными из уровня техники способами. Гены можно также получать из геномной ДНК, где получают фрагменты ДНК (например, с помощью рестриктаз или гидродинамическим фрагментированием), некоторые из которых кодируют заданный ген. Линейные фрагменты ДНК затем могут быть разделены по размеру стандартными методами, включая, без ограничения, электрофорез на агарозном и полиакриламидном геле и колоночную хроматографию.

Когда нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую химерный белок, описанный в Разделе 4.2., или его любые фрагменты, аналоги или производные, получена, ее идентичность можно подтвердить секвенированием нуклеиновых кислот (любым методом, хорошо известным из уровня техники) и сравнением с известными последовательностями. Анализ последовательности ДНК можно осуществлять любым способом, известным из уровня техники, включая, без ограничения, метод Maxam and Gilbert (Maxam and Gilbert, 1980, Meth. Enzymol., 65:499-560), дидезокси-метод Sanger (Sanger et al., 1977, Proc. Natl. Acad. Sci. U.S.A., 74:5463), применение Т7 ДНК-полимеразы (Tabor and Richardson, Патент США 4795699), применение автоматического ДНК-секвенатора (например, Applied Biosystems, Foster City, CA) или метод, описанный в Международной заявке WO 97/15690.

Нуклеиновые кислоты, гибридизующиеся с нуклеиновой кислотой, содержащей нуклеотидную последовательность, кодирующую химерный белок, описанный в Разделе 4.2., или его любые фрагменты, аналоги или производные, могут быть выделены гибридизацией с нуклеиновой кислотой в расслабленных условиях, в строгих условиях или в условиях умеренной жесткости (см. также Shilo and Weinberg, 1981, Proc. Natl. Acad. Sci. USA, 78:6789-6792).

4.2. Химерный белок

Данное изобретение охватывает химерный белок, содержащий, от N-конца до С-конца: а) первый пептидильный фрагмент, состоящий из аминокислотной последовательности, которая, по меньшей мере, на 40% идентична домену, содержащему, по меньшей мере, 20 N-концевых аминокислот белка человеческого гормона роста (hGH), в котором процент идентичности определяется на протяжении аминокислотной последовательности, идентичной по длине домену hGH; b) остаток Arg, или остаток Lys, или второй пептидильный фрагмент, состоящий, по меньшей мере, из 2 аминокислот, причем в этом пептидильном фрагменте наибольшим С-концевым аминокислотным остатком является Arg или Lys; и с) третий пептидильный фрагмент, состоящий из аминокислотной последовательности, содержащей более двух цистеиновых (Cys) остатков, причем этот пептидильный фрагмент не является частью белка hGH.

В предпочтительном варианте данное изобретение включает химерный белок, описанный выше, в котором первый пептидильный фрагмент состоит из аминокислотной последовательности, по меньшей мере, на 60% идентичной домену hGH-белка.

В другом предпочтительном варианте данное изобретение включает химерный белок, описанный выше, в котором первый пептидильный фрагмент способен связываться с помощью антитела к hGH.

В более предпочтительном варианте данное изобретение предлагает химерный белок, описанный выше, в котором первый пептидильный фрагмент состоит из аминокислотной последовательности SEQ ID NО:l.

В другом, более предпочтительном варианте данное изобретение предлагает химерный белок, описанный выше, в котором первый пептидильный фрагмент состоит из аминокислотной последовательности SEQ ID NО:2.

В предпочтительном варианте данное изобретение включает химерный белок, описанный выше, в котором второй пептидильный фрагмент состоит из аминокислотной последовательности SEQ ID NО:3.

В особом варианте данное изобретение включает химерный белок, описанный выше, в котором третий пептидильный фрагмент является предшественником инсулина, предпочтительно человеческого происхождения.

В более предпочтительном варианте данное изобретение включает химерный белок, описанный выше, в котором предшественник человеческого инсулина способен связываться антителом против человеческого инсулина.

В другом, более предпочтительном варианте данное изобретение охватывает описанный выше химерный белок, в котором предшественник человеческого инсулина имеет аминокислотную последовательность SEQ ID NО:4.

Еще в одном, более предпочтительном варианте данное изобретение охватывает описанный выше химерный белок, в котором в предшественнике человеческого инсулина цепь В и цепь А предшественника человеческого инсулина отделены аминокислотным остатком или пептидильным фрагментом, содержащим от 2 до 34 аминокислотных остатков.

Еще в одном, более предпочтительном варианте данное изобретение охватывает описанный выше химерный белок, в котором предшественник человеческого инсулина имеет аминокислотную последовательность SEQ ID NО:5.

В наиболее предпочтительном варианте данное изобретение включает химерный белок, содержащий аминокислотную последовательность SEQ ID NО:6.

В другом наиболее предпочтительном варианте данное изобретение включает химерный белок, содержащий аминокислотную последовательность SEQ ID NО:7.

4.3. Получение химерного белка, описанного в Разделе 4.2.

Химерные белки, описанные в Разделе 4.2., и их производные, аналоги и фрагменты можно получать любым методом, известным из уровня техники, включая, без ограничения, методы рекомбинантной экспрессии, выделение из природных источников и химический синтез.

Например, химерные белки, описанные в Разделе 4.2., можно получать методом рекомбинантной экспрессии рекомбинантного белка. Для рекомбинантной экспрессии ген или область гена, кодирующую химерные белки, описанные в Разделе 4.2., встраивают в соответствующий клонирующий вектор для экспрессии в определенной клетке-хозяине. Можно использовать большое количество систем вектор-хозяин, известных из уровня техники. Возможные векторы включают, без ограничения, плазмиды или модифицированные вирусы, но векторная система должна быть совместима с используемой клет