Композиции и способы получения энтерокиназы в дрожжах

Изобретение относится к биотехнологии и представляет собой полинуклеотидную молекулу с SEQ ID №4 или 6, кодирующую легкую цепь энтерокиназы. Изобретение относится также к дрожжевому экспрессионному конструкту, содержащему указанную последовательность, а также к дрожжевой клетке, трансформированной конструктом. Изобретение касается также способа продуцирования энтерокиназы с использованием такой клетки. Изобретение позволяет эффективно получать энтерокиназу. 4 н. и 9 з.п. ф-лы, 1 ил., 3 табл., 6 пр.

Реферат

Данная заявка претендует на приоритет в соответствии с 35 U.S.С. §119(e) предварительной заявки на патент США №61/416622, поданной 23 ноября 2010 г., которая включена в полном объеме путем ссылки.

Энтерокиназа (ЭK, также известная как энтеропептидаза (ЭП); ЕС 3.4.21.9) - это гетеродимерный гликопротеин, продуцируемый клетками двенадцатиперстной кишки. Являясь членом химотрипсинового семейства сериновых протеаз, она секретируется кишечными железами (либеркюновыми криптами) вслед за входом заглатываемой пищи, проходящей из желудка, и присутствует в слизистой оболочке двенадцатиперстной и тощей кишок. Вовлеченная в переваривание диетических протеинов, ЭK катализирует расщепление N-концевого кислого пептидного фрагмента трипсиногена, превращая этот зимоген в его активную форму трипсин. Активация трипсина инициализирует каскад протеолитических реакций, приводящих к активации многих панкреатических зимогенов, включая химотрипсиногены, проэластазы, прокарбоксипептидазы и некоторые пролипазы.

Энтерокиназа может быть клонирована из нескольких млекопитающих источников, включая, например, человека, крупный рогатый скот, крыс и мышей. Структурно ЭK является сериновой протеазой, содержащей, приблизительно, 82-140 кДа тяжелой цепи, которая прикрепляет энтерокиназу к пограничной мембране кишечной щетки, и, приблизительно, 35-62 кДа легкой цепи, которая содержит каталитическую субъединицу. Легкая цепь прикреплена к тяжелой цепи через единичный дисульфидный мостик. В дополнение к этому единичному междоменному дисульфидному мостику легкая цепь содержит добавочные восемь цистеиновых остатков для образования специфических внутридоменных дисульфидных связей. Энтерокиназная легкая цепь содержит каталитическую активность и является достаточной для расщепления. ЭK и ее каталитически активные фрагменты являются высокоспецифичными к пентапептидной последовательности Asp-Asp-Asp-Asp-Lys (SEQ ID №1), расщепляя неустойчивую химическую связь, находящуюся за лизиновым остатком (DDDDK).

Из-за высокой степени специфичности ЭK применяют в качестве подходящего реагента в биохимических и биотехнологических прикладных технологиях. Например, слитый протеин, содержащий С-концевой очистительный тег (такой как поли-His), присоединенный с помощью этой последовательности к сайту расщепления, может быть расщеплен с помощью ЭK для удаления очистительного тега с целью получения конечного протеина после протеиновой очистки. Альтернативно, N-концевая про-последовательность протеаз, которая должна быть расщеплена перед активацией, может быть мутирована для разрешения активации энтерокиназой.

Рекомбинантная энтерокиназа (rЭK) успешно продуцируется бактериями, подобными Escherichia coli, и дрожжами, подобными Pichia pastoris, используя ген, продуцирующий 28 кДа протеин, охватывающий только каталитический домен легкой цепи. Однако, остаются затруднения с точки зрения экспрессии этого рекомбинантного энзима в дрожжах в достаточных количествах для коммерческого использования. Данное описание раскрывает улучшенную экспрессонную конструкцию, полезную для рентабельного продуцирования рекомбинантной энтерокиназы в количествах, полезных для коммерческого использования.

КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Варианты данного описания раскрывают полинуклеотидные молекулы, кодирующие энтерокиназу. Раскрытые полинуклеотидные молекулы, кодирующие энтерокиназу, включают SEQ ID №4, SEQ ID №6, их нуклеотидные варианты, их усеченные варианты и/или их комплимент, не ограничиваясь названными. Полинуклеотид, раскрытый в данном описании, может дополнительно содержать дрожжевой вектор экспрессии. Другие варианты изобретения раскрывают дрожжевой экспрессиионный конструкт, содержащий дрожжевой вектор экспрессии и полинуклеотидную молекулу, кодирующую энтерокиназу.

Другие аспекты данного изобретения раскрывают дрожжевые клетки, содержащие дрожжевой экспрессиионный конструкт, включающий молекулу полинуклеотида, кодирующего энтерокиназу. Раскрытый дрожжевой экспрессиионный конструкт может временно содержаться в дрожжевой клетке или содержаться в дрожжевой клетке стабильно. Дрожжевые клетки включают клетки штамма Pichia pastoris, клетки штамма Pichia methanolica, клетки штамма Pichia angusta, клетки штамма Schizosaccharomyces pombe, клетки штамма Saccharomyces cerevisiae или клетки штамма Yarrowia lipolytica, не ограничиваясь перечисленными.

Другие варианты данного изобретения раскрывают способы продуцирования энтерокиназы, используя дрожжевой экспрессиионный конструкт. Раскрытые способы включают этап экспрессии в дрожжевой клетке дрожжевого экспрессонного конструкта, раскрытого в данном описании. Другой вариант изобретения охватывает способы продуцирования энтерокиназы, включающие этапы введения дрожжевого экспрессонного конструкта, раскрытого в данном описании, в дрожжевую клетку и экспрессрования экспрессонного конструкта в дрожжевой клетке.

Другие варианты данного изобретения раскрывают способы расщепления полипептида, содержащего энтерокиназный сайт расщепления, с использованием энтерокиназы. Раскрытые способы включают этап контактирования полипептида, включающего энтерокиназный сайт расщепления, с энтерокиназой, где контактирование полипептида с энтерокиназой приводит к специфическому расщеплению энтерокиназного сайта расщепления. Использованная энтерокиназа может быть энтерокиназой, кодируемой молекулой полинуклеотида, раскрытой в данном описании, продуцируемой с использованием дрожжевого экспрессонного конструкта, раскрытого в данном описании, и/или продуцируемой с помощью экспрессии в дрожжевой клетке, раскрытой в данном описании.

Другие варианты данного изобретения раскрывают способы получения полипептида, содержащего энтерокиназный сайт расщепления, с использованием энтерокиназы. Раскрытые способы включают этап контактирования полипептида, включающего энтерокиназный сайт расщепления, с энтерокиназой, где контактирование полипептида с энтерокиназой приводит к специфическому расщеплению энтерокиназного сайта расщепления. Использованная энтерокиназа может быть энтерокиназой, закодированной молекулой полинуклеотида, раскрытой в данном описании, продуцируемой с использованием дрожжевого экспрессонного конструкта, раскрытого в данном описании, и/или продуцируемой с помощью экспрессии в дрожжевой клетке, раскрытой в данном описании.

КРАТКОЕ ОПИСАНИЕ ФИГУР

ФИГ. 1 показывает график средней ферментной активности энтерокиназы, полученной из шести разных клеточных линий дрожжей, содержащих интегрированную кассету ЭK, раскрытых в данном описании.

ОПИСАНИЕ

Дрожжевые системы экспрессии дают несколько преимуществ в качестве системы продуцирования геторологического полипептида. Во-первых, дрожжевые клетки могут давать значительную биомассу при выращивании на ферментерах (>300 г/л влажной клеточной массы), обеспечивая плотные культуры для продуцирования желательного полипептида в больших количествах. Во-вторых, в отличие от прокариотических экспрессонных систем дрожжевые системы экспрессии могут корректно управлять пост-трансляционным фолдингом и другими модификациями, специфичными для эукариотического полипептида, тем самым обеспечивая сохранение биологической активности, функции и стабильности гетерологического пептида. В-третьих, дрожжевые системы экспрессии являются подвижными и гибкими, предлагая 1) внехромосомную или геномную экспрессю; 2) конститутивный или индуцибельный контроль экспрессии, и 3) возможность направлять экспрессю геторологического полипептида в специфический клеточный или внеклеточный компартмент для облегчения выделения и очистки.

Данное описание раскрывает улучшенную экспрессонную конструкцию, полезную для рентабельного продуцирования рекомбинантной энтерокиназы в достаточно больших количествах, полезных для коммерческого использования. Эти результаты могут быть достигнуты использованием любой раскрытой генетически сконструированной полинуклеотидной молекулы, кодирующей энтерокиназу. Клонированные в дрожжевой вектор экспрессии и введенные в дрожжевую клетку, эти сконструированные молекулы могут продуцировать значительно большие количества энтерокиназы, чем возможно на сегодняшний день.

Таким образом, особенности данного описания охватывают, в частности, полинуклеотидную молекулу. Полинуклеотидная молекула, раскрытая в данном описании, может быть одноцепочечной или двуцепочечной ДНК, выделенной из генома организма, рекомбинантно полученной кДНК, химически синтезированной молекулой ДНК. Кроме того, "выделенная" полинуклеотидная молекула, как правило, является по существу свободной от других клеточных материалов, когда ее выделяют из геномного источника или получают с помощью рекомбинантных способов, или по существу свободной от химических предшественников или других химических веществ, когда ее химически синтезируют.

Особенности данного описания охватывают, в частности, полинуклеотидную молекулу, кодирующую энтерокиназу. В данном описании, термин "энтерокиназа" является синонимом "ЭK" и обозначает любой полипептид, который может селективно распознавать и расщеплять пентапептидную последовательность Asp-Asp-Asp-Asp-Lys (SEQ ID №1) при неустойчивой химической связи, находящейся за лизиновым остатком (DDDDK). В данном описании, термин "селективно распознает и расщепляет", когда ссылка делается на энтерокиназу, обозначает избирательное взаимодействие энтерокиназы с молекулой, содержащей SEQ ID №1, и расщепление неустойчивой химической связи, находящейся за лизиновым остатком последовательности SEQ ID №1, хотя по существу не взаимодействует с любой другой пентапептидной последовательностью, находящейся в молекуле, и не расщепляет ее. Как таковая, энтерокиназа обозначает нативный гетеродимерный гликопротеин, содержащий, приблизительно, 82-140 кДа тяжелой цепи и, приблизительно, 35-62 кДа легкой цепи, присоединенной с помощью единичного дисульфидного мостика, а также каталитически активный фрагмент легкой цепи. Примеры создания полинуклеотидной молекулы, кодирующей энтерокиназу, описаны в Примерах 1, 2 и 4-6.

В одном варианте осуществления изобретения, полинуклеотидная молекула, кодирующая энтерокиназу, может представлять собой SEQ ID №4, SEQ ID №6 или их комплемент.В данном описании, термин "комплемент" обозначает полинуклеотидную молекулу, которая является антисмысловой молекулой в смысле молекулы, кодирующей энтерокиназу. Полинуклеотидная молекула, кодирующая энтерокиназу, может включать полинуклеотидные участки, кодирующие другие типы полипептидных молекул, такие как, например, очистительные теги, сигналы клеточной секреции и/или сигналы субклеточной локализации. Образцом полинуклеотидной молекулы такого вида является SEQ ID №6. Полинуклеотидная молекула, кодирующая энтерокиназу, может также включать контрольные или регуляторные полинуклеотидные участки, которые направляют или облегчают, например, особенности транскрипции, трансляции и/или пост-трансляционной обработки.

В другом варианте осуществления изобретения, полинуклеотидная молекула, кодирующая энтерокиназу, может быть нуклеотидным вариантом SEQ ID №4, SEQ ID №6 или их комплементом, при условии, что нуклеотидное изменение SEQ ID №4 or SEQ ID №6 или их комплемента не изменит аминокислотную последовательность энтерокиназы, кодируемой полинуклеотидным вариантом. Как таковой, полинуклеотидный вариант SEQ ID №4, раскрытый в данном описании, кодирует энтерокиназу SEQ ID №5, и полинуклеотидный вариант SEQ ID №6, раскрытый в данном описании, кодирует энтерокиназу SEQ ID №7.

Согласно аспектам данного варианта осуществления изобретения, молекула полинуклеотидного варианта, кодирующего энтерокиназу, может быть, например, по меньшей мере на 70%, по меньшей мере на 75%, по меньшей мере на 80%, по меньшей мере на 85%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95%, по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98% или по меньшей мере на 99% идентичной полинуклеотидной последовательности SEQ ID №4, SEQ ID №6 или их комплементу.

Согласно другим аспектам данного варианта осуществления изобретения, молекула полинуклеотидного варианта, кодирующего энтерокиназу, может иметь, например, от, приблизительно, 1 до, приблизительно, 10, от приблизительно, 1 до, приблизительно, 15, от, приблизительно, 1 до, приблизительно, 20, от, приблизительно, 1 до, приблизительно, 25, от, приблизительно, 1 до, приблизительно, 30, от, приблизительно, 5 до, приблизительно, 25, от, приблизительно, 5 до, приблизительно, 30, от, приблизительно, 5 до, приблизительно, 35, от, приблизительно, 5 до, приблизительно, 40, от, приблизительно, 5 до, приблизительно, 45, от, приблизительно, 10 до, приблизительно, 40, от, приблизительно, 10 до, приблизительно, 45, от, приблизительно, 10 до, приблизительно, 50, от, приблизительно, 10 до, приблизительно, 55, или, от, приблизительно, 10 до, приблизительно, 60 несмежных нуклеотидных замещений в сравнении с SEQ ID №4, SEQ ID №6 или их комплементом. Согласно дополнительным аспектам данного варианта осуществления изобретения, молекула полинуклеотидного варианта, кодирующего энтерокиназу, может иметь, например, приблизительно, от 1 до, приблизительно, 10, от, приблизительно, 1 до, приблизительно, 15, от, приблизительно, 1 до, приблизительно, 20, от, приблизительно, 1 до, приблизительно, 25, от, приблизительно, 1 до, приблизительно, 30, от, приблизительно, 5 до, приблизительно, 25, от, приблизительно, 5 до, приблизительно, 30, от, приблизительно, 5 до, приблизительно, 35, от, приблизительно, 5 до, приблизительно, 40, от, приблизительно, 5 до, приблизительно, 45, от, приблизительно, 10 до, приблизительно, 40, от, приблизительно, 10 до, приблизительно, 45, от, приблизительно, 10 до, приблизительно, 50, от, приблизительно, 10 до, приблизительно, 55 или от, приблизительно, 10 до, приблизительно, 60 смежных нуклеотидных замещений в сравнении с SEQ ID №4, SEQ ID №6 или их комплементом.

Любой из множества способов выравнивания последовательностей может быть использован для идентификации полинуклеотида или полипептида, раскрытых в данном описании, включая глобальные способы, локальные способы и гибридные способы, такие как, например, способы сегментного подхода, не ограничиваясь названными. Протоколы для определения процента идентичности являются рутинными процедурами для специалиста в данной области техники и раскрыты в данном описании.

Глобальные способы выравнивают последовательности от начала до конца молекулы и определяют лучшее выравнивание путем добавления большого числа индивидуальных пар остатков и наложения гэповых штрафов. Способы включают, например, CLUSTAL W, смотри, например, Julie D. Thompson et al., CLUSTAL W: Improving the Sensitivity of Progressive Multiple Sequence Alignment Through Sequence Weighting, Position-Specific Gap Penalties and Weight Matrix Choice, 22(22) Nucleic Acids Research 4673-4680 (1994); и интерактивную рафинацию, смотри, например, Osamu Gotoh, Significant Improvement in Accuracy of Multiple Protein Sequence Alignments by Iterative Refinement as Assessed by Reference to Structural Alignments, 264(4) J. Mol. Biol. 823-838 (1996), но не ограничиваются указанными.

Локальные способы выравнивают последовательности путем идентифицирования одного или более консервативных мотивов, общих для всех вводимых последовательностей. Способы включают, например, Match-box, смотри, например, Eric Depiereux and Ernest Feytmans, Match-Box: A Fundamentally New Algorithm for the Simultaneous Alignment of Several Protein Sequences, 8(5) CABIOS 501-509 (1992); Gibbs sampling, смотри, например, С.Ε. Lawrence et al., Detecting Subtle Sequence Signals: A Gibbs Sampling Strategy for Multiple Alignment, 262(5131) Science 208-214 (1993); Align-M, смотри, например, Ivo Van Walle et al., Align-M-A New Algorithm for Multiple Alignment of Highly Divergent Sequences, 20(9) Bioinformatics,: 1428-1435 (2004), но не ограничиваются перечисленными.

Гибридные способы объединяют функциональные особенности как глобальных, так и локальных способов выравнивания. Способы включают, например, сравнение сегмент-к-сегменту, смотри, например, Burkhard Morgenstern et al., Multiple DNA and Protein Sequence Alignment Based on Segment-To-Segment Comparison, 93(22) Proc. Natl. Acad. Sci. U.S.A. 12098-12103 (1996); T-Coffee, смотри, например, Cédric Notredame et al., T-Coffee: A Novel Algorithm for Multiple Sequence Alignment, 302(1) J. Mol. Biol. 205-217 (2000); MUSCLE, смотри, например, Robert С. Edgar, MUSCLE: Multiple Sequence Alignment With High Score Accuracy and High Throughput, 32(5) Nucleic Acids Res. 1792-1797 (2004); и DIALIGN-T, смотри, например, Amarendran R Subramanian et al., DIALIGN-T: An Improved Algorithm for Segment-Based Multiple Sequence Alignment, 6(1) BMC Bioinformatics 66 (2005).

Согласно другим аспектам данного варианта осуществления изобретения, молекула полинуклеотидного варианта, кодирующего энтерокиназу, может представлять собой полинуклеотидный вариант, который гибридизирует с полинуклеотидной молекулой, содержащей SEQ ID №4, SEQ ID №6 или их комплемент, в жестких условиях. Такие жесткие условия известны специалистам в данной области техники и могут быть найдены, например, в Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6, включенных в полном объеме в данное описание путем ссылки. Неограничивающим примером жестких (например, строго жестких) условий гибридизации является гибридизация в 6х хлориде натрия/цитрате натрия (SSC) при, приблизительно, 45°С, с последующим одноразовым или многоразовым промыванием 0,2×SSC, 0,1% SDS при 50-65°С.

Согласно другим аспектам данного варианта осуществления изобретения, молекула полинуклеотидного варианта, кодирующего энтерокиназу, может быть полинуклеотидным вариантом, раскрытым в Таблице 1. Эта таблица включает аминокислотную последовательность легкой цепи энтерокиназы, кодоны, содержащие открытую рамку считывания полинуклеотидного участка последовательностей SEQ ID №4 и SEQ ID №6, кодирующих фрагмент этой легкой цепи, варианты кодонов, которые могут замещать кодоны SEQ ID №4 и SEQ ID №6. Согласно аспектам данного варианта осуществления настоящего изобретения, молекула варианта полинуклеотида, кодирующего энтерокиназу, имеет, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 вариантных кодонов, показанных в Таблице 1, которые замещают соответствующие кодоны, присутствующие в SEQ ID №4 или SEQ ID №6. Согласно другим аспектам данного варианта осуществления изобретения, молекула варианта полинуклеотида, кодирующего энтерокиназу, имеет, например, по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 6, по меньшей мере 7, по меньшей мере 8, по меньшей мере 9, по меньшей мере 10, по меньшей мере 11, по меньшей мере 12, по меньшей мере 13, по меньшей мере 14, по меньшей мере 15, по меньшей мере 16, по меньшей мере 17, по меньшей мере 18, по меньшей мере 19 или по меньшей мере 20 вариантных кодонов из Таблицы 1, которые замещают соответствующий кодон, присутствующий в SEQ ID №4 или SEQ ID №6. Согласно другим аспектам данного варианта осуществления изобретения, молекула вариантного полинуклеотида, кодирующего энтерокиназу, имеет, например, не менее чем 1, не менее чем 2, не менее чем 3, не менее чем 4, не менее чем 5, не менее чем 6, не менее чем 7, не менее чем 8, не менее чем 9, не менее чем 10, не менее чем 11, не менее чем 12, не менее чем 13, не менее чем 14, не менее чем 15, не менее чем 16, не менее чем 17, не менее чем 18, не менее чем 19 или не менее чем 20 вариантных кодонов, показанных в Таблице 1, замещающих соответствующий кодон, присутствующий в SEQ ID №4 or SEQ ID №6.

Таблица 1.
Нуклеиновокислотные последовательности энтерокиназы
Аминокислота I V G G S D S R Ε G A W
Кодон ATA GTT GGC GGC TCT GAC TCC AGA GAA GGT GCC TGG
Вариант ATT АТС - GGT GGA GGT GGA - GAT TCT - - GGA GCT -
Аминокислота Ρ W V V A L Y F D D Q Q
Кодон CCA TGG GTC GTT GCC TTA TAC TTT GAT GAT CAA CAG
Вариант ест - GTT - GCT TTG TAT - - - - CAA
Аминокислота V С G A S L V S R D W L
Код он GTC TGT GGT GCT TCA CTT GTT TCT AGA GAT TGG TTG
Вариант GTT - GGA - TCT TTG - - - - - -
Аминокислота V S A A H С V Y G R N M
Кодон GTG ТСС GCA GCA CAT TGT GTG TAT GGT AGG AAT ATG
Вариант GTT ТСТ GCT GCT - - GTT TAC GGA AGA CAA -
Аминокислота Ε Ρ S K W K A V L G L H
Кодон GAG ест TCA AAG TGG AAA GCT GTA TTG GGG TTG CAT
Вариант GAA CCA TCT - - AAG - GTT - GGT GGA - -
Аминокислота M A S N L Τ S Ρ Q I Ε Τ
Кодон ATG GCC TCT AAC CTT АСА AGT CCA CAA ATT GAA ACT
Вариант - GCT - - TTG ACT TCT CCT - АТС - -
Аминокислота R L I D Q I V I N Ρ Η Y
Кодон AGA СТА ATT GAT CAA ATT GTT АТС AAT CCT CAT TAC
Вариант - TTG АТС - - АТС - ATT AAC CCA - -
Аминокислота N K R R K N N D I A M M
Кодон AAT AAG CGT AGG AAA AAC AAT GAC ATA GCA ATG ATG
Вариант AAC - AGA AGA AAG - AAC GAT ATT GCT - -
АТС
Аминокислота H L Ε M K V N Y Τ D Y I
Кодон САС TTG GAG ATG AAA GTT AAC TAC АСА GAC TAC АТС
Вариант CAT - GAA - AAG - - - ACT GAT - ATT
Аминокислота Q Ρ I С L Ρ Ε Ε Ν Q V F
Кодон CAA CCA ATA TGT TTG CCT GAG GAA AAT CAG GTG TTC
Вариант - CCT ATT АТС - - CCA GAA - AAC CAA GTT TTT
Аминокислота Ρ Ρ G R I С S I A G W G
Кодон CCA CCT GGT CGT ATT TGT AGT ATT GCT GGA TGG GGA
Вариант ест CCA GGA AGA АТС - TCT АТС - GGT - GGT
Аминокислота A L I Y Q G S Τ A D V L
Кодон GCC CTG АТС TAC CAA GGA TCT ACC GCT GAC GTA TTA
Вариант GCT TTG ATT - - GGT - ACT - GAT GTT TTG
Аминокислота Q Ε A D V Ρ L L S N Ε K
Кодон CAA GAG GCA GAT GTT CCT CTG CTG ТСС AAC GAG AAA
Вариант - GAA GCT - - CCA TTG TTG TCT - GAA AAG
Аминокислота С Q Q Q M Ρ Ε Y N I Τ Ε
Кодон TGC CAG CAA CAA ATG CCA GAA TAC AAC АТС ACT GAA
Вариант - CAA - - - CCT - - - ATT - -
Аминокислота N M V С A G Y Ε A G G V
Кодон AAC ATG GTT TGT GCT GGT TAT GAA GCT GGA GGT GTA
Вариант - - - - - GGA TAC - - GGT GGA GTT
Аминокислота D S С Q G D S G G Ρ L M
Кодон GAT TCA TGC CAG GGA GAT TCA GGC GGT CCT СТА ATG
Вариант - TCT - CAA GGT - TCT GGT GGA GGA CCA TTG -
Аминокислота С Q Ε Ν N R W L L A G V
Кодон TGC CAG GAG ΑΑΤ AAC CGA TGG TTG CTT GCT GGT GTA
Вариант - CAA GAA AAC - AGA - - TTG - GGA GTT
Аминокислота Τ S F G Y Q С A L Ρ N R
Кодон ACG AGT TTT GGA TAT CAA TGC GCT TTA CCT AAC CGT
Вариант ACT TCT - GGT TAC - - - TTG CCA - AGA
Аминокислота Ρ G V Y A R V Ρ R F Τ Ε
Кодон CCA GGG GTC TAT GCA AGA GTC CCA AGA TTC ACC GAG
Вариант CCT GGT GGA GTT TAC GCT - GTT CCT - TTT ACT GAA
Аминокислота W I Q S F L H *
Кодон TGG ATT CAA TCT TTT CTG CAC TGA
Вариант - АТС - - - TTG CAT TAA

В дополнительных аспектах данного варианта осуществления изобретения, полинуклеотидная молекула, кодирующая энтерокиназу, может быть полинуклеотидным вариантом, раскрытым в Таблице 2. Эта таблица включает аминокислотные последовательности легкой цепи энтерокиназы, кодоны, содержащие открытую рамку считывания полинуклеотидного участка последовательностей SEQ ID №4 и SEQ ID №6, кодирующих этот фрагмент легкой цепи, и варианты кодонов, которые могут замещать кодоны SEQ ID №4 и SEQ ID №6. Согласно аспектам данного варианта осуществления настоящего изобретения, молекула полинуклеотидного варианта, кодирующая энтерокиназу, имеет, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 вариантных кодонов из Таблицы 2, замещающих соответствующий кодон, присутствующий в SEQ ID №4 или SEQ ID №6. Согласно другим аспектам данного варианта осуществления изобретения, молекула вариантного полинуклеотида, кодирующего энтерокиназу, имеет, например, по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 6, по меньшей мере 7, по меньшей мере 8, по меньшей мере 9, по меньшей мере 10, по меньшей мере 11, по меньшей мере 12, по меньшей мере 13, по меньшей мере 14, по меньшей мере 15, по меньшей мере 16, по меньшей мере 17, по меньшей мере 18, по меньшей мере 19 или по меньшей мере 20 вариантных кодонов из Таблицы 2, замещающих соответствующий кодон, присутствующий в SEQ ID №4 or SEQ ID №6. Согласно другим аспектам данного варианта осуществления изобретения, молекула вариантного полинуклеотида, кодирующего энтерокиназу, имеет, например, не менее чем 1, не менее чем 2, не менее чем 3, не менее чем 4, не менее чем 5, не менее чем 6, не менее чем 7, не менее чем 8, не менее чем 9, не менее чем 10, не менее чем 11, не менее чем 12, не менее чем 13, не менее чем 14, не менее чем 15, не менее чем 16, не менее чем 17, не менее чем 18, не менее чем 19 или не менее чем 20 вариантных кодонов из Таблицы 2, замещающих соответствующий кодон, присутствующий в SEQ ID №4 и SEQ ID №6.

Таблица 2.
Нуклеиновокислотные последовательности энтерокиназы
Аминокислота I V G G S D S R Ε G A W
Кодон ATA GTT GGC GGC TCT GAC ТСС AGA GAA GGT GCC TGG
Вариант ATT - GGT GGT - GAT TCT - - - GCT -
Аминокислота Ρ W V V A L Y F D D Q Q
Кодон CCA TGG GTC GTT GCC TTA TAC TTT GAT GAT CAA CAG
Вариант - - GTT - GCT TTG TAT - - - - CAA
Аминокислота V С G A S L V S R D W L
Кодон GTC TGT GGT GCT TCA CTT GTT TCT AGA GAT TGG TTG
Вариант GTT - - - TCT TTG
Аминокислота V S A A H С V Y G R N M
Кодон GTG ТСС GCA GCA CAT TGT GTG TAT GGT AGG AAT ATG
Вариант GTT TCT GCT GCT - - GTT TAC - AGA CAA -
Аминокислота Ε Ρ S K W К A V L G L H
Кодон GAG CCT TCA AAG TGG AAA GCT GTA TTG GGG TTG CAT
Вариант GAA CCA TCT - - AAG - GTT - GGT - -
Аминокислота M A S N L Τ S Ρ Q I Ε Τ
Кодон ATG GCC TCT AAC CTT АСА AGT CCA CAA ATT GAA ACT
Вариант - GCT - - TTG ACT TCT
Аминокислота R L I D Q I V I N Ρ Η Y
Кодон AGA СТА ATT GAT CAA ATT GTT АТС AAT CCT CAT TAC
Вариант - TTG ATT AAC CCA - -
Аминокислота N K R R K N N D I A M M
Кодон AAT AAG CGT AGG AAA AAC AAT GAC ATA GCA ATG ATG
Вариант AAC - AGA AGA AAG - AAC GAT ATT GCT - -
Аминокислота H L Ε M K V N Y Τ D Y I
Кодон CAC TTG GAG ATG AAA GTT AAC TAC АСА GAC TAC АТС
Вариант CAT - GAA - AAG - - - ACT GAT - ATT
Аминокислота Q Ρ I С L Ρ Ε Ε N Q V F
Кодон CAA CCA ATA TGT TTG CCT GAG GAA AAT CAG GTG TTC
Вариант - - ATT - - CCA GAA - AAC CAA GTT ТТТ
Аминокислота Ρ Ρ G R I С S I A G W G
Кодон CCA CCT GGT CGT ATT TGT AGT ATT GCT GGA TGG GGA
Вариант - CCA - AGA - - TCT - - GGT - GGT
Аминокислота A L I Y Q G S Τ A D V L
Кодон GCC CTG АТС TAC CAA GGA TCT ACC GCT GAC GTA TTA-
Вариант GCT TTG ATT - - GGT - ACT - GAT GTT TTG
Аминокислота Q Ε A D V Ρ L L S N Ε K
Кодон CAA GAG GCA GAT GTT CCT CTG CTG ТСС AAC GAG AAA
Вариант - GAA GCT - - CCA TTG TTG TCT - GAA AAG
Аминокислота С Q Q Q M Ρ Ε Y N I Τ Ε
Кодон TGC CAG CAA CAA ATG CCA GAA TAC AAC АТС ACT GAA
Вариант - CAA - - - - - - - ATT - -
Аминокислота N M V С A G Y Ε A G G V
Кодон AAC ATG GTT TGT GCT GGT TAT GAA GCT GGA GGT GTA
Вариант - - - - - - TAC - - GGT - GTT
Аминокислота D S С Q G D S G G Ρ L M
Кодон GAT TCA TGC CAG GGA GAT TCA GGC GGT CCT СТА ATG
Вариант - TCT - CAA GGT - TCT GGT - CCA TTG -
Аминокислота С Q Ε N N R W L L A G V
Кодон TGC CAG GAG AAT AAC CGA TGG TTG CTT GCT GGT GTA
Вариант - CAA GAA AAC - AGA - - TTG - - GTT
Аминокислота Τ S F G Y Q С A L Ρ N R
Кодон ACG AGT TTT GGA TAT CAA TGC GCT TTA CCT AAC CGT
Вариант ACT TCT - GGT TAC - - - TTG CCA - AGA
Аминокислота Ρ G V Y A R V Ρ R F Τ Ε
Кодон CCA GGG GTC TAT GCA AGA GTC CCA AGA TTC ACC GAG
Вариант - GGT GTT TAC GCT - GTT - - TTT ACT GAA
Аминокислота W I Q S F L H *
Кодон TGG ATT CAA TCT TTT CTG CAC TGA
Вариант TTG CAT TAA

Согласно другому варианту осуществления изобретения полинуклеотидная молекула, кодирующая энтерокиназу, может быть усеченным фрагментом SEQ ID №4, SEQ ID №6 или их нуклеотидного варианта. В данном описании, термин "усеченный фрагмент SEQ ID №4, SEQ ID №6 или любого из его нуклеотидных вариантов" обозначает удаление нуклеотидов из 710 нуклеотидной последовательности, сформированной SEQ ID №4 или ее нуклеотидным вариантом, или из 953 нуклеотидной последовательности, сформированной SEQ ID №6 или ее нуклеотидным вариантом. Могут быть удалены нуклеотиды с 5'-конца, 3'-конца или 5'-конца и 3'-конца последовательностей SEQ ID №4, SEQ ID №6 или любого их нуклеотидного варианта.

Согласно аспектам данного варианта осуществления настоящего изобретения 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45 или 50 нуклеотидов удалены с 5'-конца, 3'-конца или с 5'-конца и 3'-конца последовательностей SEQ ID №4, SEQ ID №6 или любого их нуклеотидного варианта или комплемента. Согласно другим аспектам данного варианта осуществления изобретения, по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 6, по меньшей мере 7, по меньшей мере 8, по меньшей мере 9, по меньшей мере 10, по меньшей мере 11, по меньшей мере 12, по меньшей мере 13, по меньшей мере 14, по меньшей мере 15, по меньшей мере 16, по меньшей мере 17, по меньшей мере 18, по меньшей мере 19, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 35, по меньшей мере 40, по меньшей мере 45 или по меньшей мере 50 нуклеотидов удалены с 5'-конца, 3'-конца или с 5'-конца и 3'-конца последовательностей SEQ ID №4, SEQ ID №6 или любого их нуклеотидного варианта или комплемента. Согласно другим аспектам данного варианта осуществления изобретения, не менее чем 1, не менее чем 2, не менее чем 3, не менее чем 4, не менее чем 5, не менее чем 6, не менее чем 7, не менее чем 8, не менее чем 9, не менее чем 10, не менее чем 11, не менее чем 12, не менее чем 13, не менее чем 14, не менее чем 15, не менее чем 16, не менее чем 17, не менее чем 18, не менее чем 19, не менее чем 20, не менее чем 25, не менее чем 30, не менее чем 35, не менее чем 40, не менее чем 45 или не менее чем 50 удалены с 5'-конца, 3'-конца или с 5'-конца и 3'-конца