Днк, кодирующая дипептид-синтезирующий фермент (варианты), бактерия рода escherichia и способ получения дипептидов с ее использованием

Иллюстрации

Показать все

Изобретение относится к биотехнологии и представляет собой дипептид-продуцирующую бактерию рода Escherichia, которая модифицирована таким образом, что она содержит ДНК, кодирующую белок с дипептид-синтезирующей активностью. Изобретение относится также к способу получения дипептида или его соли с использованием такой бактерии или с использованием белка с дипептид-синтезирующей активностью. Изобретение позволяет эффективно получать дипептиды. 3 н. и 13 з.п. ф-лы, 28 ил., 12 табл., 14 пр.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к биотехнологической промышленности, более точно - к новым дипептид-синтезирующим ферментам и способам получения дипептидов, в частности дипептидов, имеющих кислые L-аминокислотные остатки на N-конце.

Уровень техники

Дипептиды используются в фармакологии, пищевой промышленности и в других различных областях. Например, дипептид Asp-Glu использовался для приготовления диуретической и натрийуретической фармацевтической композиции (FR2662359 А1). Известна фармацевтическая композиция, содержащая дипептиды, имеющие агонистическое влияние на подтипы NR1/NR2A и NR1/NR2B рецептора NMDA (JP 2009209131 А). Были изучены вкусовые качества многочисленных дипептидов. Например, дипептид Asp-Val имеет кислый вкус (Sogame S. and Matsushita I., New Food Ind., 1996, 38(12):44-49 (Japanese)). Известен прекрасный усилитель вкуса соли, который получается при использовании содержащего глутаминовую кислоту дипептида, такого как Glu-Ala, Glu-Asp, Glu-Glu, Glu-Ile, Asp-Glu, His-Glu, Trp-Glu и т.д. (WO 2009113563 А1).

Известны различные способы получения дипептидов, включающие экстракцию из белковых гидролизатов, химический синтез из защищенных и/или активированных аминокислот и ферментативные способы синтеза с участием пептидаз и защищенных аминокислот (Akabori S. et al., Bull. Chem. Soc. Japan, 1961, 34:739; Monter В. et al., Biotechnol. Appl. Biochem., 1991, 14(2):183-191). Была описана генетическая конструкция, кодирующая пептид, включающий повторяющуюся аминокислотную последовательность (Asp-Phe)n, подходящую для получения бензилированных и метилированных производных дипептида Asp-Phe (Европейская патентная заявка No. 0036258).

Получение дипептидов с использованием химических и/или химико-ферментативных подходов требует введение и удаление защитных групп для функциональных групп реагирующих аминокислот и выделение требуемого продукта из рацемической смеси. Таким образом, описанные способы получения дипептидов считаются невыгодными с точки зрения цены, эффективности и необходимости утилизации сопутствующих химических реагентов, таких как органические растворители, соли и подобные им.

Было описано несколько подходов ферментативного получения дипептидов и их производных, которые включают способ, использующий обратимую реакцию пролиниминопептидазы, обладающей способностью продуцировать пептиды из L-аминокислот и их сложных эфиров (патент РФ №2279440); способ, использующий нерибосомальную пептидсинтетазу (NRPS) (патенты США №№5,795,738 и 5,652,116; Doekel S. и Marahiel M.A., Chem. Biol., 2000, 7:373-384; Dieckmann R. et al., FEBS Lett., 2001, 498:42-45); способ, использующий аминоацил-m-PHK-синтетазу (патенты Японии №№58-146539 (1983), 58-209992 (1983), и 59-106298 (1984)); и способ, использующий мутантный белок, имеющий пептид-синтезирующую активность (Российская патентная заявка 2007127719).

Ферменты, принадлежащие к суперсемейству АТФ-зависимых карбоксилат-амин/тиол-α-лигаз, широко использовались для получения дипептидов, имеющих α-пептидную связь между двумя L-аминокислотами. Например, при использовании функции поиска по гомологии в SubtiList (http://genolist.pasteur.fr/SubtiList/), являющемся базой данных геномной ДНК Bacillus subtilis 168, и аминокислотную последовательность гена D-Ala-D-Ala-лигазы из Bacillus subtilis 168, был обнаружен ген ywfE, который кодирует фермент, способный синтезировать дипептиды, имеющие на N-конце L-аминокислоту, такую как, в частности, L-Ala, L-Gly, L-Met, L-Ser и L-Thr (Tabata K. et al., J. Bacteriol., 2005, 187(15):5195-5202; патенты США №7,514,243 и №7,939,302). Несмотря на то что белок YwfE (бацилизинсинтетаза, классификационный номер фермента (ЕС) 6.3.2.28) имеет экстремально широкую субстратную специфичность, фермент не связывает аминокислоты, обладающие высоким зарядом, такие как L-Lys, L-Arg, L-Glu и L-Asp, и вторичные амины, такие как L-Pro (Tabata K. et al., J. Bacteriol., 2005, 187(15):5195-5202). Описан белок, кодируемый геном ризоктицинсинтетазы и имеющий дипептид-синтезирующую активность, который утилизирует L-аминокислоты Gly и β-Ala как субстраты (патент США №7,939,294). Как подтверждается выделившейся фосфорной кислотой (Pi), а также методами времяпролетной масс-спектроскопии (TOFMS) и ЯМР, фермент помещает L-Arg и L-Lys на N-конец дипептида. Анализ, основанный на Hidden Markov Model (НММ)-профиле, позволил обнаружить пять L-аминокислота-α-лигаз, происходящих из Treponema denticola АТСС 35405, Photorhabdus luminescence subsp. laumondii TTO1, Streptococcus mutants UA159, Streptococcus pneumoniae TIGR4 и Actinobacillus pleuropneumoniae серологический вариант 1 str. 4074, способных к образованию из L-аминокислот различных пептидных соединений, как подтверждается отщеплением фосфорной кислоты (Senoo A. et al., Biosci. Biotechnol. Biochem., 2010, 74(2):415-418). Ни одно дипептидное образование не было подтверждено в комбинации L-Glu или L-Asp с другими L-аминокислотами. Мутантный белок, имеющий пептид-синтезирующую активность, как было подтверждено методом высокоэффективной жидкостной хроматографии (ВЭЖХ) с использованием стандартных образцов, образует дипептиды, несущие L-Met на N-конце (Российская патентная заявка №2007127719). Компьютерный скрининг, выполненный с помощью сервиса BLAST в NCBI (http://www.ncbi.nlm.nih.gov/BLAST/) и основанный на аминокислотной последовательности Lal из В.subtilis (BsLal) обнаружил белок RSp1486a из Ralstonia solanacearum, который способен образовывать дипептидную связь, как подтверждено отщеплением фосфорной кислоты (Kino K. et al., Biochem. Biophys. Res. Comm., 2008, 371:536-540; Европейская патентная заявка №1870454). Структурный анализ с использованием метода ЯМР подтвердил образование дипептидов, имеющих L-Ser, L-Met, L-Gln, L-Phe, L-His, L-Ala и L-Cys на N-конце. Несмотря на то что неорганический фосфат отщеплялся, как было доказано, в смеси, содержащей RSp1486a и L-Asp с L-Phe, L-His, L-Met, L-Cys или L-Ala; или RSp1486a и L-Glu с L-Phe, L-His, L-Met, L-Cys, L-Ser или L-Ala, структурный анализ продуктов реакции не проводился. Никакого дополнительного отщепления фосфорной кислоты сверх фонового уровня в реакционной смеси, содержащей RSp1486a и L-Asp или L-Glu, не наблюдалось. Было обнаружено, что новая открытая L-аминокислоталигаза RizB из В.subtilis NBRC3134 синтезирует различные гетеропептиды и гомоолигомеры аминокислот с разветвленной цепью, состоящие из 2-5 аминокислотных остатков (Kino K., Yakugaku Zasshi, 2010, 130(11):1463-1469). Например, методом масс-спектроскопии (LC-ESI-MS анализ) было доказано образование димера, тримера и тетрамера L-Val в смеси, содержащей RizB, L-Val и L-Glu или L-Asp. Гетеропептидов обнаружено не было.

В настоящее время нет данных, описывающих синтез дипептидов, имеющих кислые L-аминокислотные остатки, такие как остатки L-Glu или L-Asp, на N-конце и любую другую L-аминокислоту или ее производное на С-конце, с использованием L-аминокислота-α-лигазы (Lal).

Раскрытие сущности изобретения

Цель настоящего изобретения - предоставление ДНК, кодирующей L-аминокислота-α-лигазу (Lal), способную синтезировать дипептид(ы), содержащий(ие) кислые L-аминокислоты, такие как L-Asp или L-Glu, на N-конце и любую другую L-аминокислоту или ее производное на C-конце, в реакционной смеси, которая содержит высокоэнергетические (макроэргические) молекулы, такие как аденозин 5′-трифосфат (АТФ) или его соль.

Другая цель настоящего изобретения - предоставление бактерии рода Escherichia, принадлежащей к виду Escherichia coli, которая модифицирована таким образом, что она содержит ДНК, кодирующую Lal, как здесь описано.

Другая цель настоящего изобретения - предоставление способа получения дипептидов, имеющих кислые L-аминокислоты, такие как L-Asp или L-Glu, на N-конце и любую другую L-аминокислоту или ее производное на С-конце, в реакционной смеси, которая содержит макроэргические молекулы, такие как аденозин 5′-трифосфат (АТФ) или его соль, с использованием фермента Lal, как описано здесь, или бактерии рода Escherichia, которая модифицирована таким образом, что она содержит ДНК, кодирующую фермент Lal, как здесь описано.

Эти цели были достигнуты благодаря обнаружению новых бактериальных L-аминокислота-α-лигаз (Lals), катализирующих образование дипептидов, имеющих кислые L-аминокислоты, такие как L-Asp или L-Glu, на N-конце.

Цель настоящего изобретения - предоставление ДНК, кодирующей белок, имеющий дипептид-синтезирующую активность, отличающейся тем, что ДНК выбрана из группы, состоящей из:

(A) ДНК, имеющей нуклеотидную последовательность SEQ ID NOs:1, 3, 5, 7, 9, 11, 13, 15 и 17;

(B) ДНК, гибридизующейся в жестких условиях с нуклеотидной последовательностью, комплементарной последовательности, представленной в SEQ ID NOs:1, 3, 5, 7, 9, 11, 13, 15 и 17, отличающейся тем, что указанные жесткие условия включают промывание один или более раз в растворе, содержащем концентрацию солей 1×SSC, 0.1% SDS или 0.1×SSC, 0.1% SDS, при 60°С или 65°С;

(C) ДНК, кодирующей белок, имеющий аминокислотную последовательность SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18;

(D) ДНК, кодирующей вариант белка, имеющего аминокислотную последовательность SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18, но которая содержит замену, делецию, вставку или добавление одного или нескольких аминокислотных остатков, и имеющего дипептид-синтезирующую активность в соответствии с аминокислотной последовательностью SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18;

(Е) ДНК, кодирующей белок, имеющий гомологию, определенную через значение |Log10(E-value)|, не менее чем 128, не менее чем 142, не менее чем 162, не менее чем 175, не менее чем 182, не менее чем 196 или не менее чем 233 по сравнению с аминокислотной последовательностью SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18 и имеющий дипептид-синтезирующую активность в соответствии с аминокислотной последовательностью SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18.

Цель настоящего изобретения - предоставление рекомбинантной ДНК для экспрессии ДНК, как описано выше, содержащей ДНК, как описано выше.

Цель настоящего изобретения - предоставление дипептид-продуцирующей бактерии, принадлежащей к роду Escherichia и модифицированной таким образом, чтобы содержать рекомбинантную ДНК, как описано выше.

Другая цель настоящего изобретения - предоставление бактерии, как описано выше, отличающейся тем, что бактерия принадлежит к виду Escherichia coli.

Другая цель настоящего изобретения - предоставление бактерии, как описано выше, отличающейся тем, что бактерия модифицирована таким образом, чтобы иметь ослабленные или инактивированные один или более генов, кодирующих белки, обладающие пептидазой активностью.

Другая цель настоящего изобретения - предоставление бактерии, как описано выше, отличающейся тем, что гены, кодирующие белки, имеющие пептидазную активность, выбраны из группы, состоящей из рерА, рерВ, pepD, pepE, pepP, pepQ, pepN, pepT, iadA, iaaA(ybiK) и dapE.

Цель настоящего изобретения - предоставление белка, имеющего дипептид-синтезирующую активность, отличающегося тем, что указанный белок выбран из группы, состоящей из:

(F) белка, имеющего аминокислотную последовательность SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18;

(G) варианта белка, имеющего аминокислотную последовательность SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18, но которая содержит замену, делецию, вставку или добавление одного или нескольких аминокислотных остатков, и имеющего дипептид-синтезирующую активность в соответствии с аминокислотной последовательностью SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18;

(Н) белка, имеющего гомологию, определенную через значениие |Log10(E-value)|, не менее чем 128, не менее чем 142, не менее чем 162, не менее чем 175, не менее чем 182, не менее чем 196 или не менее чем 233 по сравнению с аминокислотной последовательностью SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18, и имеющего дипептид-синтезирующую активность в соответствии с аминокислотной последовательностью SEQ ID NOs:2, 4, 6, 8, 10, 12, 14 и 16.

Цель настоящего изобретения - предоставление способа получения белка, как описано выше, включающего:

(a) выращивание бактерии, как описано выше, в питательной среде для продукции указанного белка;

(b) накопление указанного белка в бактерии и/или культуральной жидкости и, если необходимо,

(c) выделение указанного белка из бактерии или культуральной жидкости.

Цель настоящего изобретения - предоставление способа получения дипептида или его соли, включающего:

(a) реакцию L-аминокислот, или производных L-аминокислот, или их солей в приемлемых условиях в присутствии белка, как описано выше;

(b) накопление указанного дипептида или его соли в приемлемом растворителе и, если необходимо,

(c) выделение указанного дипептида или его соли из приемлемого растворителя.

Цель настоящего изобретения - предоставление способа получения дипептида или его соли, включающего:

(a) выращивание бактерии, как описано выше, в питательной среде;

(b) накопление указанного дипептида в бактерии и/или культуральной жидкости и, если необходимо,

(c) выделение указанного дипептида из бактерии или культуральной жидкости.

Цель настоящего изобретения - предоставление способа, как описано выше, отличающегося тем, что указанные L-аминокислоты или их производные выбраны из группы, состоящей из L-аланина, L-аргинина, L-аспарагина, L-аспарагиновой кислоты, L-цистеина, L-глутаминовой кислоты, L-глутамина, глицина, L-гистидина, L-изолейцина, L-лейцина, L-лизина, L-метионина, L-фенилаланина, L-пролина, L-серина, L-треонина, L-триптофана, L-тирозина, L-валина и низшего алкильного эфира L-фенилаланина.

Цель настоящего изобретения - предоставление способа, как описано выше, отличающегося тем, что указанный дипептид представлен формулой

R1-R2,

отличающегося тем, что R1 есть остаток кислой L-аминокислоты или производное остатка кислой L-аминокислоты и R2 есть остаток L-аминокислоты или производное остатка L-аминокислоты, причем указанный остаток L-аминокислоты выбран из группы, состоящей из остатка L-аланина, L-аргинина, L-аспарагина, L-аспарагиновой кислоты, L-цистеина, L-глутаминовой кислоты, L-глутамина, глицина, L-гистидина, L-изолейцина, L-лейцина, L-лизина, L-метионина, L-фенилаланина, L-пролина, L-серина, L-треонина, L-триптофана, L-тирозина, L-валина и низшего алкильного эфира L-фенилаланина.

Цель настоящего изобретения - предоставление способа, как описано выше, отличающегося тем, что R1 есть остаток L-аспарагиновой кислоты или остаток L-глутаминовой кислоты и R2 есть остаток L-глутаминовой кислоты, L-изолейцина, L-фенилаланина, L-триптофана, L-валина или низшего алкильного эфира L-фенилаланина.

Цель настоящего изобретения - предоставление способа, как описано выше, отличающегося тем, что R1 есть остаток L-аспарагиновой кислоты или остаток L-глутаминовой кислоты и R2 есть остаток L-глутаминовой кислоты, L-изолейцина, L-фенилаланина, L-триптофана, L-валина или низшего алкильного эфира L-фенилаланина.

Цель настоящего изобретения - предоставления способа, как описано выше, отличающегося тем, что низший алкильный эфир L-фенилаланина есть метиловый, этиловый или пропиловый эфир L-фенилаланина.

Описание настоящего изобретения приведено ниже.

Краткое описание фигур

Фигура 1 показывает схему реакции лигирования, катализируемой L-аминокислота-α-лигазами (Lals). RA и RB группы боковой цепи, которые могут быть одного или разных типов. АТФ означает аденозин-5′-трифосфат, АДФ означает аденозин-5′-дифосфат и Pi означает неорганический фосфат, фосфорную кислоту или ее соль.

Фигура 2 показывает активность BBR47_51900 в лигировании одинаковых канонических L-аминокислот.

Фигура 3 показывает активность BBR47_51900 в лигировании двух различных канонических L-аминокислот, где одна L-аминокислота есть L-Glu. Cnt: контроль (L-Glu).

Фигура 4 показывает активность BBR47_51900 в лигировании двух различных канонических L-аминокислот, где одна L-аминокислота есть L-Asp. Cnt: контроль (L-Asp).

Фигура 5 показывает активность Staur_4851 в лигировании двух различных канонических L-аминокислот, где одна L-аминокислота есть L-Asp.

Фигура 6 показывает активность Staur_4851 в лигировании L-Asp и L-Phe, определенную методом ТСХ. 1 - (Трис-HCl рН 9.0 50 мМ, MgCl2 10 мМ, L-Asp 10 мМ, L-Phe 10 мМ, АТФ 10 мМ, Staur_4851 2 мкг); 2 - (Трис-HCl рН 8.0 50 мМ, MgCl2 10 мМ, L-Asp 10 мМ, L-Phe 10 мМ, АТФ 10 мМ, Staur_4851 2 мкг); 3 - (Трис-HCl рН 8.0 50 мМ, MgCl2 10 мМ, L-Asp 20 мМ, L-Phe 0 мМ, АТР 10 мМ, Staur_4851 2 мкг); 4 - (Трис-HCl рН 8.0 50 мМ, MgCl2 10 мМ, L-Asp 0 мМ, L-Phe 20 мМ, АТФ 10 мМ, Staur_4851 2 мкг); 5 - (Трис-HCl рН 8.0 50 мМ, MgCl2 10 мМ, L-Asp 10 мМ, L-Phe 10 мМ, АТФ 0 мМ, Staur_4851 2 мкг); 6 - (Трис-HCl рН 8.0 50 мМ, MgCl2 10 мМ, L-Asp 10 мМ, L-Phe 10 мМ, АТФ 10 мМ, Staur_4851 0 мкг).

Фигура 7 показывает активность BBR47_51900 в лигировании L-Asp и L-Phe, определенную методом LC-QTOF/MS/MS. SP: образец; ST: стандарт (αAsp-Phe и βAsp-Phe).

Фигура 8 показывает активность BBR47_51900 в лигировании L-Asp и L-Val, определенную методом LC-QTOF/MS/MS. SP: образец; ST: стандарт (αAsp-Val).

Фигура 9 показывает активность BBR47_51900 в лигировании L-Glu и L-Val, определенную методом LC-QTOF/MS/MS. SP: образец; ST: стандарт (αGlu-Val и γGlu-Val).

Фигура 10 показывает выравнивание BBR47_51900 и Staur_4851 (ClustalW, в формате PIR).

Фигура 11 показывает данные, полученные с помощью программы HMMsearch на основе выравнивания BBR47_51900 и Staur_4851 (представлены первые 49 хитов).

Фигура 12 показывает диаграмму распределения значений |Log10(E-value)|, полученных с помощью программы HMMsearch с использованием выравнивания BBR47_51900 и Staur_4851 (см. Фигуру 10). Следующие хиты отмечены сплошными стрелками: 1 - BBR47_51900, 2 - Staur_4851, 3 - DES, 4 - ВСЕ, 5 - BMY, 13 - BTH, 17 - BUR, 47 - AME, 49 - SFL.

Фигура 13 показывает выравнивание BBR47_51900, Staur_4851, DES и ВСЕ (ClustalW, в формате PIR).

Фигура 14 показывает выходные данные, полученные с помощью программы HMMsearch на основе выравнивания BBR47_51900, Staur_4851, DES и ВСЕ (представлены первые 65 хитов).

Фигура 15 показывает диаграмму распределения значений |Log10(E-value)|, полученных с помощью программы HMMsearch с использованием выравнивания BBR47_51900, Staur_4851, DES и ВСЕ (см. Фигуру 13). Следующие хиты отмечены сплошными стрелками: 1 - BBR47_51900, 2 - DES, 3 - ВСЕ, 4 - Staur_4851, 5 - BMY, 8 - BTH, 18 - BUR, 33 - AME, 62 - SFL.

Фигура 16-1 показывает выровненные BBR47_51900, Staur_4851 и DES в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ и BMY (ClustalW, в формате PIR).

Фигура 16-2 показывает выровненные ВСЕ и BMY в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ и BMY (ClustalW, в формате PIR).

Фигура 17 показывает выходные данные, полученные с помощью программы HMMsearch на основе выравнивания BBR47_51900, Staur_4851, DES, ВСЕ и BMY (представлены первые 65 хитов).

Фигура 18-1 показывает выровненные Staur_4851, BBR47_51900 и ВСЕ в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY и ВТН (ClustalW, в формате PIR).

Фигура 18-2 показывает выровненные DES, BMY и ВТН в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY и ВТН (ClustalW, в формате PIR).

Фигура 19 показывает данные, полученные с помощью программы HMMsearch на основе выравнивания BBR47_51900, Staur_4851, DES, ВСЕ, BMY и ВТН (представлены первые 73 хита).

Фигура 20-1 показывает выровненные Staur_4851 и BBR47_51900 в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, ВТН и BUR (ClustalW, в формате PIR).

Фигура 20-2 показывает выровненные ВСЕ и DES в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, ВТН и BUR (ClustalW, в формате PIR).

Фигура 20-3 показывает выровненные BMY и ВТН в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, ВТН и BUR (ClustalW, в формате PIR).

Фигура 20-4 показывает выровненный BUR в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, ВТН и BUR (ClustalW, в формате PIR).

Фигура 21 показывает данные, полученные с помощью программы HMMsearch на основе выравнивания BBR47_51900, Staur_4851, DES, ВСЕ, BMY, ВТН и BUR (представлены первые 104 хита).

Фигура 22-1 показывает выровненные Staur_4851 и BBR47_51900 в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, ВТН, BUR и АМЕ (ClustalW, в формате PIR).

Фигура 22-2 показывает выровненные ВСЕ и DES в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, ВТН, BUR и АМЕ (ClustalW, в формате PIR).

Фигура 22-3 показывает выровненные BMY и ВТН в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, ВТН, BUR и АМЕ (ClustalW, в формате PIR).

Фигура 22-4 показывает выровненные BUR и АМЕ в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, BTH, BUR и АМЕ (ClustalW, в формате PIR).

Фигура 23 показывает выходные данные, полученные с помощью программы HMMsearch на основе выравнивания BBR47_51900, Staur_4851, DES, ВСЕ, BMY, BTH, BUR и АМЕ (представлены первые 65 хитов).

Фигура 24-1 показывает выровненные Staur_4851 и BBR47_51900 в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, BTH, BUR, АМЕ и SFL (ClustalW, в формате PIR).

Фигура 24-2 показывает выровненные ВСЕ и DES в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, BTH, BUR, АМЕ и SFL (ClustalW, в формате PIR).

Фигура 24-3 показывает выровненные BMY и BTH в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, BTH, BUR, АМЕ и SFL (ClustalW, в формате PIR).

Фигура 24-4 показывает выровненные BUR и АМЕ в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, BTH, BUR, АМЕ и SFL (ClustalW, в формате PIR).

Фигура 24-5 показывает выровненный SFL в выравнивании BBR47_51900, Staur_4851, DES, ВСЕ, BMY, BTH, BUR, АМЕ и SFL (ClustalW, в формате PIR).

Фигура 25 показывает данные, полученные с помощью программы HMMsearch на основе выравнивания BBR47_51900, Staur_4851, DES, ВСЕ, BMY, BTH, BUR, АМЕ и SFL (представлены первые 38 хитов).

Фигура 26 показывает анализ изофункциональных Lals с использованием профиля HMMs (Модели с 1 по 7). *: E-value=0 (Фигуры 21, 23 и 25). BBR означает BBR47_51900 и STA означает Staur_4851.

Фигура 27 показывает ТСХ-анализ специфической аспартат-пептид-гидролизующей (DP3-гидролизующей) активности в штаммах Е.coli 4-5Δ. Для калибровки использовали раствор (1 мкл) 5-фтортриптофана (стандарт): (1) 3 мМ, (2) 2 мМ, (3) 1 мМ и (4) 0,5 мМ. Аликвоту (1 мкл) реакционной смеси, содержащей Mn2+ (5, 6) или Zn2+ (7, 8), помещали на пластинку ТСХ. 5FT - 5-фтортриптофан, DP3 - L-Asp-L-5-фтортриптофан дипептид, Asp - L-аспартат.

Фигура 28 показывает схему исследования токсичности DP3 ввиду специфической аспартат-пептид-гидролизующей активности в штаммах Е.coli 1-5Δ. Штамм Е.coli выращивают в присутствии дипептида DP3. В штамме, содержащем пептидазы (Е.coli P+), DP3 гидролизуется, что приводит к образованию L-аспартата и 5-фтортриптофана (5FT). 5FT является токсическим для клетки, что, таким образом, приводит к задержке роста. Дипептид DP3 является стабильным и не влияет на клеточный рост штамма, дефицитного по пептидазам, и штамма с низкой пептидазной активностью (Е.coli P-).

Описание последовательностей

SEQ ID NO:1 показывает ген BBR47_51900

SEQ ID NO:2 показывает белок BBR47_51900

SEQ ID NO:3 показывает ген Staur_4851

SEQ ID NO:4 показывает белок Staur_4851

SEQ ID NO:5 показывает ген DES

SEQ ID NO:6 показывает белок DES

SEQ ID NO:7 показывает ген BUR

SEQ ID NO:8 показывает белок BUR

SEQ ID NO:9 показывает ген ВСЕ

SEQ ID NO:10 показывает белок ВСЕ

SEQ ID NO:11 показывает ген ВТН

SEQ ID NO:12 показывает белок ВТН

SEQ ID NO:13 показывает ген АМЕ

SEQ ID NO:14 показывает белок АМЕ

SEQ ID NO:15 показывает ген SFL

SEQ ID NO:16 показывает белок SFL

SEQ ID NO:17 показывает ген BMY

SEQ ID NO:18 показывает белок BMY

SEQ ID NO:19 показывает фрагмент XbaI-EcoRI, содержащий BBR47_51900

SEQ ID NO:20 показывает фрагмент XbaI-EcoRI, содержащий Staur_4851

SEQ ID NO:21 показывает фрагмент XbaI-EcoRI, содержащий DES

SEQ ID NO:22 показывает фрагмент XbaI-EcoRI, содержащий BUR

SEQ ID NO:23 показывает фрагмент XbaI-EcoRI, содержащий ВСЕ

SEQ ID NO:24 показывает фрагмент XbaI-EcoRI, содержащий ВТН

SEQ ID NO:25 показывает фрагмент XbaI-EcoRI, содержащий АМЕ

SEQ ID NO:26 показывает фрагмент XbaI-EcoRI, содержащий SFL

SEQ ID NO:27 показывает фрагмент XbaI-EcoRI, содержащий BMY

SEQ ID NO:28 показывает праймер P1

SEQ ID NO:29 показывает праймер Р2

SEQ ID NO:30 показывает праймер Р3

SEQ ID NO:31 показывает праймер Р4

SEQ ID NO:32 показывает праймер Р5

SEQ ID NO:33 показывает праймер Р6

SEQ ID NO:34 показывает праймер Р7

SEQ ID NO:35 показывает праймер Р8

SEQ ID NO:36 показывает праймер Р9

SEQ ID NO:37 показывает праймер Р10

SEQ ID NO:38 показывает праймер Р11

SEQ ID NO:39 показывает праймер Р12

SEQ ID NO:40 показывает праймер Р13

SEQ ID NO:41 показывает праймер Р14

SEQ ID NO:42 показывает праймер Р15

SEQ ID NO:43 показывает праймер Р16

SEQ ID NO:44 показывает праймер Р17

SEQ ID NO:45 показывает праймер Р18

SEQ ID NO:46 показывает праймер Р19

SEQ ID NO:47 показывает праймер Р20

SEQ ID NO:48 показывает праймер Р21

SEQ ID NO:49 показывает праймер Р22

SEQ ID NO:50 показывает праймер Р23

SEQ ID NO:51 показывает праймер Р24

SEQ ID NO:52 показывает праймер Р25

SEQ ID NO:53 показывает праймер Р26

SEQ ID NO:54 показывает праймер Р27

SEQ ID NO:55 показывает праймер Р28

SEQ ID NO:56 показывает праймер Р29

SEQ ID NO:57 показывает праймер Р30

SEQ ID NO:58 показывает праймер Р31

SEQ ID NO:59 показывает праймер Р32

SEQ ID NO:60 показывает праймер Р33

SEQ ID NO:61 показывает праймер Р34

SEQ ID NO:62 показывает праймер Р35

SEQ ID NO:63 показывает праймер Р36

SEQ ID NO:64 показывает праймер Р37

SEQ ID NO:65 показывает праймер Р38

SEQ ID NO:66 показывает праймер Р39

SEQ ID NO:67 показывает праймер Р40

SEQ ID NO:68 показывает оптимизированный ген, кодирующий BBR47_51900 из Brevibacillus brevis NBRC 100599

SEQ ID NO:69 показывает оптимизированный ген, кодирующий Staur_4851 из Stigmatella aurantiaca

Наилучший способ осуществления изобретения

1. Фермент

Термин «фермент» может означать L-аминокислота-α-лигазу (Lal), обладающую способностью присоединять аминокислоты высокоэнергетическим молекулярно-зависимым (макроэргическим) способом с образованием пептидной связи между аминокислотными остатками.

Ферментом, согласно настоящему изобретению, может быть L-аминокислота-α-лигаза, выбранная из группы, состоящей из BBR47_51900 (гипотетический белок), Staur_4851 (аргининсукцинатлиаза 2-подобный белок), DES (пиридоксальфосфат-зависимый фермент), BUR (предполагаемая лиаза), ВСЕ (аргининосукцинатлиаза доменный белок), ВТН (гипотетический белок YBT020_25570), AME (консервативный гипотетический белок), SFL (белок с неизвестной функцией DUF201) и BMY (аргининосукцинатлиаза доменный белок), которая не ограничивается вышеупомянутыми белками.

Нуклеотидная последовательность гена (NCBI перечень последовательности: YP_002774671.1; нуклеотиды, комплементарные нуклеотидам в положении: с 5464162 по 5465418; идентификатор гена: 7721040).

Нуклеотидная последовательность гена (NCBI перечень последовательности: YP_002774671.1; нуклеотиды, комплементарные нуклеотидам в положении с 5464162 по 5465418; идентификатор гена: 7721040) из Brevibacillus brevis NBRC 100599 (NCBI идентификатор таксона: 358681) и аминокислотная последовательность BBR47_51900, кодируемая геном, показаны в SEQ ID NO:1 и SEQ ID NO:2, соответственно.

Нуклеотидная последовательность гена (NCBI перечень последовательности: AD072629.1; нуклеотиды, комплементарные нуклеотидам в положении: с 5973963 по 5975216; идентификатор гена: 9878344) из Stigmatella aurantiaca DW4/3-1 (NCBI идентификатор таксона: 378806) и аминокислотная последовательность Staur_4851, кодируемая геном, представлены в SEQ ID NO:3 и SEQ ID NO:4, соответственно.

Нуклеотидная последовательность гена (инвентарный номер в GenBank EGK06810.1, GI: 332967701) из Desmospora sp. 8437 (NCBI идентификатор таксона: 997346) и аминокислотная последовательность DES, кодируемая этим геном, представлены в SEQ ID NO:5 и SEQ ID NO:6, соответственно.

Нуклеотидная последовательность гена (инвентарный номер в GenBank EBA51208.1, GI: 134251129) из Burkholderia pseudomallei 305 (NCBI идентификатор таксона: 425067) и аминокислотная последовательность BUR, кодируемая этим геном, представлены в SEQ ID NO:7 и SEQ ID NO:8, соответственно.

Нуклеотидная последовательность гена (инвентарный номер в GenBank EEK72190.1, GI: 228615090) из Bacillus cereus AH621 (NCBI идентификатор таксона: 526972) и аминокислотная последовательность ВСЕ, кодируемая этим геном, представлены в SEQ ID NO:9 и SEQ ID NO:10, соответственно.

Нуклеотидная последовательность гена (инвентарный номер в GenBank ADY24341.1, GI: 324329081) из Bacillus thuringiensis subsp. finitimus (штамм YBT-020) (NCBI идентификатор таксона: 930170) и аминокислотная последовательность ВТН, кодируемая этим геном, представлены в SEQ ID NO:11 and SEQ ID NO:12, соответственно.

Нуклеотидная последовательность гена (инвентарный номер в GenBank ABR48216.1, GI: 149949688) из Alkaliphilus metalliredigens QYMF (NCBI идентификатор таксона: 293826) и аминокислотная последовательность АМЕ, кодируемая этим геном, представлены в SEQ ID NO:13 и SEQ ID NO:14, соответственно.

Нуклеотидная последовательность гена (инвентарный номер в GenBank ADWO 1942.1, GI: 320007092) из Streptomyces flavogriseus ATCC 33331 (NCBI идентификатор таксона: 591167) и аминокислотная последовательность SFL, кодируемая этим геном, представлены в SEQ ID NO:15 и SEQ ID NO:16, соответственно.

Нуклеотидная последовательность гена (NCBI перечень последовательности ZP_04160564.1, GI: 229002475) из Bacillus mycoides Rock3-17 (NCBI идентификатор таксона: 526999) и аминокислотная последовательность BMY, кодируемая этим геном, представлены в SEQ ID NO:17 and SEQ ID NO:18, соответственно.

Ввиду того что могут быть некоторые различия в последовательностях ДНК между родами или видами и штаммами указанных родов, гены, кодирующие BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY, не ограничены генами, представленными в SEQ ID NOs:1, 3, 5, 7, 9, 11, 13, 15 или 17, но могут включать гены, которые являются вариантами нуклеотидных последовательностей или гомологичны нуклеотидным последовательностям SEQ ID NOs:1, 3, 5, 7, 9, 11, 13, 15 или 17, кодирующие варианты белков BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY. Кроме того, гены, кодирующие BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY, могут быть вариантами нуклеотидных последовательностей.

Термин «вариант нуклеотидной последовательности» может означать нуклеотидную последовательность, которая кодирует «вариант белка».

Термин «вариант нуклеотидной последовательности» может означать нуклеотидную последовательность, которая кодирует «вариант белка» с использованием любых синонимичных аминокислотных кодонов в соответствии с таблицей стандартного генетического кода (см., например, Lewin В., Genes VIII, 2004, Pearson Education, Inc., Upper Saddle River, NJ 07458).

Термин «вариант нуклеотидной последовательности» также может означать нуклеотидную последовательность, которая гибридизуется в жестких условиях с нуклеотидной последовательностью, комплементарной последовательности, представленной в SEQ ID NOs:1, 3, 5, 7, 9, 11, 13, 15 или 17, или с зондом, который может быть синтезирован на основе указанных нуклеотидных последовательностей, при условии, что он кодирует функциональную L-аминокислота-α-лигазу. Под «жесткими условиями» понимаются такие условия, при которых образуется специфический гибрид, например гибрид, имеющий идентичность не менее чем 80%, не менее чем 90%, не менее чем 95%, не менее чем 96%, не менее чем 97%, не менее чем 98% или не менее чем 99%, и не образуется неспецифический гибрид, например гибрид, имеющий гомологию меньшую, чем указано выше. Практическим примером жестких условий может быть однократная или многократная отмывка, или, в другом случае, двух- или трехкратная отмывка при концентрации солей 1×SSC (стандарт цитрата натрия или стандарт хлорида натрия) и 0,1% SDS (додецилсульфат натрия) или, в другом случае, 0, 1×SSC и 0,1% SDS при 60°С или 65°С. Продолжительность отмывки зависит от типа используемой для блоттинга мембраны и, как правило, такова, как рекомендовано производителем. Например, рекомендуемая продолжительность отмывки для положительно заряженной нейлоновой мембраны Hybond™-N+ (GE Healthcare) при жестких условиях составляет 15 минут. Промывка может быть произведена двух- или трехкратно. В качестве зонда может быть использована часть последовательности, комплементарной последовательности, приведенной в SEQ ID NO:3, 5, 7, 9, 11, 13, 15 или 17. Подобный зонд может быть получен с помощью метода ПЦР (полимеразная цепная реакция. White T.J. et al., Trends Genet., 1989, 5:185-189) с использованием олигонуклеотидных праймеров, приготовленных на основе последовательностей, приведенных в SEQ ID NO:1, 3, 5, 7, 9, 11, 13, 15 или 17 и фрагмента ДНК, содержащего нуклеотидную последовательность в качестве матрицы. Рекомендуемая длина зонда должна быть >50 п.н., она может быть подобрана в зависимости от условий гибридизации и составляет обычно от 100 до 1000 п.н. Например, при использовании в качестве зонда фрагмента ДНК длиной около 300 п.н. условия отмывки могут быть следующие: 2×SSC, 0.1% SDS при 50°С, или при 60°С, или при 65°С. С другой стороны, жесткими условиями может быть гибридизация в 6×SCC при 45°C с последующими одно-, двух или многократными отмывками в 0,2×SCC и 0,1% SDS при температуре от 50 до 65°С.

Гены, кодирующие белки BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY, известны (см. описание выше), поэтому гены, кодирующие варианты белков BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY, могут быть получены с использованием метода ПЦР с использованием праймеров, синтезированных на основе нуклеотидной последовательности генов, кодирующих BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY. Гены, кодирующие белки BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY или их варианты белков из других микроорганизмов, могут быть получены аналогичным способом.

Термин «вариант белка» может означать белок, который содержит одно или несколько изменений в последовательности при сравнении с SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18, являются ли они заменами, делениями, вставками и/или добавлениями аминокислотных остатков при условии, что активность, соответствующая активности белков BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY, соответственно, сохранена, или третичная структура белков BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY изменена несущественно по сравнению с белком дикого типа или немодифицированным белком. Количество изменений в вариантах белков зависит от положения или вида аминокислотных остатков в третичной структуре белка. Оно может быть, но строго не ограничено, с 1 по 45, или с 1 по 30, или с 1 по 15, или с 1 по 10, или с 1 по 5 в SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18.

Примерами замены, делеции, вставки и/или добавления одного или нескольких аминокислотных остатков могут быть консервативная мутация(и), такая, что активность и характеристики варианта белка сохраняются и подобны белкам BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY. Примером консервативной мутации является консервативная замена. Консервативными заменами могут быть взаимные замены между Phe, Trp и Tyr, если сайт замещения является ароматической аминокислотой; между Ala, Leu, Ile и Val, если сайт замещения является гидрофобной аминокислотой; между Glu, Asp, Gln, Asn, Ser, His и Thr, если сайт замещения является гидрофильной аминокислотой; между Gln и Asn, если сайт замещения является полярной аминокислотой; между Lys, Arg и His, если сайт замещения является основной аминокислотой; между Asp и Glu, если сайт замещения является кислой аминокислотой; и между Ser и Thr, если сайт замещения является аминокислотой, имеющей гидроксильную группу. Примеры консервативных замен включают замену Ser или Thr на Ala, замену Asn, Glu или Gln на Asp, замену Ser или Ala на Cys, замену Asn, Glu, Lys, His, Asp или Arg на Gln, замену Asn, Gln, Lys или Asp на Glu, замену Pro на Gly, замену Asn, Lys, Gln, Arg или Tyr на His, замену Leu, Met, Val или Phe на Ile, замену Ile, Met, Val или Phe на Leu, замену Asn, Glu, Gln, His или Arg на Lys, замену Ile, Leu, Val или Phe на Met, замену Trp, Tyr, Met, Ile или Leu на Phe, замену Thr или Ala на Ser, замену Ser или Ala на Thr, замену Phe или Tyr на Trp, замену His, Phe или Trp на Tyr и замену Met, Ile или Leu на Val. Эти изменения в варианте белка могут происходить в участках белка, не являющимися критичными для функции белка. Это объясняется тем, что некоторые аминокислоты, имеют высокую гомологию друг к другу, такую, что третичная структура или активность белка не подвержены влиянию ввиду таких изменений. Таким образом, варианты белка, кодируемые генами, представленными в SEQ ID NOs:1, 3, 5, 7, 9, 11, 13, 15 или 17, могут иметь подобие или идентичность не менее чем 40%, не менее чем 50%, не менее чем 60%, не менее чем 70%, не менее чем 80%, не менее чем 90%, не менее чем 95%, не менее чем 96%, не менее чем 97%, не менее чем 98%, или не менее чем 99% по отношению к аминокислотным последовательностям, представленным в SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18, до тех пор, пока функциональность белков BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY, соответственно, остается неизменной. Также, варианты белка, кодируемые генами, представленными в SEQ ID NOs:1, 3, 5, 7, 9, 11, 13, 15 или 17, могут иметь гомологию, которая может быть определена через значение |Log10(E-value)|, рассчитанное с помощью программы HMMsearch, когда скрытый профиль модели Маркова (the profile hidden Markov model, profile HMM; профиль НММ) построен с помощью вышеупомянутой программы (Finn R.D. et al., HMMER web server: interactive sequence similarity searching, Nucleic Acids Res., 2011, 39 (Web Server issue):W29-37), как описано ниже в Примере 6, не менее чем 128, не менее чем 142, не менее чем 162, не менее чем 175, не менее чем 182, не менее чем 196, или не менее чем 233 по отношению к полным аминокислотным последовательностям, приведенным в SEQ ID NOs:2, 4, 6, 8, 10, 12, 14, 16 и 18, до тех пор, пока функциональность белков BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY, соответственно, остается неизменной.

Примеры замен, делеций, вставок и/или добавлений одного или нескольких аминокислотных остатков также могут включать неконсервативную(ые) мутацию(и) при условии, что эта(эти) мутация(и) компенсирована(ы) одной или несколькими вторичными мутациями в одном или нескольких положениях аминокислотной последовательности так, что активность и характеристики варианта белка остаются неизменными и подобны белкам BBR47_51900, Staur_4851, DES, BUR, ВСЕ, ВТН, АМЕ, SFL и BMY.

Степень гомологии белка или ДНК, может быть определена с использованием нескольких известных подходов, например, компьютерных алгоритмов BLAST и FASTA и метода ClustalW. Алгоритм BLAST (Basic Local Alignment Search Tool, www.ncbi.nlm.nih.gov/BLAST/), позволяющий проводить иерархический поиск, заложен в программах blastp, blastn, blastx, megablast, tblastn и tblastx; эти программы присваювают уровень значимости найденным объектам, используя статистические методы, описанные в Samuel K. and Altschul S.F. («Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes» Proc. Natl. Acad. Sci. USA, 1990, 87:2264-2268; «Applications and statistics for multiple high-scoring segments in molecular sequences». Proc. Natl. Acad. Sci. USA, 1993, 90:5873-5877). Алгоритм BLAST вычисляет три параметра: число аминокислотных остатков, идентичность и сходство. Поисковый алгоритм FASTA описан в Pearson W.R. («Rapid and sensitive sequence comparison with FASTP and FASTA», Methods Enzymol., 1990, 183:63-98). Метод ClustalW описан в Thompson J.D. et al. («CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice». Nucleic Acids Res., 1994, 22:4673-4680).

Термин «активность L-аминокис