Варианты семейства, состоящего из 44 ксилоглюканаз
Иллюстрации
Показать всеИзобретение относится к биохимии. Описаны варианты ксилоглюканазы, имеющие ряд замен, а также полинуклеотиды, кодирующие указанные варианты ксилоглюканазы. Представлена клетка-хозяин, содержащая указанный полинуклеотид. Описаны способы получения указанных вариантов ксилоглюконаз. Изобретение расширяет арсенал ксилоглюконаз. 6 н. и 5 з.п. ф-лы, 51 табл., 4 пр., 1 ил.
Реферат
Ссылка на список последовательностей
Настоящая заявка содержит список последовательностей в машиночитаемой форме. Машиночитаемая форма этого списка включена в настоящее описание посредством ссылки.
Область, к которой относится изобретения
Настоящее изобретение относится к вариантам ксилоглюканазы, принадлежащей к семейству, состоящему из 44 гликозилгидролаз, а также к полинуклеотидам, кодирующим эти варианты, и к способам получения этих вариантов.
Предшествующий уровень техники
Ксилоглюкан представляет собой основной структурный полисахарид, присутствующий в стенке первичных (растущих) клеток растений. По своей структуре ксилоглюканы состоят из целлюлозоподобного бета-1,4-связанного глюкозного остова, который, в большинстве случаев, бывает замещен различными боковыми цепями. Очевидно, что ксилоглюкан функционирует в стенке первичных клеток растений посредством перекрестно связывающихся микроволокон целлюлозы, образуя целлюлозо-ксилоглюкановую сетчатую структуру.
Ксилоглюканазы обладают способностью катализировать солюбилизацию ксилоглюкана с образованием ксилоглюкановых олигосахаридов. Некоторые ксилоглюканазы обладают только ксилоглюканазной активностью, а другие ксилоглюканазы обладают ксилоглюканазной и целлюлазной активностью. Ксилоглюканазам могут быть присвоены классификационные номера EC 3.2.1.4 или EC. 3.2.1.151. Ферменты с ксилоглюканазной активностью описаны, например, в работе Vincken et al. (1997) Carbohydrate Research 298(4):299-310, в которой охарактеризованы три различных эндоглюканазы Endol, EndoV и EndoVI Trichoderma viride (а также T. reesei). Эндоглюканазы Endol, EndoV и EndoVI принадлежат к семейству, состоящему из 5, 7 и 12 гликозилгидролаз соответственно, см. Henrissat B. (1991) Biochem. J. 280: 309-316, и Henrissat B. and Bairoch A. (1993) Biochem. J. 293: 781-788. В заявке WO 94/14953 описано семейство из 12 ксилоглюканаз (EG II), клонированных из грибов Aspergillus aculeatus. В заявке WO 99/02663 описано семейство, состоящее из 12 ксилоглюканаз, и семейство, состоящее из 5 ксилоглюканаз, клонированных из Bacillus licheniformis и Bacillus agaradhaerens соответственно. В заявке WO 01/062903 описано семейство из 44 ксилоглюканаз.
В частности, в заявках WO 99/02663 и WO 01/062903 высказывается предположение, что ксилоглюканазы могут быть использованы в детергентах.
Целью настоящего изобретения является получение вариантов ксилоглюканаз, принадлежащих к семейству из 44 гликозилгидролаз, которые, по сравнению с родительским ферментом, обладают улучшенными свойствами.
Описание сущности изобретения
Настоящее изобретение относится к выделенным вариантам родительской ксилоглюканазы, включающим модификации в одном или нескольких положениях, выбранных из группы, состоящей из положений 68, 123, 156, 118, 200, 129, 137, 193, 92, 83, 149, 34, 340, 332, 9, 76, 331, 310, 324, 498, 395, 366, 1, 374, 7, 140, 8, 14, 21, 211, 37, 45, 13, 78, 87, 436, 101, 104, 111, 306, 117, 119, 414, 139, 268, 142, 159, 164, 102, 168, 176, 180, 482, 183, 202, 206, 217, 4, 222, 19, 224, 228, 232, 2, 240, 244, 5, 247, 249, 328, 252, 259, 406, 267, 269, 275, 179, 166, 278, 281, 288, 298, 301, 18, 302, 165, 80, 303, 316, 169, 322, 120, 146, 342, 348, 147, 353, 380, 468, 382, 383, 38, 384, 389, 391, 10, 392, 396, 177, 397, 399, 409, 237, 413, 253, 415, 418, 40, 443, 445, 148, 449, 225, 450, 454, 3, 455, 456, 299, 461, 470, 204, 476, 488, 347 и 507, которые соответствуют положениям в аминокислотной последовательности SEQ ID NO:3, где указанная(ые) модификация(ии) независимо представляет(ют) собой
i) инсерцию аминокислоты, расположенной ниже аминокислоты, которая занимает указанное положение,
ii) делецию аминокислоты, которая занимает указанное положение, или
iii) замену аминокислоты, которая занимает указанное положение, другой аминокислотой; и
где родительская ксилоглюканаза принадлежит к семейству из 44 ксилоглюканаз, а указанный вариант обладает ксилоглюканазной активностью.
Настоящее изобретение также относится к выделенным полинуклеотидам, кодирующим варианты ксилоглюканаз или полипептидов, обладающих ксилоглюканазной активностью; к конструкциям нуклеиновых кислот; к векторам и к клеткам-хозяевам, содержащим указанные полинуклеотиды; а также к способам получения варианта родительской ксилоглюканазы или полипептида, обладающего ксилоглюканазной активностью.
Подробное описание изобретения
Настоящее изобретение относится к вариантам родительского фермента, принадлежащего к семейству из 44 ксилоглюканаз и содержащего модификацию, предпочтительно, в виде замены, и/или инсерции, и/или делеции в одном или нескольких положениях, где нумерация положения соответствует нумерации положений в SEQ ID NO: 3. Варианты согласно изобретению обладают ксилоглюканазной активностью и могут также обладать целлюлолитической активностью. Варианты согласно изобретению, в отличие от родительской ксилоглюканазы, обладают улучшенными свойствами. В одном из аспектов изобретения, указанные варианты обладают повышенной стабильностью в жидких детергентах, а, в частности в жидких моющих композициях для стирки.
Определения
Ксилоглюканазная активность: Термин «ксилоглюканазная активность» определяется в настоящем документе как фермент, катализирующий гидролиз ксилоглюкана. Эта реакция включает эндогидролиз 1,4-бета-D-глюкозидных связей в ксилоглюкане. В соответствии с настоящим изобретением, ксилоглюканазную активность определяют с использованием AZCL-ксилоглюкана (от Megazyme), который служит в качестве субстрата в ферментативной реакции. Такой анализ может быть проведен несколькими способами, например, как описано в примере 2 настоящей заявки или как описано в заявке WO 01/62903. Одна единица ксилоглюканазной активности (XyloU) определена с помощью аналитического метода, описанного в заявке WO 01/62903, на странице 60, строки 3-17.
Целлюлазная активность: Термин «целлюлазная активность» определяется в настоящем документе как фермент, катализирующий гидролиз 1,4-бета-D-глюкозидных связей в бета-1,4-глюкане (целлюлозе). В соответствии с настоящим изобретением, целлюлазную активность определяют с использованием AZCL-НЕ-целлюлозы (от Megazyme), которая служит в качестве субстрата в ферментативной реакции.
Вариант: Термин «вариант» определен в настоящем документе как полипептид, обладающий ксилоглюканазной активностью и включающий модификацию, такую как замена, инсерция и/или делеция одного или нескольких аминокислотных остатков в одном или нескольких конкретных положениях, соответствующих положениям аминокислот в SEQ ID NO: 3. Варианты согласно изобретению могут также обладать целлюлазной активностью. Модифицированный полипептид (вариант) получают вмешательством человека путем модификации полинуклеотидной последовательности, кодирующей родительский фермент. Родительский фермент может кодироваться последовательностями SEQ ID NO: 1, SEQ ID NO: 4 или SEQ ID NO: 6, или последовательностью, которая по меньшей мере на 65%, более предпочтительно, по меньшей мере на 70%, еще более предпочтительно, по меньшей мере на 75%, еще более предпочтительно, по меньшей мере на 80%, еще более предпочтительно, по меньшей мере на 85%, еще более предпочтительно, по меньшей мере на 90%, а наиболее предпочтительно, по меньшей мере на 95% идентична одной из этих последовательностей, и которая кодирует активный полипептид. Последовательностью полипептидного варианта, предпочтительно, является последовательность, которая не была обнаружена в природе.
Фермент дикого типа: Термин ксилоглюканаза «дикого типа» означает ксилоглюканазу, экспрессируемую природным микроорганизмом, таким как бактерии, дрожжи или нитчатые грибы, встречающиеся в природе. Термин «дикого типа» может употребляться как синоним термина «природный».
Родительский фермент: Используемый здесь термин ксилоглюканаза-«родитель» или «родительская» ксилоглюканаза означает ксилоглюканазу, в которую были внесены модификации, например, замена(ы), инсерция(и), делеция(и) и/или усечение(я), с получением вариантов фермента согласно изобретению. Этот термин также означает полипептид, с которым сравнивают данный вариант, и сопоставляют этот вариант путем выравнивания. Указанным родителем может быть природный (дикого типа) полипептид, такой как фермент SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 5, или SEQ ID NO: 7, или полипептид, имеющий последовательность, которая по меньшей мере на 65%, более предпочтительно, по меньшей мере на 70%, еще более предпочтительно, по меньшей мере на 75%, еще более предпочтительно, по меньшей мере на 80%, еще более предпочтительно, по меньшей мере на 85%, еще более предпочтительно, по меньшей мере на 90%, а наиболее предпочтительно, по меньшей мере на 95% идентична одной из этих последовательностей. Родительским полипептидом может быть также вариант природного полипептида, аминокислотная последовательность которого была модифицирована или изменена. Родительским полипептидом может быть также аллельный вариант, который представляет собой полипептид, кодируемый любой из двух или более альтернативных форм гена, занимающего тот же самый локус в хромосоме.
Выделенный вариант или полипептид: Используемый здесь термин «выделенный вариант» или «выделенный полипептид» означает вариант или полипептид, который выделен из источника, например, из клетки-хозяина, в которой он экспрессируется, или из ферментного комплекса, который обычно присутствует в данной клетке. Предпочтительно, полипептид имеет чистоту, составляющую по меньшей мере 40%, более предпочтительно, по меньшей мере 60%, еще более предпочтительно, по меньшей мере 80%, наиболее предпочтительно, по меньшей мере 90%, а еще более предпочтительно, по меньшей мере 95%, как было определено с помощью электрофореза в ДСН-ПААГ.
По существу, чистый вариант или полипептид: Используемый здесь термин «по существу, чистый вариант или по существу, чистый полипептид» означает полипептидный препарат, содержащий максимум 10 мас.%, предпочтительно, максимум 8 мас.%, более предпочтительно, максимум 6 мас.%, еще более предпочтительно, максимум 5 мас.%, еще более предпочтительно, максимум 4 мас.%, еще более предпочтительно, максимум 3 мас.%, еще более предпочтительно, максимум 2 мас.%, еще более предпочтительно, максимум 1 мас.%, а наиболее предпочтительно, максимум 0,5 мас.% другого полипептидного материала, с которым он ассоциируется в природе или в рекомбинантном препарате. Поэтому, по существу, чистый вариант или полипептид имеет чистоту, предпочтительно, составляющую по меньшей мере 92%, более предпочтительно, по меньшей мере 94%, еще более предпочтительно, по меньшей мере 95%, еще более предпочтительно, по меньшей мере 96%, еще более предпочтительно, по меньшей мере 97%, еще более предпочтительно, по меньшей мере 98%, еще более предпочтительно, по меньшей мере 99%, еще более предпочтительно, по меньшей мере 99,5%, а наиболее предпочтительно, 100% по массе всего полипептидного материала, присутствующего в данном препарате. Варианты и полипептиды согласно изобретению, предпочтительно, присутствуют, по существу, в чистой форме. Это может быть достигнуто, например, путем получения указанного варианта или полипептида хорошо известными рекомбинантными методами или классическими методами очистки.
Зрелый полипептид: Термин «зрелый полипептид» определен здесь как полипептид, обладающий ксилоглюканазной активностью, конечная форма которого образуется после трансляции и любых посттрансляционных модификаций, таких как N-концевой процессинг, C-концевое усечение, гликозилирование, фосфорилирование и т.п. Для полипептида, определенного в SEQ ID NO: 2, зрелая ксилоглюканазная последовательность теоретически может начинаться в положении 28 последовательности SEQ ID NO: 2. Зрелая последовательность заканчивается в положении 551 SEQ ID NO: 2. Теоретическая зрелая последовательность ксилоглюканазы представлена в SEQ ID NO: 3. В зависимости от экспрессионной системы, фактическая длина зрелого полипептида может варьироваться от 1 до 10 аминокислот теоретической последовательности зрелого полипептида. Зрелый полипептид, например, может начинаться в положении 33 последовательности SEQ ID NO: 2 и заканчиваться в положении 551 последовательности SEQ ID NO: 2. Последовательность, кодирующая зрелый полипептид: Термин «последовательность, кодирующая зрелый полипептид» определен здесь как нуклеотидная последовательность, кодирующая зрелый полипептид, обладающий ксилоглюканазной активностью. В одном из аспектов изобретения, последовательностью, кодирующей зрелый полипептид, является последовательность, состоящая из нуклеотидов 82-1653 SEQ ID NO: 1. Последовательность, кодирующая зрелый полипептид, может иметь длину, варьирующуюся от 3 до 30 нуклеотидов, в зависимости от экспрессионной системы. Последовательность, кодирующая зрелый полипептид, может, например, соответствовать нуклеотидам 97-1653 SEQ ID NO: 1.
Идентичность: Сходство между двумя аминокислотными последовательностями или между двумя нуклеотидными последовательностями определяется параметром «идентичность».
В соответствии с настоящим изобретением, степень идентичности двух аминокислотных последовательностей определяют с использованием алгоритма Нидлмана-Вюнша (Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453), включенного в программу Needle, входящую в пакет программ EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends in Genetics 16: 276-277; http://emboss.org), предпочтительно, версии 3.0.0 или более поздней. Необязательными используемыми параметрами являются штраф на пробел-пропуск 10, штраф на пробел-удлинение 0,5 и матрица замен EBLOSUM62 (EMBOSS версии BLOSUM62). Выходные данные программы Needle, обозначенные как «идентичность самых длинных последовательностей» (получаемые с использованием опции - nobrief), выражены как процент идентичности и вычисляются следующим образом:
(Идентичные остатки × 100)/(Длина выравниваемых последовательностей - Общее число пробелов, используемых при выравнивании).
В соответствии с настоящим изобретением, степень идентичности между двумя дезоксирибонуклеотидными последовательностями определяют с использованием алгоритма Нидлмана-Вюнша (Needleman and Wunsch, 1970, см. выше), включенного в программу Needle, входящую в пакет программ EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, см. выше; http://emboss.org), предпочтительно, версии 3.0.0 или более поздней. Необязательными используемыми параметрами являются штраф на пробел-пропуск 10, штраф на пробел-удлинение 0,5 и матрица замен EDNAFULL (EMBOSS версии NCBI NUC4.4). Выходные данные программы Needle, обозначенные как «идентичность самых длинных последовательностей» (получаемые с использованием опции - nobrief), выражены как процент идентичности и вычисляются следующим образом:
(Идентичные дезоксирибонуклеотиды × 100)/(Длина выравниваемых последовательностей - Общее число пробелов, используемых при выравнивании).
Функциональный фрагмент: Термин «функциональный фрагмент полипептида» используется для описания полипептида, который происходит от более длинного полипептида, например зрелого полипептида, и имеет усечение либо в N-концевой области, либо в С-концевой области, либо в обеих областях, в результате чего образуется фрагмент родительского полипептида. Для того чтобы полипептид был функциональным, необходимо, чтобы его фрагмент сохранял по меньшей мере 20%, предпочтительно, по меньшей мере 40%, более предпочтительно, по меньшей мере 50%, еще более предпочтительно, по меньшей мере 60%, еще более предпочтительно, по меньшей мере 70%, еще более предпочтительно, по меньшей мере 80%, еще более предпочтительно, по меньшей мере 90%, еще более предпочтительно, по меньшей мере 95%, а наиболее предпочтительно, по меньшей мере 100% ксилоглюканазной активности полноразмерного/зрелого полипептида.
Аллельный вариант: Используемый здесь термин «аллельный вариант» означает любые две или более альтернативных форм гена, занимающих тот же самый локус в хромосоме. Аллельные варианты обычно возникают в результате мутации и могут приводить к полиморфизму внутри популяций. Генные мутации могут быть молчащими (не изменяют кодируемый полипептид) или могут кодировать полипептиды, имеющие модифицированные аминокислотные последовательности. Аллельным вариантом полипептида является полипептид, кодируемый аллельным вариантом гена.
Выделенный полинуклеотид: Используемый здесь термин «выделенный полинуклеотид» означает полинуклеотид, выделенный из источника. В одном из аспектов изобретения, выделенный полинуклеотид имеет чистоту, составляющую по меньшей мере 40%, более предпочтительно, по меньшей мере 60%, еще более предпочтительно, по меньшей мере 80%, наиболее предпочтительно, по меньшей мере 90%, а еще более предпочтительно, по меньшей мере 95%, как было определено с помощью электрофореза в агарозном геле.
По существу, чистый полинуклеотид: Используемый здесь термин «по существу, чистый полинуклеотид» означает полинуклеотидный препарат, не содержащий других чужеродных или нежелательных нуклеотидов и имеющий форму, подходящую для его использования в генетически сконструированных системах продуцирования полипептидов. Таким образом, по существу, чистый полинуклеотид содержит максимум 10 мас.%, предпочтительно, максимум 8 мас.%, более предпочтительно, максимум 6 мас.%, еще более предпочтительно, максимум 5 мас.%, еще более предпочтительно, максимум 4 мас.%, еще более предпочтительно, максимум 3 мас.%, еще более предпочтительно, максимум 2 мас.%, еще более предпочтительно, максимум 1 мас.%, а наиболее предпочтительно, максимум 0,5 мас.% другого полинуклеотидного материала, с которым он ассоциируется в природе или в рекомбинантном препарате. Однако, по существу, чистый полинуклеотид может включать природные 5'- и 3'-нетранслируемые области, такие как промоторы и терминаторы. По существу, чистый полинуклеотид имеет чистоту, предпочтительно, составляющую по меньшей мере 90%, более предпочтительно, по меньшей мере 92%, еще более предпочтительно, по меньшей мере 94%, еще более предпочтительно, по меньшей мере 95%, еще более предпочтительно, по меньшей мере 96%, еще более предпочтительно, по меньшей мере 97%, еще более предпочтительно, по меньшей мере 98%, еще более предпочтительно, по меньшей мере 99%, а наиболее предпочтительно, по меньшей мере 99,5% по массе. Полинуклеотиды согласно изобретению, предпочтительно, имеют, по существу, чистую форму, то есть указанный полинуклеотидный препарат, по существу, не содержит другого полинуклеотидного материала, с которым он ассоциируется в природе или в рекомбинантном препарате. Полинуклеотиды могут представлять собой геномные ДНК, кДНК, РНК, а также полусинтетические полинуклеотиды, синтетические полинуклеотиды или любые их комбинации.
Кодирующая последовательность: Используемый здесь термин «кодирующая последовательность» означает полинуклеотид, который непосредственно определяет аминокислотную последовательность его полипептидного продукта. Границы кодирующей последовательности, в основном, определяются открытой рамкой считывания, которая обычно начинается со старт-кодона ATG или альтернативных старт-кодонов, таких как GTG и TTG, и заканчивается стоп-кодоном, таким как TAA, TAG и TGA. Кодирующей последовательностью может быть ДНК, кДНК, синтетический полинуклеотид или рекомбинантный полинуклеотид.
Функционально связанный: Используемый здесь термин «функционально связанный» означает конфигурацию, в которой регуляторная последовательность находится в соответствующем положении по отношению к кодирующей последовательности полинуклеотидной последовательности, что позволяет указанной регуляторной последовательности управлять экспрессией кодирующей последовательности полипептида.
Клетка-хозяин: Используемый здесь термин «клетка-хозяин» включает любую клетку, которая является компетентной в отношении переноса в нее конструкции нуклеиновой кислоты или вектора, содержащих полинуклеотид согласно изобретению, ее трансфекции такой конструкцией или вектором и трансдукции указанной конструкции или вектора и т.п. Термин «клетка-хозяин» включает любое потомство родительской клетки, которое не является идентичным родительской клетке, что обусловлено мутациями, происходящими в процессе репликации.
Повышенная химическая стабильность: Термин «повышенная химическая стабильность» определяют здесь как вариант фермента, сохраняющего ферментативную активность после инкубирования в присутствии химического вещества или химических веществ, либо природных, либо синтетических, которые снижают ферментативную активность родительского фермента. Повышенная химическая стабильность может также способствовать образованию вариантов, обладающих лучшей способностью катилизировать реакцию в присутствии таких химических веществ. В конкретном аспекте изобретения, повышенной химической стабильностью является повышенная стабильность в детергенте, в частности в жидком детергенте. Повышенной стабильностью к детергенту является, в частности, повышенная стабильность ксилоглюканазной активности при смешивании ксилоглюканазного варианта согласно изобретению с получением жидкой композиции детергента и с ее последующим хранением при температуре от 15 до 50°С.
В настоящем изобретении жидкими детергентами являются детергенты, особенно подходящие для их использования в качестве жидких моющих средств для стирки.
Соглашения по обозначению вариантов
В соответствии с настоящим изобретением, аминокислотную последовательность ксилоглюканазы, описанную в SEQ ID NO: 3, используют для определения соответствующего аминокислотного остатка в другой ксилоглюканазе. Аминокислотную последовательность другой ксилоглюканазы выравнивают с аминокислотной последовательностью ксилоглюканазы, описанной в SEQ ID NO: 3, и исходя из такого выравнивания может быть определено число положений аминокислот, соответствующих любому аминокислотному остатку в аминокислотной последовательности ксилоглюканазы, описанной в SEQ ID NO: 3.
Выравнивание полипептидных последовательностей может быть осуществлено, например, с использованием программы «ClustalW» (Thompson J.D., Higgins D.G. and Gibson T.J., 1994, CLUSTAL W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positions-specific gap penalties and weight matrix choice, Nucleic Acids Research 22: 4673-4680). Выравнивание последовательностей ДНК может быть осуществлено с использованием ДНК данного полипептида в качестве матрицы, в которой была сделана замена кодона данных аминокислот соответствующим кодоном последовательности ДНК.
При описании различных вариантов ксилоглюканаз согласно изобретению, номенклатура, описанная ниже, была адаптирована для простоты ее идентификации. Во всех случаях, используется принятая ИЮПАК (IUPAC) однобуквенная или трехбуквенная аббревиатура аминокислот.
Замены: Для замены аминокислот используется следующая номенклатура: исходная аминокислота/положение/замененная аминокислота. В соответствии с этим, замена треонина аланином в положении 226 обозначается «Thr226Ala» или «T226A». Множественные мутации разделены значком «плюс» («+»), так, например, «G205R + S411F» означает мутации в положениях 205 и 411, где глицин (G) заменен аргинином (R), а серин (S) заменен фенилаланином (F), соответственно. Если исходная аминокислота может быть заменена аминокислотой, выбранной из группы аминокислот, то такая замена обозначается «K129R,S,A,I,F,Q», где лизин (K) в положении 129 заменен аминокислотой, выбранной из группы, состоящей из аргинина (R), серина (S), аланина (A), изолейцина (I), фенилаланина (F) и глутамина (Q). Альтернативно, «K129R,S,A,I,F,Q» может записываться как K129R, или K129S, или K129A, или K129I, или K129F, или K129Q.
Делеции. Для делеции аминокислот используется следующая номенклатура: исходная аминокислота/положение/звездочка (*). В соответствии с этим, делеция глицина в положении 195 обозначается «Gly195*» или «G195*». Множественные делеции разделены значком «плюс» («+»), например, «G195* + S411*».
Инсерции. Для инсерции аминокислот используется нижеследующая номенклатура: звездочка(*)/положение/строчная буква/встроенная аминокислота, где строчная буква означает добавление аминокислоты ниже данного положения. В соответствии с этим, инсерция глутаминовой кислоты (E) за положением 10 обозначается «*10aE». Если ниже положения 10 за глутаминовой кислотой (E) встраивается вторая аминокислота, например, валин (V), то такая инсерция обозначается «*10аЕ + *10bV». Добавление полипептидов к N-концу обозначается 0 (ноль). Добавление глутаминовой кислоты (E) и валина (V) к N-концевой аминокислоте полипептида обозначается «*0aE+*0bV». Инсерция аминокислоты, «добавляемой ниже», может быть также определена как добавление одной или нескольких аминокислот между названным положением и положением, следующим непосредственно за названным положением, например, инсерция ниже положения 195 приводит к добавлению одной или нескольких аминокислот между положениями 195 и 196, в результате чего образуются новые положения, *195a, *195b и т.п.
Родительские ксилоглюканазы
В настоящем изобретении, родительской ксилоглюканазой является либо (a) ксилоглюканаза, принадлежащая к семейству из 44 гликозилгидролаз, также называемому семейством из 44 ксилоглюканаз; либо (b) полипептид, выбранный из группы, состоящей из SEQ ID NO:3, SEQ ID NO: 5 и SEQ ID NO: 7; либо (c) полипептид, содержащий аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности зрелого полипептида SEQ ID NO: 3; либо (d) полипептид, кодируемый полинуклеотидом, который гибридизуется в условиях по меньшей мере умеренной жесткости с (i) последовательностью, кодирующей зрелый полипептид, SEQ ID NO: 1, или SEQ ID NO: 4, или SEQ ID NO: 6; (ii) геномной последовательностью ДНК, включающей последовательность, кодирующую зрелый полипептид, SEQ ID NO:1, SEQ ID NO: 4 или SEQ ID NO: 6; или (iii) полноразмерной комплементарной цепью (i) или (ii); либо (e) полипептид, кодируемый полинуклеотидом, включающим нуклеотидную последовательность, которая по меньшей мере на 70% идентична последовательности, кодирующей зрелый полипептид, SEQ ID NO: 1.
В первом аспекте изобретения, родительская ксилоглюканаза содержит аминокислотную последовательность, которая имеет степень идентичности со зрелым полипептидом SEQ ID NO: 3, составляющую, предпочтительно, по меньшей мере 70%, более предпочтительно, по меньшей мере 75%, более предпочтительно, по меньшей мере 80%, еще более предпочтительно, по меньшей мере 85%, еще более предпочтительно, по меньшей мере 90%, еще более предпочтительно, по меньшей мере 95%, еще более предпочтительно, по меньшей мере 96%, еще более предпочтительно, по меньшей мере 97%, еще более предпочтительно, по меньшей мере 98%, а наиболее предпочтительно, по меньшей мере 99%, и которая обладает ксилоглюканазной активностью (далее называемая «гомологичными полипептидами»). В одном из аспектов изобретения, гомологичные полипептиды имеют аминокислотную последовательность, которая отличается от зрелого полипептида SEQ ID NO:3 на десять, предпочтительно, на девять, более предпочтительно, на восемь, еще более предпочтительно, на семь, еще более предпочтительно, на шесть, еще более предпочтительно, на пять аминокислот, еще более предпочтительно, на четыре, еще более предпочтительно, на три, еще более предпочтительно, на две аминокислоты, и наиболее предпочтительно, на одну аминокислоту.
По существу, гомологичные родительские ксилоглюканазы могут иметь одну или несколько аминокислотных модификаций, таких как замены, делеции и/или инсерции. Эти модификации, по своей природе, предпочтительно, играют незначительную роль, то есть представляют собой консервативные аминокислотные замены и другие замены, которые не оказывают заметного влияния на трехмерную укладку или активность белка или полипептида; небольшие делеции, обычно от одной до примерно 9 аминокислот, предпочтительно, от одной до примерно 15 аминокислот, а наиболее предпочтительно, от одной до примерно 30 аминокислот; и небольшие амино- или карбокси-концевые удлинения, такие как добавление амино-концевого метионинового остатка, небольшого линкерного пептида, имеющего примерно до 5-10 остатков, предпочтительно, от 10 до 15 остатков, а наиболее предпочтительно, от 20 до 25 остатков, или небольшое удлинение, облегчающее очистку (присоединение аффинной метки), такое как присоединение полигистидиновой метки или белка А (Nilsson et al., 1985, EMBO J. 4: 1075; Nilsson et al., 1991, Methods Enzymol. 198: 3. В общих чертах, см. также Ford et al., 1991, Protein Expression and Purification 2: 95-107.
Хотя вышеописанные модификации, по своей природе, предпочтительно, не оказывают значительного влияния, однако, иногда они могут играть определенную роль, то есть могут приводить к образованию гибрида из более крупных полипептидов длиной до 300 аминокислот или более и могут представлять собой амино- или карбокси-концевые удлинения.
Примерами консервативных замен являются замены между аминокислотами группы основных аминокислот (аргинина, лизина и гистидина), кислотных аминокислот (глутаминовой кислоты и аспарагиновой кислоты), полярных аминокислот (глутамина и аспарагина), гидрофобных аминокислот (лейцина, изолейцина и валина), ароматических аминокислот (фенилаланина, триптофана и тирозина) и небольших аминокислот (глицина, аланина, серина, треонина и метионина). Аминокислотные замены, которые, по существу, не приводят к изменению удельной активности, известны специалистам и описаны, например, в публикации Neurath & Hill, 1979, In, The Proteins, Academic Press, New York. Наиболее часто встречающимися заменами являются Ala/Ser, Val/Ile, Asp/Glu, Thr/Ser, Ala/Gly, Ala/Thr, Ser/Asn, Ala/Val, Ser/Gly, Tyr/Phe, Ala/Pro, Lys/Arg, Asp/Asn, Leu/Ile, Leu/Val, Ala/Glu и Asp/Gly.
Незаменимые аминокислоты в ксилоглюканазных полипептидах согласно изобретению могут быть идентифицированы в соответствии с процедурами, известными специалистам, такими как сайт-направленный мутагенез или аланин-сканирующий мутагенез (Cunningham and Wells, Science 244: 1081-1085, 1989). В последнем методе, одиночные аланиновые мутации вводят в каждый остаток молекулы, и полученные мутантные молекулы тестируют на биологическая активность (то есть ксилоглюканазную активность) для идентификации аминокислотных остатков, играющих важную роль в активности молекулы. См. также Hilton et al., J. Biol. Chem. 271:4699-4708, 1996. Активный центр фермента или другие области, участвующие в биологических взаимодействиях, могут быть также определены с помощью физического анализа структуры, как было определено такими методами, как ядерный магнитный резонанс, кристаллография, электронная дифракция или фотоаффинное мечение, в комбинации с мутацией предполагаемого сайта контактирования аминокислот. См., например, de Vos et al., Science 255:306-312, 1992; Smith et al., J. Mol. Biol. 224:899-904, 1992; Wlodaver et al., FEBS Lett. 309:59-64, 1992. Идентичность незаменимых аминокислот может быть также определена исходя из анализа их гомологии с полипептидами, которые являются родственными полипептиду согласно изобретению. Кристаллическая структура фермента, принадлежащего к семейству, состоящему из 44 гликозилгидролаз, была описана Kitago et al, J. Biol. Chem. Vol. 282:35703-35711, 2007. На основании этой структуры можно генерировать трехмерную структуру родительской ксилоглюканазы (SEQ ID NO: 3) in silico. Путем сравнения с опубликованной структурой, нижеследующие остатки в SEQ ID NO: 3 были идентифицированы как остатки, осуществляющие важную ферментативную функцию, а именно остаток E187 (каталитическая аминокислота/каталитическое основание), остаток E358 (каталитический нуклеофил), остаток E56 (карбоксилатная группа, координирующая Ca2+) и остаток D154 (карбоксилатная группа, координирующая Ca2+). Поэтому, такие положения, предпочтительно, не должны быть мутированы в родительском ферменте.
Родительская ксилоглюканаза, предпочтительно, содержит аминокислотную последовательность SEQ ID NO: 3 или ее аллельный вариант или фрагмент, обладающий ксилоглюканазной активностью. В одном из аспектов изобретения, родительская ксилоглюканаза содержит аминокислотную последовательность SEQ ID NO: 2. В другом аспекте изобретения, родительская ксилоглюканаза содержит зрелый полипептид SEQ ID NO: 2. В другом аспекте изобретения, родительская ксилоглюканаза состоит из аминокислотной последовательности SEQ ID NO: 3 или ее аллельного варианта или фрагмента, обладающего ксилоглюканазной активностью. В другом аспекте изобретения, родительская ксилоглюканаза содержит аминокислотную последовательность SEQ ID NO: 5 или ее аллельный вариант или фрагмент, обладающий ксилоглюканазной активностью. В другом аспекте изобретения, родительская ксилоглюканаза содержит аминокислотную последовательность SEQ ID NO: 7 или ее аллельный вариант или фрагмент, обладающий ксилоглюканазной активностью. В другом аспекте изобретения, родительская ксилоглюканаза содержит аминокислотную последовательность, которая по меньшей мере на 65%, более предпочтительно, по меньшей мере на 70%, еще более предпочтительно, по меньшей мере на 75%, еще более предпочтительно, по меньшей мере на 80%, еще более предпочтительно, по меньшей мере на 85%, еще более предпочтительно, по меньшей мере на 90%, а наиболее предпочтительно, по меньшей мере на 95% идентична последовательности SEQ ID NO: 2 или SEQ ID NO: 3, или SEQ ID NO: 5. Фрагментом зрелого полипептида SEQ ID NO: 3 является полипептид, который имеет одну или несколько аминокислот, делетированных у амино- и/или карбоксиконца этой аминокислотной последовательности, и сохраняет ксилоглюканазную активность.
Во втором аспекте изобретения, родительские ксилоглюканазы кодируются полинкулеотидами, которые гибридизуются в условиях очень низкой жесткости, предпочтительно, в условиях низкой жесткости, более предпочтительно, в условиях умеренной жесткости, более предпочтительно, в условиях умеренной-высокой жесткости, еще более предпочтительно, в условиях высокой жесткости, а наиболее предпочтительно, в условиях очень высокой жесткости, (i) с последовательностью, кодирующей зрелый полипептид, SEQ ID NO: 1 или SEQ ID NO: 4, или SEQ ID NO: 6, (ii) с последовательностью геномной ДНК, включаеющей последовательность, кодирующую зрелый полипептид, SEQ ID NO: 1 или SEQ ID NO: 4, или SEQ ID NO: 6, (iii) с подпоследовательностью (i) или (ii); или (iv) с полноразмерной комплементарной цепью (i), (ii) или (iii) (J. Sambrook, E.F. Fritsch and T. Maniatis, 1989, Molecular Cloning, A Laboratory Manual, 2d edition, Cold Spring Harbor, New York). Такая подпоследовательность может кодировать полипептидный фрагмент, обладающий ксилоглюканазной активностью. В одном из аспектов изобретения, комплементарной цепью является полноразмерная комплементарная цепь последовательности, кодирующей зрелый полипептид, SEQ ID NO: 1 или SEQ ID NO: 4, или SEQ ID NO: 6.
Подпоследовательностью последовательности, кодирующей зрелый полипептид, SEQ ID NO: 1 или SEQ ID NO: 4, или SEQ ID NO: 6, или ее гомологом является нуклеотидная последовательность, в которой один или несколько нуклеотидов делетированы у 5'- и/или 3'-конца, где указанный полипептид, кодируемый указанной подпоследовательностью, обладает ксилоглюканазной активностью.
Родительскими ферментами могут быть также аллельные варианты полипептидов, обладающих ксилоглюканазной активностью.
Полинуклеотид SEQ ID NO: 1 или SEQ ID NO: 4, или SEQ ID NO: 6 или его подпоследовательность, а также аминокислотная последовательность SEQ ID NO: 3 или SEQ ID NO: 5, или SEQ ID NO: 7, или ее фрагмент, могут быть использованы для конструирования зондов нуклеиновой кислоты, применяемых для идентификации и клонирования ДНК, кодирующей родительские ксилоглюканазы, происходящие от штаммов различного рода или вида, где такую идентификации и клонирование осуществляют методами, хорошо известными специалистам. В частности, такие зонды могут быть использованы для гибридизации с геномной ДНК или с кДНК представляющего интерес рода или вида после проведения стандартных процедур саузерн-блот-анализа, осуществляемого в целях идентификации и выделения соответствующего гена, описанного в настоящей заявке. Такие зонды могут быть значительно короче полноразмерной последовательности, но их длина должна составлять по меньшей мере 14, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35, а наиболее предпочтительно, по меньшей мере 70 нуклеотидов. Однако, предпочтительно, чтобы такой зонд нуклеиновой кислоты имел длину по меньшей мере 100 нуклеотидов. Так, например, зонд нуклеиновой кислоты может иметь длину по меньшей мере 200 нуклеотидов, предпочтительно, по меньшей мере 300 нуклеотидов, более предпочтительно, по меньшей мере 400 нуклеотидов, а наиболее предпочтительно, по меньшей мере 500 нуклеотидов. Могут быть использованы даже еще более длинные зонды, например, зонды нуклеиновой кислоты, которые, предпочтительно, имеют длину по меньшей мере 600 нуклеотидов, более предпочтительно, по меньшей мере 700 нуклеотидов, еще более предпочт