Модифицированная термостабильная днк-полимераза, способ её получения и применение
Реферат
Изобретение относится к области молекулярной биологии и генной инженерии и может быть использовано в различных методах анализа нуклеиновых кислот, связанных с синтезом комплементарных ДНК-последовательностей. Предложена модифицированная форма термостабильной ДНК-полимеразы, получаемая путем замены остатка глутамата в консенсусной последовательности SerGlnIleGluLeuArgVal/Ile природного термостабильного фермента другим аминокислотным остатком и отбора мутеинов, проявляющих повышенную способность к включению в реакцию несвойственных субстратов, предпочтительно рНТФ. Описаны кодирующие модифицированную ДНК-полимеразу нуклеотидные последовательности, содержащие их векторы и штаммы Е.coli, трансформированные указанными векторами и обеспечивающие получение рекомбинантных форм мутантных ферментов. Предлагаемое применение новой термостабильной ДНК-полимеразы, в том числе в составе наборов и композиций, в реакции секвенирования нуклеиновой кислоты позволяет использовать новые подходы при анализе результатов исследования. 9 с. и 11 з.п. ф-лы, 4 табл.
Область техники, к которой относится изобретение
Настоящее изобретение относится к термостабильным ДНК-полимеразам, способным более эффективно включать рибонуклеозидтрифосфаты. В изобретении описаны методы и способы выделения таких полимераз. Ферменты по изобретению могут применяться для различных целей, в частности для секвенирования нуклеиновых кислот. Таким образом, изобретение также относится к улучшенным методам анализа последовательности нуклеиновых кислот.
Предпосылки создания изобретения
Секвенирование ДНК обычно включает получение четырех популяций фрагментов одноцепочечной ДНК, имеющих одно определенное окончание и одно вариабельное окончание. Вариабельное окончание обычно заканчивается на конкретных основаниях нуклеотидов [на гуанине (Г), аденине (А), тимидине (Т) либо на цитозине (Ц)]. Каждый из четырех различных наборов фрагментов разделяют на основе их длины. С этой целью используют полиакриламидный гель с высокой разрешающей способностью. Каждая полоса на таких гелях соответствует конкретному нуклеотиду в последовательности ДНК, показывая тем самым его положение в последовательности.
Часто применяемым методом секвенирования ДНК является дидезокси- или цепь-терминирующий метод секвенирования, который включает ферментативный синтез цепи ДНК (Sanger и др., 1977, Ргос. Natl. Acad. Sci. 74: 5463). Обычно осуществляют четыре различные реакции синтеза, каждая из которых должна закончиться на определенном основании (Г, А, Т или Ц) путем включения соответствующего терминирующего цепь нуклеотида, такого как дидезоксинуклеотид. Продукты реакции легко определить, поскольку каждая полоса соответствует только Г, А, Т либо Ц.
В дидезокси- или цепь-терминирующем методе отжигают короткий одноцепочечный праймер, соответствующий одноцепочечной матрице. Праймер удлиняют на его 3’-конце путем включения дезоксинуклеотидов (дНТФ) до включения дидезоксинуклеотида (ддНТФ). После включения ддНТФ удлинение прекращается. Однако для гарантии правильности репликации ДНК ДНК-полимеразы обладают более выраженной способностью включать естественные для них субстраты, т.е. дНТФ, и не включать аналоги нуклеотидов, называемые несвойственными нуклеотидами. При синтезе ДНК рибонуклеотиды (рНТФ) рассматриваются как несвойственные нуклеотиды, поскольку в отличие от ддНТФ рНТФ обычно не являются естественными субстратами для ДНК-полимеразы in vivo. В клетке это свойство способствует снижению включения аномальных оснований, таких как дезоксиинозинтрифосфат (дИТФ) или рНТФ, в растущую цепь ДНК.
Двумя наиболее часто используемыми методами автоматического секвенирования являются секвенирование с использованием окрашенного праймера и окрашенного терминатора. Эти методы пригодны для использования с флуоресцентно меченными фрагментами. Хотя секвенирование также может быть осуществлено с использованием радиоактивно меченных фрагментов, секвенирование, основанное на флуоресценции, является более предпочтительным. В целом при секвенировании с окрашенным праймером флуоресцентно меченный праймер применяют в комбинации с немечеными ддНТФ. Процесс осуществляется с использованием четырех реакций синтеза и до получения на геле четырех полос для каждой подлежащей секвенированию матрицы (соответствующих продукту терминации, который специфичен для каждого основания). После удлинения праймера подлежащие секвенированию смеси, содержащие продукты терминации с включенными дидезоксинуклеотидами, обычно анализируют с использованием электрофореза на геле для секвенирования ДНК. После электрофоретического разделения флуоресцентно меченные продукты вырезают с помощью лазера из основания геля и флуоресценцию определяют с использованием соответствующего монитора. В автоматических системах при прохождении реакционных смесей через матрикс геля во время электрофореза детектор сканирует основание геля для обнаружения, какой из меченых фрагментов используется (Smith и др., 1986, Nature 321: 674-679). В модификации этого метода каждый из четырех праймеров метят различным флуоресцентным маркером. По завершении четырех различных реакций секвенирования реакционные смеси объединяют и объединенные реакционные смеси подвергают гель-анализу для каждой полосы, посредством чего индивидуально выявляют различные флуоресцентные метки (соответствующие четырем различным продуктам терминации, которые специфичны для каждого основания).
В другом варианте применяют метод секвенирования с использованием окрашенного терминатора. В этом методе для включения дНТФ применяют ДНК-полимеразу и флуоресцентно меченные ддНТФ на наращиваемом конце ДНК-праймера (Lee и др., 1992, Nucleic Acid Research 20: 2471). Преимуществом этого способа является отсутствие необходимости синтезировать меченные красителем праймеры. Кроме того, реакции с использованием окрашенного терминатора являются более удобными, поскольку при этом все четыре реакции могут быть осуществлены в одной и той же пробирке. Ранее были описаны модифицированные термостабильные ДНК-полимеразы, обладающие пониженной способностью различать ддНТФ (см. публикацию европейской заявки ЕР-А-655506 и заявку на патент США 08/448223). Примером модифицированной термостабильной ДНК-полимеразы является мутантная форма ДНК-полимеразы из Т. aquaticus, имеющая остаток тирозина в положении 667 (вместо остатка фенилаланина), т.е. так называемая F667Y-мутантная форма ДНК-полимеразы Taq. AmpliTaq FS, которая производится фирмой Hoffmann-La Roche и продается через фирму Perkin Elmer, снижает количество ддНТФ, необходимое для эффективного секвенирования нуклеиновой кислоты-мишени, в несколько сотен или несколько тысяч раз. AmpliTaq FS представляет собой мутантную форму ДНК-полимеразы из Т. aquaticus, имеющую мутацию F667Y и дополнительный остаток аспарагиновой кислоты в положении 46 (вместо остатка глицина; G46D- мутация).
Таким образом, существует необходимость в термостабильных ДНК-полимеразах, применяемых для альтернативных методов синтеза нуклеиновых кислот, пригодных для точного и эффективного с точки зрения стоимости анализа нуклеотидной последовательности в ДНК. Также существует необходимость в разработке методов, основанных на флуоресценции, для которых не требуется применение дидезоксинуклеотидов. Настоящее изобретение направлено на решение этих задач.
Краткое изложение сущности изобретения
Настоящее изобретение относится к зависимым от матрицы термостабильным ДНК-полимеразам, которые включают характерную аминокислотную последовательность-мотив SerGlnIleXaaLeuArgXaa (SEQ ID NO: 1), причем "Хаа" в положении 4 этой последовательности представляет собой остаток любой аминокислоты, кроме остатка глутаминовой кислоты (Glu), а "Хаа" в положении 7 этой последовательности представляет собой остаток валина (Val) или остаток изолейцина (Ilе). При выражении в однобуквенном коде аминокислот эта последовательность-мотив может быть обозначена как S Q I X L R V/I, где "X" в положении 4 этой последовательности представляет собой остаток любой аминокислоты, кроме остатка глутаминовой кислоты. Способность термостабильных ДНК-полимераз, имеющих аминокислотную последовательность, включающую указанную последовательность-мотив, где "X" в положении 4 этой последовательности-мотива не является остатком глутаминовой кислоты, ограничивать включение рибонуклеотидов по сравнению с ранее описанными термостабильными полимеразами понижена. Для растущей цепи ДНК рибонуклеотиды являются несвойственными нуклеотидами. Таким образом, первым предметом изобретения являются новые ферменты, способные включать несвойственные аналоги оснований, такие как рибонуклеотиды, в растущую цепь ДНК и на несколько порядков более эффективные, чем выявленные ранее термостабильные ДНК-синтезирующие ферменты. Гены, кодирующие эти ферменты, также относятся к настоящему изобретению, равно как и рекомбинантные векторы экспрессии и клетки-хозяева, включающие эти векторы. С помощью таких трансформированных клеток-хозяев могут быть получены большие количества очищенных термостабильных ферментов полимераз.
В соответствии с настоящим изобретеним была выявлена область или последовательность-мотив внутри аминокислотной последовательности термостабильных ДНК-полимераз, увеличивающая способность полимераз включать рибонуклеотиды, сохраняя при этом способность правильно включать дезоксирибонуклеотиды. Изменения в этой области, например замена одной или нескольких аминокислот (например, введение их путем сайтнаправленного мутагенеза), приводят к получению термостабильного фермента полимеразы, который способен синтезировать РНК или РНК/ДНК-химеры либо гибридную цепь на матрице ДНК.
Другим предметом изобретения являются усовершенствованные методы и композиции, предназначенные для определения последовательности нуклеиновой кислоты-мишени, при этом необходимость в терминирующих цепь ддНТФ отпадает. С помощью представленных в настоящем описании усовершенствованных методов рибонуклеотиды (рНТФ) включаются в продукты удлинения праймеров. Поскольку ферменты, являющиеся предметом изобретения, точно и эффективно включают как рНТФ, так и дНТФ, в реакциях секвенирования могут использоваться смеси обоих нуклеотидов. После удлинения праймера вновь синтезированные олигонуклеотидные продукты могут быть расщеплены по местам включения рНТФ методами, известными в данной области техники, например путем гидролиза, что приводит тем самым к получению популяции фрагментов, пригодных для фракционирования и анализа последовательности стандарными методами, такими как гель-электрофорез. Эти методы, основанные на применении новых термостабильных ферментов полимераз, представлены в данном описании. Таким образом, этот предмет изобретения относится к термостабильным ДНК-полимеразам, которые отличаются тем, что полимераза включает критический мотив SerGlnIleXaaLeuArgXaa (SEQ ID NO: 1), где "Хаа" в положении 4 может представлять собой остаток любой аминокислоты, кроме остатка глутаминовой кислоты (Glu), а "Хаа" в положении 7 представляет собой остаток валина (Val) или остаток изолейцина (Ilе).
Другим предметом изобретения являются модифицированные полимеразы, представленные в настоящем описании, которые включают рибонуклеотиды или аналоги, содержащие гидроксильную группу или другой заместитель в положении 2’, которые обычно отсутствуют у дезоксирибонуклеотидов. Эти нуклеотиды могут быть по-разному помечены, что создает альтернативные варианты обычному применению дидезоксинуклеотидов для целей секвенирования ДНК.
Мутантные термостабильные полимеразы по изобретению способны более эффективно включать несвойственные нуклеотиды, в частности рибонуклеотиды, по сравнению с соответствующими ферментами дикого типа. В предпочтительном варианте осуществления изобретения подлежащий включению несвойственный нуклеотид может быть аналогом терминирующего цепь основания, таким как 2’-гидрокси-3’-дезоксиАТФ (кордицепинтрифосфат), являющийся "риботерминатором"-аналогом АТФ, или нетерминирующим цепь нуклеотидом, таким как рНТФ.
Другим предметом изобретения явялются мутантные термостабильные полимеразы, которые способны более эффективно включать несвойственные нуклеотиды, в частности рибонуклеотиды, чем соответствующие ферменты дикого типа. Таким образом, этот предмет изобретения относится к рекомбинатным термостабильным ДНК-полимеразам, каждая из которых характеризуется тем, что (а) в своей нативной форме полимераза включает аминокислотную последовательность SerGlnIleGluLeuArgXaa (SEQ ID NO: 2), где "Хаа" в положении 7 этой последовательности обозначает остаток валина (Val) или остаток изолейцина (Ilе); (б) в аминокислотной последовательности рекомбинантного фермента, предпочтительно в положении 4 этой последовательности, получают мутацию, при которой остаток глутаминовой кислоты в положении 4 представляет собой остаток другой аминокислоты, предпочтительно остаток глицина; и (в) способность рекомбинантного фермента ограничивать включение рибонуклеотидов и аналогов рибонуклеотидов по сравнению с нативной формой этого фермента понижена.
Другим предметом изобретения являются полимеразы, которые предназначены для фрагментации продуктов амплификации и продуктов удлинения праймера, причем такие фрагментированные продукты могут быть пригодны для использования в методах, основанных на гибридизации, и для различных стратегий определения последовательности.
Ферменты по настоящему изобретению и кодирующие их гены могут применяться для создания композиций, пригодных для осуществления реакций секвенирования ДНК и включающих смесь обычных нуклеотидов и по крайней мере один рибонуклеотид или аналог рибонуклеотида. В предпочтительном варианте осуществления изобретения несвойственный нуклеотид представляет собой рибонуклетид, а концентрация рибонуклеотида ниже концентрации соответствующего дезоксирибонуклеотида, т.е. отношение рНТФ:дНТФ составляет 1:1 или менее. Ферменты по изобретению также пригодны для продажи в виде наборов, которые также могут включать любой из дополнительных элементов, необходимых для осуществления реакции секвенирования нуклеиновой кислоты, такой как, например, дНТФ, рНТФ, буферы и/или праймеры.
Подробное описание изобретения
Настоящее изобретение относится к новым и улучшенным модифицированным термостабильным ДНК-полимеразам, композициям и наборам, охарактеризованным в формуле изобретения. Ферменты по изобретению более эффективно включают несвойственные нуклеозидтрифосфаты в сравнении с ранее известными полимеразами или соответствующими полимеразами дикого типа, из которых получают эти новые полимеразы. Согласно изобретению также предлагаются последовательности ДНК, кодирующие эти модифицированные ферменты, векторы для экспрессии модифицированных ферментов и клетки с такими внедренными в них векторами. Ферменты по изобретению пригодны для практического применения в новых методах секвенирования ДНК, которые обладают рядом преимуществ по сравнению с методами секвенирования ДНК, известными из уровня техники.
Ниже для облегчения понимания сущности настоящего изобретения определены некоторые понятия.
Понятие "обычный", если оно упоминается в связи с основаниями нуклеиновой кислоты, нуклеозидтрифосфатами или нуклеотидами, относится к таковым, которые встречаются в естественных условиях в указанном полинуклеотиде (например, для ДНК это дАТФ, дГТФ, дЦТФ и дТТФ). Кроме того, в реакциях синтеза ДНК in vitro, таких как секвенирование, вместо дЦТФ часто используют с7дГТФ и дИТФ (хотя они включаются с меньшей эффективностью). В целом они могут быть обобщены понятием дезоксирибонуклеозидтрифосфаты (дНТФ).
Понятие "система экспрессии" относится к последователностям ДНК, содержащим требуемую кодирующую последовательность и функционально связанные контролирующие последовательности, так что хозяева, трансформированные этими последовательностями, обладают способностью продуцировать кодируемые протеины. Для осуществлениия трансформации система экспрессии может быть включена в вектор, хотя пригодная ДНК также может быть включена в хромосому хозяина.
Понятие "ген" относится к последовательности ДНК, которая включает контролирующие и кодирующие последовательности, необходимые для воспроизводимого получения биологически активного полипептида или предшественника. Полипептид может кодироваться полноразмерной последовательностью гена или любой имеющей достаточную длину частью кодирующей последовательности, чтобы сохранить ферментативную активность.
Понятие "клетка(и)-хозяин(ева)" относится как к одноклеточным прокариотическим или эукариотическим организмам, таким как бактерии, дрожжи и актиномицеты, так и к отдельным клеткам из растений или животных высших отрядов, если они способны расти в культуре клеток.
Используемое в настоящем описании понятие "реакционная смесь для секвенирования ДНК" относится к реакционной смеси, которая включает элементы, необходимые для реакции секвенирования ДНК. Таким образом, реакционная смесь для секвенирования ДНК пригодна для использования в методе секвенирования ДНК для определения последовательности нуклеиновой кислоты-мишени, хотя вначале реакционная смесь может быть неполной, чтобы пользователь мог контролировать инициацию реакции секвенирования. В этом случае реакция может быть начата после того, как будет добавлен последний элемент, такой как фермент, который вводится для получения полной реакционной смеси для секвенирования ДНК. Обычно реакционная смесь для секвенирования ДНК должна содержать буфер, пригодный для полимеризации, нуклеозидтрифосфаты и по крайней мере один несвойственный нуклеотид. Реакционная смесь также может содержать праймер, который может удлиняться на мишени полимеразой, полимеразу и нуклеиновую кислоту-мишень. Праймер, равно как и один из нуклеотидов, обычно включает содержащий метку, например, флуоресцентную фрагмент, который может быть обнаружен. Обычно реакционнная смесь представляет собой смесь, которая включает четыре обычных нуклеотида и по крайней мере один несвойственный нуклеотид. В предпочтительном варианте осуществления полимераза представляет собой термостабильную ДНК-полимеразу, а несвойственный нуклеотид представляет собой рибонуклеотид.
Понятие "олигонуклеотид", используемое в данном описании, относится к молекуле, состоящей из двух или нескольких дезоксирибонуклеотидов или рибонуклеотидов, предпочтительно более чем из трех и обычно более чем из десяти. Точный размер олигонуклеотида может зависеть от многих факторов, включая основную функцию или применение олигонуклеотида.
Олигонуклеотиды могут быть получены любым пригодным методом, включая, например, клонирование и рестрикцию соответствующих последовательностей, и методом прямого химического синтеза, таким как фосфотриэфирный метод Narang и др., 1979, Meth. Enzymol. 68: 90-99; фосфодиэфирный метод Brown и др., 1979, Meth. Enzymol. 68: 109-151; диэтилфосфорамидный метод Beaucage и др., 1981, Tetrahedron Lett. 22: 1859-1862; триэфирный метод Matteucci и др., 1981, J. Am. Chem. Soc. 103: 3185-3191; автоматическими методами синтеза или методом с использованием твердой подложки, описанным в патенте США 4458066.
Понятие "праймер", используемое в данном описании, относится к естественному или синтетическому олигонуклеотиду, который способен служить точкой инициации синтеза при создании условий, при которых начинается удлинение праймера. Праймер предпочтительно представляет собой одноцепочечный олигодезоксирибонуклеотид. Соответствующая длина праймера зависит от предназначения праймера, но обычно составляет от 15 до 35 нуклеотидов. Для коротких молекул праймера обычно необходимы более низкие температуры для образования достаточно стабильных гибридных комплексов с матрицей. Праймер не должен отражать точную последовательность матрицы, но для того, чтобы происходило удлинение праймера, должен обладать достаточной степенью комплементарности для гибридизации с матрицей.
При необходимости праймер может быть помечен путем включения метки, которая может быть обнаружена спектроскопическими, фотохимическими, биохимическими, иммунохимическими или химическими способами. Например, пригодные метки включают 32Р, флуоресцентные красители, электронноплотные реагенты, ферменты (такие, как обычно применяемые в методах ELISA), биотин или гаптены и протеины, для которых имеются антисыворотки или моноклональные антитела.
Понятие "термостабильная полимераза" относится к ферменту, который стабилен при нагревании и который устойчив к нагреванию и сохраняет достаточную активность для последующиего осуществления реакции удлинения праймера при воздействии повышенных температур в течение времени, необходимого для осуществления денатурации двухцепочечных нуклеиновых кислот. Согласно данному описанию термостабильная полимераза пригодна для использования в реакции с температурными циклами, такой как полимеразная цепная реакция (ПЦР). Для термостабильной полимеразы под ферментативной активностью понимают способность соответствующим образом катализировать присоединение нуклеотидов для формирования продуктов удлинения праймера, которые комплементарны к цепи нуклеиновой кислоты-матрицы.
Необходимые для денатурации нуклеиновой кислоты условия нагревания могут зависеть, например, от концентрации соли в буфере, а также состава и длины нуклеиновых кислот, подлежащих денатурации, но обычно они находятся в интервале от приблизительно 90°С до приблизительно 105°С, предпочтительно от 90°С до 100°С, а продолжительнось нагревания в основном зависит от температуры и длины нуклеиновой кислоты, и обычно она составляет от нескольких секунд до четырех минут.
Понятие "несвойственный" или "модифицированный", когда оно характеризует основание нуклеиновой кислоты, нуклеозидтрифосфат или нуклеотид, включает модификацию, производные или аналоги обычных оснований или нуклеотидов, которые встречаются в ДНК в естественных условиях. В частности, согласно данному описанию несвойственные нуклеотиды модифицированы в положении 2’ сахара рибозы по сравнению с обычными дНТФ. Таким образом, хотя рибонуклеотиды (т.е. АТФ, ГТФ, ЦТФ, УТФ, называемые в целом рНТФ) и явялются встречающимися в естественных условиях нуклеотидами РНК, в контексте данного описания эти рибонуклеотиды являются несвойственными нуклеотидами, поскольку имеют в положении 2’ сахара гидроксильную группу, которая отсутствует в дНТФ. Аналоги рибонуклеотидов, содержащие заместители в положении 2’, такие как 2’-фтор-, 2’-аминозамещенные аналоги, подпадают под объем изобретения. Кроме того, аналоги рибонуклетидов могут быть модифицированы в положении 3’, например, путем замещения нормальной гидроксильной группы на водородную группу (3’-дезокси), что приводит к получению аналога-терминатора рибонуклеотида. Такие нуклеотиды также включены в объем понятия "несвойственные нуклеотиды".
Поскольку ДНК обычно состоит из дНТФ, включение рНТФ должно рассматриваться как несвойственное, и, следовательно, рНТФ должен рассматриваться как несвойственное основание. Таким образом, в предпочтительном варианте изобретения при осуществлении методов удлинения ДНК-праймера, включая методы секвенирования ДНК, в качестве продуктов получают нуклеиновые кислоты, которые содержат как обычные, так и несвойственные нуклеотиды, но в основном они содержат обычные нуклеотиды, которые представляют собой дНТФ.
Несвойственные основания могут быть флуоресцентно меченными, например, флуоресцином или родамином; нефлуоресцентно меченными, например, биотином; меченными изотопами, например, 32Р, 33Р или 35S или немечеными.
Для пояснения сущности изобретения в описании приведены примеры специфических термостабильных ферментов ДНК-полимераз по изобретению, однако эти ссылки не должны рассматриваться как ограничивающие объем изобретения. В предпочтительном варианте термостабильные ферменты по изобретению применяли в различных методах секвенирования нуклеиновых кислот, хотя новые термостабильные полимеразы, приведенные в настоящем описании, могут применяться для любой цели, где такая ферментативная активность является необходимой или желательной. Фермент также может применяться в реакциях амплификации, таких как ПЦР.
Термостабильные полимеразы по изобретению отличаются тем, что каждая из них содержит критический мотив SerGlnIleXaaLeuArgXaa (SEQ ID NO: 1), где "Хаа" в положении 4 этой последовательности представляет собой остаток любой аминокислоты, кроме остатка глутаминовой кислоты (Glu), а "Хаа" в положении 7 этой последовательности представляет собой остаток валина (Val) или остаток изолейцина (Ilе). Гены, кодирующие термостабильные полимеразы, которые имеют остаток глутаминовой кислоты в положении 4 этого мотива, могут быть модифицированы согласно настоящему описанию с получением пригодных модифицированных полимераз. Эти модифицированные термостабильные полимеразы отличаются тем, что по сравнению с соответствующими нативными ферментами или ферментами дикого типа они имеют модификацию в аминокислотной последовательности-мотиве SerGlnIleGluLeuArgXaa (SEQ ID NO: 2), где "Хаа" в положении 7 этой последовательности обозначает остаток валина (Val) или остаток изолейцина (Ilе); т.е. этот мотив был модифицирован путем замещения остатка глутаминовой кислоты в положении 4 остатком другой аминокислоты. Критический мотив термостабильной ДНК-полимеразы по настоящему изобретению приведен ниже с использованием стандартного однобуквенного кода аминокислот (Lehninger, Biochemistry, New York, Worth Publishers Inc., 1970, стр.67).
SEQ ID NO: 1 SerGlnIleXaaLeuArgXaa, где "Хаа" в положении 4 представляет собой остаток любой аминокислоты, кроме остатка глутаминовой кислоты (Glu), а "Хаа" в положении 7 представляет собой остаток валина (Val) или остаток изолейцина (Ilе).
Кодирующие последовательности генов, равно как и протеины, содержащие эту критическую аминокислотную последовательность, где Хаа в положении 4 не является остатком глутаминовой кислоты (Glu), относятся к полимеразе, способность которой ограничивать включение рНТФ понижена, и включены в объем настоящего изобретения. Внутри критического мотива могут быть осуществлены дополнительные модификации остатков других аминокислот, предпочтительно остатков аминокислот, выбранных из группы, включающей глутамин (Gln или Q), лейцин (Leu или L) или аргинин (Arg или R).
Настоящее изобретение может использоваться для получения термостабильных ДНК-полимераз с улучшенными свойствами путем определенной модификации в последовательности гена, кодирующего термостабильную ДНК-полимеразу. В предпочтительном варианте изобретения последовательность гена и кодируемый фермент происходят из видов рода Thermus, хотя эубактерии, не относящиеся к роду Thermus, также включены в настоящее изобретение, как это более подробно описано ниже. Аналогично этому, ввиду высококонсервативной природы выявленного в настоящем исследовании критического мотива, новые термостабильные ДНК-полимеразы могут быть обнаружены на основе их гомологии, например, с Taq-полимеразой. Такие термостабильные полимеразы включены в объем настоящего изобретения при условии, что их аминокислотная последовательность включает мотив S Q I Х L R V/I, где Х обозначает остаток любой аминокислоты, кроме остатка глутаминовой кислоты, и эта аминокислотная последовательность в целом гомологична (идентичность последовательности) по крайней мере приблизительно на 39%, предпочтительно по крайней мере приблизительно на 60%, более предпочтительно по крайней мере приблизительно на 80% аминокислотной последовательности нативной Taq-полимеразы. Вся длина последовательности этой Taq-полимеразы приведена в WO 89/06691 и зарегистрирована под регистрационным номером Р90556 в базе данных запатентованных последовательностей GENESEQ или под регистрационным номером М26480 в базе данных последовательностей EMBL и под регистрационным номером А33530 в базе данных последовательностей PIR.
Примером термостабильных ДНК-полимераз по настоящему изобретению являются рекомбинантные производные нативных полимераз из организмов, приведенных в таблице 1. В таблице 1 приведена конкретная последовательность критического мотива и положение остатка "X" для каждой из этих нативных полимераз. Поскольку каждая термостабильная ДНК-полимераза является уникальной, положение аминокислот критического мотива является определенным для каждого фермента. Для перечисленных ниже полимераз аминокислотный остаток в положении "X" критического мотива S Q I Х L R V/I представляет собой глутаминовую кислоту. Молекулярная масса предпочтительных полимераз по настоящему изобретению составляет от 85000 до 105000 Да, более предпочтительно от 90000 до 95000 Да. Аминокислотная последовательность этих полимераз состоит из приблизительно 750-950 остатков аминокислот, предпочтительно из 800-850 остатков аминокислот. Полимеразы по настоящему изобретению могут состоять из приблизительно 540 или более аминокислот и включают, по крайней мере, полимеразный домен и часть, соответствующую 3’-5’-экзонуклеазному домену (полученная полимераза может обладать или не обладать 3’-5’-экзонуклеазной активностью), и возможно части 5’-3’-экзонуклеазного домена, который расположен на первой трети аминокислотной последовательности многих полноразмерных термостабильных полимераз.
Для термостабильных ДНК-полимераз, не приведенных в таблице 1, выбор соответствующей глутаминовой кислоты, подлежащей модификации, является простым, если определен критический мотив или консенсусный мотив в аминокислотной последовательности.
Независимо от точного положения внутри термостабильной ДНК-полимеразы, замещение остатка глутаминовой кислоты (Glu) на остаток другой аминокислоты внутри последовательности-мотива SerGlnIleGluLeuArgXaa (SEQ ID NO: 2), где "Хаа" в положении 7 этой последовательности обозначает остаток валина (Val) или остаток изолейцина (Ilе), в полимеразном домене позволяет получить термостабильные полимеразы, способные к эффективному включению несвойственных нуклеотидов. В предпочтительном варианте глутаминовую кислоту заменяют на аминокислоту, имеющую ненагруженную полярную R-группу, такую как глицин, серин, цистеин, треонин, или на аминокислоту, имеющую небольшую неполярную R-группу, такую как, например, аланин. В наиболее предпочтительном варианте остаток глутаминовой кислоты заменяют на остаток глицина (G). Программы, позволяющие установить аминокислотную и нуклеотидную последовательность, могут быть приобретены у фирмы Genetics Computer Group, 575 Science Drive, Медисон, шт. Висконсин. Программы, пригодные для конкретного, определенного в данном описании мотива, включают, например, "GAP", "BESTFIT" и "PILEUP", способствующие выявлению точной последовательности подлежащей модификации области.
Как видно из приведенной таблицы 1, существуют две необходимые формы консервативной последовательности-мотива SerGlnIleGluLeuArgXaa (SEQ ID NO: 2) внутри полимеразного домена термостабильных ДНК-полимераз этих термофильных организмов. Последовательность-мотив SerGlnIleGluLeuArgVal (SEQ ID NO: 3) присутствует в нативных термостабильных полимеразах таких видов рода Thermus, как, например, Thermus aquaticus, Thermus caldophilus, Thermus thermophilus, Thermus flavus и Thermus filiformis, а также видов Thermus spsl7 и Z05. Последовательность-мотив SerGlnIleGluLeuArgVal (SEQ ID NO: 3) также присутствует в полимеразном домене других термостабильных ДНК-полимераз, получаемых, например, из Thermosipho africanus и из различных штаммов Bacillus, таких как Bacillus caldotenax и Bacillus stearothermophilus. Последовательность-мотив SerGlnIleGluLeuArgIle (SEQ ID NO: 4), например, присутствует в нативных термостабильных полимеразах Thermotoga maritima, Thermotoga neapolitana и Anaerocellum thermophilum.
Полная последовательность нуклеиновой кислоты и аминокислотная последовательность для каждой из Taq-, Tth-, Z05-, sps17-, Tma- и Taf-полимераз описана в патенте США 5466591. Последовательность ДНК-полимеразы из Tсa, Tfl, Tne, Ath, Bca и Bst описана в следующих публикациях: Tсa - в базе данных последовательностей EMBL под регистрационным номером U62584 (см. также у Kwon, 1997, Mol. Cells 7(2): 264-271); Tfl - у Akhmetzjanov и Vakhitov, 1992, Nucleic Acids Research 20(21): 5839; Tne - в WO 97/09451 и в WO 96/41014; Ath - в базе данных последовательностей EMBL под регистрационным номером Х98575 (более подробно штамм Ath описан у Rainey и др., 1993, J. Bacteriol. 175(15): 4772-4779); Bst - у Uemori и др., 1993, J. Biochem. 113: 401-410 и в базе данных последовательностей EMBL под регистрационным номером U23149 (см. также у Phang и др., 1995, Gene 163: 65-68). Аминокислотные последовательности Bst-полимеразы, содержащие "Е" в критическом мотиве в положении 658, также описаны в опубликованном японском патенте 05/304964 А, опубликованной европейской заявке ЕР-А-699760 и у Aliotta и др., 1996, Genet. Anal. 12: 185-195; последовательность также может быть получена из базы данных последовательностей EMBL под регистрационным номером U33536. Последовательность, как описано в Gene 163: 65-68 (1995), содержит остаток "Е" в положении 661 критического мотива. Вса-полимераза описана у Uemori и др., 1993, J. Biochem. 113: 401-410 и в базе данных последовательностей EMBL под регистрационным номером D12982. Термостабильная ДНК-полимераза из Thermus filiformis (см. FEMS Microbiol. Lett. 22: 149-153, 1994; также депонированная в АТСС под номером 43280) может быть восстановлена с использованием методов, описанных в патенте США 4889818, а также на основе информации о последовательности, представленной в таблице 1. Каждая из вышеуказанных последовательностей и публикаций включены в настоящее описание в качестве ссылки. Гомология (идентичность последовательности) между аминокислотной последовательностью нативной формы Taq-полимеразы, как указано в WO 89/06691, и последовательностью указанной ранее Tfl-полимеразы составляет более 87,4%. Соответствующая гомология с Tth-полимеразой составляет 87,4%, с Тса-полимеразой составляет 86,6%, с Bst-полимеразой (регистрационный номер U23149) составляет 42,0%, с Вса-полимеразой составляет 42,6% и с Ath-полимеразой составляет 39,7%.
Как видно из таблицы 1, критический мотив является заметно консервативным у термостабильных ДНК-полимераз. В случае, когда "X" обозначает остаток глутаминовой кислоты, изменение гена, кодирующего полимеразу, позволяет получить фермент по изобретению, который легко включает рНТФ по сравнению, например, с Taq-полимеразой, у которой критический мотив не модифицирован. Следовательно, изобретение относится к классу ферментов, который также включает, например, термостабильную ДНК-полимеразу, и к соответствующему гену и векторам экспрессии из Thermus oshimai (Williams и др., 1996, Int. J. Syst. Bacteriol. 46(2): 403-408); Thermus silvanus и Thermus chliarophilus (Tenreiro и др., 1995, Int. J. Syst. Bacteriol. 45(4): 633-639); Thermus scotoductus (Tenreiro и др., 1995, Res. Microbiol. 146(4): 315-324); Thermus brockianus (Munster, 1986, Gen. Microbiol. 132: 1677) и Thermus ruber (Loginov и др., 1984, Int. J. Syst. Bacteriol. 34: 498-499; также депонированные в АТСС под номером 35948). Кроме того, изобретение включает, например, модифицированные формы термостабильных ДНК-полимераз и соответствующие гены и векторы экспрессии из Thermotoga elfii (Ravot и др., 1995, Int. J. Syst. Bacteriol. 45: 312; также депонированные в DSM под номером 9442) и Thermotoga thermarum (Windberger и др., 1992, Int. J. Syst. Bacteriol. 42: 327; также депонированные в DSM под номером 5069). Каждая из вышеуказанных последовательностей и публикаций включены в настоящее описание в качестве ссылки.
В предпочтительном варианте подлежащий модификации критический мотив находится внутри аминокислотной последовательности LeuAspTyrSerGlnIleGluLeuArgValLeuAlaHisLeuSer (SEQ ID NO: 5). Таким образом, одним из предметов изобретения является получение мутантных термостабильных ДНК-полимераз, проявляющих существенно увеличенную эффективность по включению несвойственных нуклеотидов при использовании матрицы. В особенно предпочтительном примере последовательность полимеразы включает LeuAspTyrSerGlnIleGlyLeuArgValLeuAlaHisLeuSer (SEQ ID NO: 6). Такие термостабильные ДНК-полимеразы особенно пригодны в таких процессах, как секвенирование ДНК, синтез РНК на основе ДНК и синтез in vitro ДНК, имеющих в качестве заместителей рНТФ.
Получение термостабильных ДНК-полимераз с повышенной эффективностью по включению несвойственных оснований может быть осуществлено с помощью таких способов, как сайт-направленный мутагенез. См., например, публикацию Sambrook и др., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1989, второе издание, глава 15.51, "Oligonucleotide-Mediated Mutagenesis". Например, мутация, заключающаяся в замене "А" на "G" во втором положении кодона, кодирующего остаток глутаминовой кислоты 615 в последовательности гена ДНК-полимер