Флуоресцирующие белки из веслоногих ракообразных и способы их применения
Иллюстрации
Показать всеИзобретение относится к области генной инженерии и биотехнологии и может быть использовано для мечения биологических объектов. Выделена молекула нуклеиновой кислоты, которая кодирует флуоресцирующий белок, выбранный из флуоресцирующих белков представителей видов веслоногих ракообразных и флуоресцирующих мутантов указанных белков. Данную нуклеиновую кислоту функционально связывают с подходящими элементами регуляции экспрессии и используют в способе продуцирования флуоресцирующего белка. На основе этой выделенной нуклеиновой кислоты получены клонирующий и экспрессирующий векторы, а также экспрессирующая кассета. Клетка и стабильная клеточная линия, содержащие такую экспрессионную кассету, продуцируют флуоресцирующий белок. Флуоресцирующий белок, кодирующую его нуклеиновую кислоту и экспрессионные генетические конструкции, содержащие эту нуклеиновую кислоту, используют в наборе для мечения биологической молекулы. Флуоресцирующий белок используют также в способах мечения биологической молекулы, клетки или клеточной органеллы. Применение изобретения позволяет расширить арсенал средств для мечения биологических объектов. 12 н.п. ф-лы, 9 ил., 1 табл.
Реферат
Область, к которой относится изобретение
В общих чертах, настоящее изобретение относится к области биологии и химии. Более конкретно, настоящее изобретение относится к флуоресцирующим белкам.
Предшествующий уровень техники
Мечение представляющих интерес белков, клеток или организмов играет важную роль во многих областях биохимии, молекулярной биологии и клинической диагностики. Были разработаны и использованы различные метки, включая радиоактивные метки, хромогенные метки, флуоресцирующие метки, хемилюминесцентные метки и т.п., которые обладают различными свойствами и находят оптимальное применение. Однако в настоящее время не угасает интерес к разработке новых меток. Особый интерес представляет разработка новых белковых меток, включая флуоресцирующие белковые метки. Флуоресцирующие белки или флуоропротеины представляют собой белки, которые обнаруживают низкую, среднюю или интенсивную флуоресценцию при облучении светом с соответствующей длиной волны возбуждения. Флуоресцентные свойства этих белков обусловлены взаимодействием двух или более аминокислотных остатков белка, а не одним аминокислотным остатком. Как таковые флуоресцирующие белки не являются белками, способными флуоресцировать только благодаря остаткам, которые сами действуют как природные флуорофоры, то есть триптофан, тирозин и фенилаланин. Используемый здесь термин "флуоресцирующий белок" не включает люциферазы, такие как люцифераза Renilla.
Зеленый флуоресцирующий белок (GFP), его мутанты и гомологи хорошо известны в настоящее время благодаря их широкому применению в медико-биологических науках в качестве in vivo флуоресцирующих маркеров, подробно описанных Lippincott-Schwartz & Patterson in Science (2003) 300(5616):87-91). Было обнаружено, что GFP из гидроидной медузы Aequorea aequorea (синоним A. victoria), описанной Johnson et al. в работе J.Cell.Comp.Physiol. (1962), 60:85-104, является частью биолюминесцентной системы медуз, где GFP играет определенную роль как вторичный излучатель, преобразующий синий свет, излучаемый фотопротеином экворином, в зеленый свет. кДНК, кодирующая GFP A.victoria, была клонирована, как описано Prasher et al. (Gene (1992), 111(2):229-33). Было обнаружено, что этот ген может быть гетерологически экспрессирован практически в любом организме благодаря уникальной способности GFP самостоятельно образовывать флуорофор (Chalfie et al., Science 263 (1994), 802-805). Установление этого факта открывает широкие перспективы для применения GFP в биологии клетки в качестве генетически кодируемой флуоресцирующей метки.
GFP имеет широкий спектр применений, включая исследование экспрессии генов и локализации белков (Chalfie et al., Science 263 (1994), 802-805 и Heim et al., Proc. Natl. Acad. Sci. (1994), 91:12501-12504), в качестве средств для визуализации субклеточных органелл в клетках (Rizzuto et al., Curr. Biology (1995), 5:635-642), а также для визуализации транспорта белка по секреторному пути (Kaether & Gerdes, FEBS Letter (1995), 369:267-271).
Были проведены широкомасштабные исследования, направленные на улучшение свойств GFP и продуцирование реагентов GFP, используемых и оптимизированных для различных научных целей. Были разработаны новые варианты GFP, такие как ДНК "гуманизированного" GFP, белковый продукт которой на высоком уровне синтезируется в клетках млекопитающих (Haas et al., Current Biology (1996), 6:315-324; Yang et al., Nucleic Acids Research (1996), 24:4592-4593). Один из таких "гуманизированных" белков представляет собой "усиленный зеленый флуоресцирующий белок" (EGFP), то есть мутантный вариант GFP, имеющий две аминокислотных замены: F64L и S65T (Heim et al., Nature 373 (1995), 663-664). Другие мутации GFP приводят к образованию вариантов, излучающих синий, голубовато-зеленый и желто-зеленый свет.
Однако, несмотря на огромные преимущества GFP, могут быть использованы и другие флуоресцирующие белки, имеющие свойства, аналогичные свойствам GFP или отличающиеся от этих свойств. В частности, ценность новых флуоресцирующих белков заключается в их способности к переносу энергии флуоресцирующего резонансного излучения (FRET), на что указывают новые спектры, и к их способности к более сильному возбуждению. В 1999 г. гомологи GFP были клонированы из небиолюминисцентных видов Anthozoa (Matz et al., Nature Biotechnol. (1999) 17:969-973). Это открытие продемонстрировало, что такие белки не являются необходимым компонентом биолюминесцентного механизма. Из Anthozoa GFP-подобные белки обнаруживали сильно отличающиеся спектральные свойства, включая белки, флуоресцирующие в голубовато-зеленом, зеленом, желтом и красном диапазоне спектра, и хромопротеины, не флуоресцирующие в пурпурно-синем диапазоне спектра (СР) (Matz et al., Bioessays (2002), 24(10):953-959). Позже кДНК GFP-гомологов были клонированы из нескольких гидроидных медуз, включая Aequorea macrodactyla (GenBank, регистрационные номера AF435427-AF435433) и Aequorea coerulescens (Gurskaya et al., Biochem J. (2003), 373(Pt2):403-408). Таким образом, за 40-летнюю историю исследований GFP были выявлены GFP-подобные белки, принадлежащие только к двум классам Кишечнополостных (Cnidaria), Hydrozoa и Anthozoa.
Использование флуоресцирующих белков в качестве аналитических инструментов в молекулярной биологии послужило стимулом для поиска других флуоресцирующих белков с различными и улучшенными свойствами по сравнению с известными флуоресцирующими белками. Таким образом, целью по настоящему изобретению является получение новых флуоресцирующих белков, обладающих свойствами, пока еще не обнаруженными у известных флуоресцирующих белков, число которых и без того является ограниченным, а также получение ДНК, кодирующих флуоресцирующие белки, не имеющие недостатков, присущих известному GFP.
Описание сущности изобретения
Настоящее изобретение относится к молекулам нуклеиновой кислоты, кодирующим новые флуоресцирующие белки и их мутанты и производные. Указанная нуклеиновая кислота может быть выделена или синтезирована, либо она может присутствовать в ее неприродном окружении.
В некоторых своих вариантах настоящее изобретение относится к нуклеиновой кислоте, выделенной из видов веслоногих ракообразных (типа Arthropoda; подтипа Crustacea; класса Maxillopoda; подкласса Copepoda), или к ее мутантам или производным.
В некоторых вариантах осуществления изобретения нуклеиновая кислота по настоящему изобретению кодирует белок, который имеет аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26 или 28. В некоторых вариантах осуществления изобретения указанная нуклеиновая кислота кодирует гомолог, мутант, производное, миметик или фрагмент указанного белка.
В некоторых вариантах осуществления изобретения нуклеиновая кислота по настоящему изобретению имеет нуклеотидную последовательность, выбранную из группы, состоящей из SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25 или 27, или последовательность, гомологичную этой нуклеотидной последовательности, по существу аналогичную или идентичную этой последовательности. Последовательности нуклеиновой кислоты, которые отличаются от последовательностей нуклеиновой кислоты по настоящему изобретению вследствие вырожденности их генетического кода или вследствие их гибридизации с ними, также входят в объем настоящего изобретения.
В других вариантах своего осуществления настоящее изобретение относится к белкам, которые кодируются рассматриваемыми нуклеиновыми кислотами или по существу аналогичными им нуклеиновыми кислотами, или к гомологам, производным или мутантам указанных белков, либо настоящее изобретение относится к гибридным белкам, содержащим белки по настоящему изобретению.
В объем по настоящему изобретению также входят фрагменты нуклеиновых кислот по настоящему изобретению и нуклеиновые кислоты, которые гибридизуются в жестких условиях с нуклеиновыми кислотами по настоящему изобретению.
В других вариантах своего осуществления настоящее изобретение относится к векторам, содержащим нуклеиновую кислоту по настоящему изобретению. Кроме того, настоящее изобретение относится к экспрессионным кластерам, содержащим нуклеиновую кислоту по настоящему изобретению и регуляторные элементы, необходимые для экспрессии указанной нуклеиновой кислоты в нужной клетке-хозяине.
В еще одном варианте своего осуществления настоящее изобретение относится к способам продуцирования флуоресцирующего белка по настоящему изобретению, предусматривающим экспрессию белка в подходящей клетке-хозяине и выделение белка из этой клетки. Указанный способ предусматривает (а) получение молекулы нуклеиновой кислоты по настоящему изобретению, кодирующей флуоресцирующий белок, функционально связанный с подходящими элементами регуляции экспрессии; (b) экспрессию указанного флуоресцирующего белка из указанной молекулы нуклеиновой кислоты и (с) выделение белка, по существу не содержащего других белков.
Кроме того, настоящее изобретение относится к антителам, специфически связывающимся с белками по настоящему изобретению или с их фрагментами.
Кроме того, настоящее изобретение относится к клеткам-хозяевам, стабильным клеточным линиям, трансгенным животным и трансгенным растениям, содержащим нуклеиновые кислоты, векторы или экспрессионные кластеры по настоящему изобретению.
В еще одном варианте своего осуществления настоящее изобретение относится к олигонуклеотидам или зондам, содержащим нуклеотидные последовательности, способные гибридизоваться с рассматриваемыми нуклеиновыми кислотами.
Настоящее изобретение также относится к способам, в которых используется флуоресцирующий белок по настоящему изобретению или нуклеиновая кислота, кодирующая этот белок.
В предпочтительном варианте своего осуществления настоящее изобретение относится к способу мечения биологической молекулы, где указанный способ предусматривает связывание указанной биологической молекулы с белком по настоящему изобретению.
В другом своем предпочтительном варианте настоящее изобретение относится к способу мечения клетки, где указанный способ предусматривает продуцирование белка по настоящему изобретению в клетке.
В другом своем предпочтительном варианте настоящее изобретение относится к способу мечения клеточной органеллы, где указанный способ предусматривает продуцирование белка по настоящему изобретению, присоединенного к подходящему субклеточному сигналу локализации в клетке.
В еще одном своем предпочтительном варианте настоящее изобретение относится к способу анализа биологической молекулы, клетки или клеточной органеллы, где указанный способ предусматривает детекцию флуоресцирующего сигнала, поступающего от белка по настоящему изобретению.
В другом своем предпочтительном варианте настоящее изобретение относится к способу анализа биологической молекулы, клетки или клеточной органеллы, где указанный способ предусматривает экспрессию молекулы нуклеиновой кислоты по настоящему изобретению в клетке.
Кроме того, настоящее изобретение относится к наборам, содержащим нуклеиновые кислоты, векторы или экспрессионные кластеры, включающие указанные нуклеиновые кислоты или белки по настоящему изобретению.
Краткое описание фигур
На фигуре 1 показано сопоставление последовательностей путем выравнивания последовательностей новых флуоресцирующих белков веслоногих ракообразных (Copepoda) с последовательностями GFP A. victoria и DsRed. Нумерация дана по GFP. Вводимые пробелы показаны точками. GFP Copepoda сравнивают с ppluGFP1: в их последовательностях остатки, идентичные соответствующим аминокислотам в ppluGFP1, показаны пунктиром.
На фигуре 2 проиллюстрированы спектры возбуждения (пунктирная линия) и спектры излучения (сплошная линия) ppluGFP1 дикого типа (ppluGFP2 имеет по существу аналогичные спектры).
На фигуре 3 проиллюстрированы спектры возбуждения (пунктирная линия) и спектры излучения (сплошная линия) laesGFP дикого типа.
На фигуре 4 проиллюстрированы спектры возбуждения (пунктирная линия) и спектры излучения (сплошная линия) pmeaGFP1 дикого типа.
На фигуре 5 проиллюстрированы спектры возбуждения (пунктирная линия) и спектры излучения (сплошная линия) pmeaGFP2 дикого типа.
На фигуре 6 проиллюстрированы спектры возбуждения (пунктирная линия) и спектры излучения (сплошная линия) pmedGFP1 дикого типа.
На фигуре 7 проиллюстрированы спектры возбуждения (пунктирная линия) и спектры излучения (сплошная линия) pmedGFP2 дикого типа.
На фигуре 8 проиллюстрированы спектры возбуждения (пунктирная линия) и спектры излучения (сплошная линия) pdae1GFP дикого типа.
На фигуре 9 проиллюстрированы спектры возбуждения (пунктирная линия) и спектры излучения (сплошная линия) CopCFP.
Подробное описание изобретения
Как уже было вкратце описано выше, настоящее изобретение относится к молекулам нуклеиновой кислоты, кодирующим флуоресцирующие белки и их мутанты, варианты и производные, а также белки и пептиды, кодируемые этими нуклеиновыми кислотами. Представляющие интерес молекулы нуклеиновой кислоты и белки выделены из видов веслоногих ракообразных (Copepoda). Представляющими интерес белками являются зеленые флуоресцирующие белки, ppluGFP1 (SEQ ID NO:2), ppluGFP2 (т.е. CopGFP, SEQ ID NO:4), laesGFP (SEQ ID NO:6), pmeaGFP1 (SEQ ID NO:8), pmeaGFP2 (SEQ ID NO:10), pdae1GFP (SEQ ID NO:16), pmedGFP1 (SEQ ID NO:12) и pmedGFP2 (SEQ ID NO:14). Интерес представляют также белки, которые являются по существу аналогичными вышеупомянутым конкретным белкам, или их производные, гомологи или мутанты. Настоящее изобретение также относится к фрагментам нуклеиновых кислот и к пептидам, кодируемым этими фрагментами, а также к антителам, специфичным к таким белкам и пептидам по настоящему изобретению. Кроме того, настоящее изобретение относится к клеткам-хозяевам, стабильным клеточным линиям и трансгенным организмам, содержащим вышеупомянутые молекулы нуклеиновой кислоты. Рассматриваемые композиции белков и нуклеиновых кислот могут быть использованы в различных целях, и они могут найти применение в различных способах, а в частности в способах мечения белков. И, наконец, настоящее изобретение относится к наборам для использования в указанных способах и целях.
Молекулы нуклеиновой кислоты
Настоящее изобретение относится к молекулам нуклеиновой кислоты, кодирующим флуоресцирующие белки из видов веслоногих ракообразных (Copepoda), производные, мутанты и гомологи этих белков, а также их фрагменты. Используемые здесь молекулы нуклеиновой кислоты представляют собой молекулы ДНК, такие как геномные молекулы ДНК или молекулы кДНК либо молекулы РНК, такие как молекулы мРНК. В частности, указанные молекулы нуклеиновой кислоты представляют собой молекулы кДНК, имеющие открытую рамку считывания, кодирующую флуоресцирующий белок Copepoda по настоящему изобретению или его фрагмент, и обладающие способностью в определенных условиях экспрессироваться в виде флуоресцирующего белка или фрагмента белка (пептида) по настоящему изобретению. Настоящее изобретение также охватывает нуклеиновые кислоты, которые являются гомологичными по существу аналогичными или идентичными нуклеиновым кислотам, кодирующим белки или фрагменты белков по настоящему изобретению, или которые происходят из указанных нуклеиновых кислот или являются их миметиками. Рассматриваемые нуклеиновые кислоты присутствуют в окружении, которое не является их природным окружением, например, эти нуклеиновые кислоты либо являются выделенными, либо присутствуют в повышенном количестве, либо присутствуют или экспрессируются in vitro или в клетке или организме, в которых они обычно не встречаются в природе.
Конкретные представляющие интерес молекулы нуклеиновой кислоты могут быть выделены из организма типа Arthropoda, предпочтительно подтипа Crustacea, более предпочтительно класса Maxillopoda, более предпочтительно подкласса Copepoda, еще более предпочтительно отряда Calanoida и наиболее предпочтительно семейства Pontellidae.
Конкретными представляющими интерес молекулами нуклеиновой кислоты являются молекулы нуклеиновой кислоты, кодирующие нижеследующие зеленые флуоресцирующие белки Copepoda (и их гомологи/производные/мутанты): белки ppluGFP1, ppluGFP2 из Pontellina plumata, laesGFP из Labidocera aestiva, белки pmeaGFP1 и pmeaGFP2 из сем. Pontella meadi Wheeler, белки pmeadGFP1 и pmedGFP2 из Pontella mediterranea, и белок pdae1GFP из неидентифицированного вида Pontellidae. Каждый из конкретных типов этих представляющих интерес молекул нуклеиновой кислоты более подробно обсуждается ниже в экспериментальной части. Особый интерес также представляют гомологи/мутанты/производные этих белков, такие как CopCFP, CopGFP-NA1-3, более подробно описанные ниже в экспериментальной части. Выведенные кодирующие последовательности кДНК дикого типа для этих белков представлены в SEQ ID NO:1, 3, 5, 7, 9, 11, 13, 15.
Также представляют интерес гомологи вышеописанных молекул нуклеиновой кислоты. Источником гомологичных нуклеиновых кислот может быть любой вид растений или животных, либо указанная последовательность может быть полностью или частично синтезированной, включая миметики нуклеиновой кислоты. В некоторых вариантах изобретения нуклеиновая кислота по настоящему изобретению имеет последовательность, идентичную соответствующим гомологам на нуклеотидном или аминокислотном уровнях, по крайней мере, примерно на 40%, а предпочтительно примерно на 50%, 55%, 60%, 65%, 70% или выше, а именно на 75%, 80%, 85%, 90%, 95% или выше. Эталонная последовательность обычно имеет длину, по крайней мере, примерно в 30 нуклеотидов, а обычно, по крайней мере, примерно в 60 нуклеотидов, и ее длина может достигать длины полноразмерной последовательности, выбранной для сравнения. Сходство последовательностей вычисляют исходя из эталонной последовательности. Алгоритмы для анализа последовательностей известны специалистам, например, такие как BLAST, описанный Altschul et al., J.Mol.Biol., 215, pp.403-10 (1990) (например, с использованием параметров по умолчанию, то есть параметров w=4 и Т=17).
Гомологи могут быть идентифицированы любым из имеющихся различных методов. Фрагмент кДНК по настоящему изобретению может быть использован в качестве гибридизационного зонда против кДНК-библиотеки, полученной из организма-мишени, с использованием условий низкой жесткости. Этот зонд может представлять собой большой фрагмент или один или несколько коротких вырожденных праймеров. Нуклеиновые кислоты, имеющие сходство, детектируют путем гибридизации в условиях низкой жесткости, например, при 50°С и 6×SSC (0,9 М хлорид натрия/0,9 М цитрат натрия) с последующей промывкой при 55°С в 1×SSC (150 мМ хлорид натрия/15 мМ цитрат натрия). Идентичность последовательности может быть определена путем гибридизации в условиях высокой жесткости, например, при 50°С или выше, при 0,1×SSC (15 мМ хлорид натрия/1,5 мМ цитрат натрия). Нуклеиновые кислоты, имеющие область, по существу идентичную рассматриваемым последовательностям, например аллельные варианты, генетически модифицированные варианты нуклеиновой кислоты и т.п., связываются с рассматриваемыми последовательностями в условиях гибридизации высокой жесткости. С использованием зондов, а в частности меченых зондов ДНК-последовательностей, можно выделить гомологичные или родственные гены.
Настоящее изобретение также относится к нуклеиновым кислотам, которые гибридизуются с вышеуказанными нуклеиновыми кислотами в жестких условиях, а предпочтительно в условиях высокой жесткости (то есть к нуклеиновым кислотам, комплементарным вышеописанным нуклеиновым кислотам). Примером гибридизации в жестких условиях является гибридизация при 50°С или выше, при 0,1×SSC (15 мМ хлорид натрия/1,5 мМ цитрат натрия). Другим примером условий гибридизации высокой жесткости является инкубирование при 42°С в растворе 50% формамида, 5×SSC, 50 мМ фосфата натрия (рН 7,6), 5% раствора Денхардта, 10% сульфата декстрана и 20 мкг/мл денатурированной фрагментированной ДНК спермы лосося, с последующей промывкой в 0,1×SSC примерно при 65°С. Другие условия гибридизации высокой жесткости известны специалистам и могут быть также использованы для идентификации нуклеиновых кислот по настоящему изобретению.
Настоящее изобретение также относится к нуклеиновым кислотам, кодирующим варианты, мутанты или производные белков по настоящему изобретению. Мутанты или производные могут быть генерированы на матричной нуклеиновой кислоте, выбранной из вышеупомянутых нуклеиновых кислот, путем модификации, делеции или добавления одного или нескольких нуклеотидов в матричной последовательности или их комбинации, с продуцированием матричной нуклеиновой кислоты. Указанные модификации, добавления или делеции могут быть введены любым известным методом (см., например, Gustin et al., Biotechniques (1993) 14:22; Barany, Gene (1985) 37:111-123; и Colicelli et al., Mol. Gen. Genet. (1985) 199:537-539, Sambrook, J.,, Molecular Cloning: A Laboratory manual (1989), CSH Press, pp.15.3-15.108), включая ПЦР с вероятностью ошибки, перетасовку генов, олигонуклеотид-направленный мутагенез, ПЦР полноразмерной последовательности, мутагенез для проведения ПЦР по определению половой принадлежности, in vivo мутагенез, кластерный мутагенез, рекурсивный статистический мутагенез, экспоненциальный статистический мутагенез, сайт-направленный мутагенез, неспецифический мутагенез, мутагенез при вторичной сборке генов, сайт-насыщенный мутагенез (GSSM), мутагенез при вторичной сборке, синтезированной путем лигирования (SLR) или их комбинации. Указанные модификации, добавления или делеции могут быть введены методом, предусматривающим рекомбинацию, рекомбинацию рекурсивной последовательности, мутагенез с помощью фосфотиоат-модифицированной ДНК, мутагенез с помощью урацил-содержащей матрицы, мутагенез с образованием дуплексов с брешами, мутагенез при репарации точковых несоответствий, мутагенез штамма-хозяина, дефицитного по репарации, химический мутагенез, радиогенный мутагенез, делеционный мутагенез, рестрикционно-селективный мутагенез, мутагенез при рестрикционной очистке, синтез искусственных генов, статистический мутагенез, создание химерных мультимеров нуклеиновых кислот и их комбинации. В некоторых вариантах осуществления изобретения флуоресцирующие белки, кодируемые мутантными или производными нуклеиновыми кислотами, обладают такими же флуоресцентными или биологическими свойствами, как и флуоресцирующие белки дикого типа. В других вариантах осуществления изобретения мутантные или производные нуклеиновые кислоты кодируют флуоресцирующие белки с измененными свойствами, описанными более подробно для мутантов CopCFP, CopCFP-NA1-3, см. ниже.
Кроме того, настоящее изобретение также относится к вырожденным вариантам нуклеиновых кислот, кодирующим белки по настоящему изобретению. Вырожденные варианты нуклеиновых кислот включают замены кодонов нуклеиновой кислоты другими кодонами, кодирующими те же самые аминокислоты. В частности, вырожденные варианты нуклеиновых кислот генерируют в целях усиления их экспрессии в клетке-хозяине. В этом варианте изобретения кодоны нуклеиновой кислоты, которые не являются предпочтительными или являются менее предпочтительными в генах данной клетки-хозяина, заменяют кодонами, более часто встречающимися в кодирующих последовательностях генов в данной клетке-хозяине, где указанные замененные кодоны кодируют ту же самую аминокислоту. Особый интерес представляют "гуманизированные" варианты нуклеиновых кислот по настоящему изобретению. Используемый здесь термин "гуманизированный" относится к заменам, сделанным в последовательности нуклеиновой кислоты для оптимизации кодонов для экспрессии белка в клетках млекопитающего (человека) (Yang et al., Nucleic Acids Research (1996) 24:4592-4593). См. также патент США №5795737, в котором описана гуманизация белков и описание которого вводится в настоящее описание посредством ссылки. Примеры представляющих интерес вырожденных вариантов более подробно описаны ниже в экспериментальной части.
Используемый здесь термин "кДНК" означает нуклеиновые кислоты, которые имеют одно и то же расположение элементов последовательности, присутствующих в нативных зрелых молекулах мРНК, где элементами последовательности являются экзоны и 5'- и 3'-некодирующие области. Обычно молекулы мРНК имеют смежные экзоны; при этом интроны, если они присутствуют, удаляются при сплайсинге ядерной РНК, в результате чего образуется непрерывная открытая рамка считывания, кодирующая данный белок.
Представляющая интерес геномная последовательность может содержать нуклеиновую кислоту, присутствующую между кодоном инициации и стоп-кодоном, определенными в указанных последовательностях, включая все интроны, которые обычно присутствуют в природной хромосоме. Представляющая интерес геномная последовательность может, кроме того, включать 5'- и 3'-нетранслируемые области, присутствующие в зрелой мРНК, а также последовательности, регулирующие транскрипцию и трансляцию, такие как промоторы, энхансеры и т.п., включающие примерно 1 т.п.н., а возможно даже фланкирующую геномную ДНК либо у 5'-, либо у 3'-конца транскрибируемой области.
Молекулы нуклеиновой кислоты по настоящему изобретению могут кодировать все рассматриваемые белки или их часть. Двухцепочечные или одноцепочечные фрагменты могут быть получены из ДНК-последовательности путем химического синтеза олигонуклеотидов стандартными методами, путем гидролиза рестриктирующими ферментами, путем ПЦР-амплификации и т.п. В большинстве случаев ДНК-фрагменты имеют длину, по крайней мере, примерно в 15 нуклеотидов, а обычно, по крайней мере, примерно в 18 нуклеотидов или примерно 25 нуклеотидов, и они могут иметь длину, по крайней мере, примерно в 50 нуклеотидов. В некоторых вариантах осуществления изобретения рассматриваемые молекулы нуклеиновой кислоты могут иметь длину примерно в 100, 200, 300, 400, 500, 600, 700 нуклеотидов или более. Рассматриваемые нуклеиновые кислоты могут кодировать фрагменты рассматриваемых белков или полноразмерных белков, так, например, рассматриваемые нуклеиновые кислоты могут кодировать полипептиды, имеющие длину примерно 25, 50, 75, 100, 125, 150, 200 аминокислот, вплоть до полноразмерного белка.
Рассматриваемые нуклеиновые кислоты могут быть выделены и получены по существу в очищенной форме. Термин "по существу очищенная форма" означает, что нуклеиновые кислоты имеют, по крайней мере, примерно 50%-ную чистоту, а в основном, по крайней мере, примерно 90%-ную чистоту, и обычно являются "рекомбинантными", т.е. фланкированными одним или несколькими нуклеотидами, с которыми они обычно не ассоциированы на природной хромосоме в природном организме-хозяине.
Нуклеиновые кислоты по настоящему изобретению, например, имеющие последовательности SEQ ID NO:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25 или 27, соответствующие кДНК, полноразмерные гены и конструкции, могут быть синтезированы в соответствии с различными протоколами, известными специалистам. Соответствующие конструкции нуклеиновых кислот очищают стандартными методами рекомбинантных ДНК, описанными, например, в руководстве Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., (1989) Cold Spring Harbor Press, Cold Spring Harbor, NY, и в соответствии с директивами, утвержденными Департаментом Здравоохранения и социальной службы Соединенных Штатов при Национальном институте здравоохранения (NIH), для исследования рекомбинантных ДНК.
Настоящее изобретение также относится к нуклеиновым кислотам, кодирующим гибридные белки, содержащие белок по настоящему изобретению или его фрагменты, которые более подробно обсуждаются ниже.
Настоящее изобретение также относится к векторам и к другим конструкциям нуклеиновых кислот, содержащим рассматриваемые нуклеиновые кислоты. Подходящими векторами являются вирусные и невирусные векторы, плазмиды, космиды, фаги и т.п., а предпочтительно плазмиды, используемые для клонирования, амплификации, экспрессии, переноса и т.п. последовательности нуклеиновой кислоты по настоящему изобретению в соответствующем хозяине. Выбор соответствующего вектора хорошо известен специалистам, и многие из таких векторов являются коммерчески доступными. Для получения конструкций неполную или полноразмерную нуклеиновую кислоту встраивают в вектор обычно путем присоединения ДНК-лигазы к сайту расщепления рестриктирующими ферментами в данном векторе. Альтернативно, нужная нуклеотидная последовательность может быть встроена путем гомологичной рекомбинации in vivo, обычно путем присоединения гомологичных областей к вектору по концам нужной нуклеотидной последовательности. Гомологичные области присоединяют путем лигирования олигонуклеотидов или посредством полимеразной цепной реакции с использованием праймеров, содержащих, например, как гомологичную область, так и часть нужной нуклеотидной последовательности.
Настоящее изобретение также относится к экспрессионным кластерам или к системам, используемым inter alia для продуцирования рассматриваемых хромогенных или флуоресцирующих белков или их гибридных белков, или для репликации рассматриваемых молекул нуклеиновой кислоты. Экспрессионный кластер может присутствовать в виде внехромосомного элемента, либо он может быть интегрирован в геном клетки в результате введения указанного экспрессионного кластера в эту клетку. В целях осуществления экспрессии генный продукт, кодируемый нуклеиновой кислотой по настоящему изобретению, экспрессируют в любой подходящей экспрессионной системе, включая, например, бактериальные системы, дрожжевые системы, системы насекомых, системы амфибий или системы млекопитающих. В данном экспрессирующем векторе рассматриваемая нуклеиновая кислота функционально связана с регуляторной последовательностью, которая может включать промоторы, энхансеры, терминаторы, операторы, супрессоры и индукторы. Методы получения экспрессионных кластеров или систем, способных экспрессировать нужный продукт, известны специалистам.
Клеточные линии, стабильно экспрессирующие белки по настоящему изобретению, могут быть отобраны методами, известными специалистам (например, путем ко-трансфекции с селективным маркером, таким как dhfr, gpt, ген резистентности к неомицину и ген резистентности к гигромицину, что позволяет идентифицировать и выделять трансфецированные клетки, содержащие ген, интегрированный в геном.
Вышеописанные системы экспрессии могут быть использованы в прокариотических или в эукариотических хозяевах. Для продуцирования белка могут быть использованы клетки-хозяева, такие как E.coli, B. subtilis, S. cerevisiae, клетки насекомых в комбинации с бакуловирусными векторами, или клетки высших организмов, таких как позвоночные, например клетки COS 7, НЕК 293, СНО, ооциты Xenopus и т.п.
Если любая из вышеуказанных клеток-хозяев или других подходящих клеток-хозяев или организмов используется для репликации экспрессируемых нуклеиновых кислот по настоящему изобретению, то полученные в результате реплицированные нуклеиновые кислоты, экспрессированный белок или полипептид входят в объем настоящего изобретения как продукт клетки или организма-хозяина. Этот продукт может быть выделен соответствующими методами, известными специалистам.
Интерес представляют также промоторные последовательности геномных последовательностей по настоящему изобретению, где последовательность 5'-фланкирующей области может быть использована для промоторных элементов, включая сайты связывания энхансера, которые, например, обеспечивают регуляцию экспрессии в клетках/тканях, где экспрессируется рассматриваемый ген белка.
Настоящее изобретение также относится к небольшим ДНК-фрагментам рассматриваемых нуклеиновых кислот, которые могут быть использованы в качестве праймеров для ПЦР, зондов для скрининга гибридизации и т.п. Более крупные ДНК-фрагменты могут быть использованы для продуцирования кодируемого полипептида, описанного выше. Однако для использования в реакциях геометрической амплификации, таких как геометрическая ПЦР, может оказаться подходящей пара небольших ДНК-фрагментов, то есть праймеров. Точный состав праймерных последовательностей не имеют решающего значения для настоящего изобретения, однако в большинстве случаев праймеры должны гибридизоваться с рассматриваемой последовательностью в жестких условиях, известных специалистам. Предпочтительно выбирать такую пару праймеров, которая генерировала бы продукт амплификации, состоящий, по крайней мере, примерно из 50 нуклеотидов, а предпочтительно, по крайней мере, примерно из 100 нуклеотидов, либо продукт, имеющий полноразмерную последовательность нуклеиновой кислоты. Алгоритмы для отбора праймерных последовательностей в основном известны специалистам и поставляются с коммерчески доступными пакетами программ. Праймеры для амплификации гибридизируются с комплементарными цепями ДНК и служат затравкой по отношению друг к другу.
Молекулы нуклеиновой кислоты по настоящему изобретению могут быть также использованы для идентификации экспрессии гена в биологическом образце. Способ, в котором клетки зондируют на присутствие конкретных нуклеотидных последовательностей, таких как геномная ДНК или РНК, хорошо известен специалистам. Вкратце, ДНК или мРНК выделяют из клеточного образца. мРНК может быть амплифицирована с помощью ОТ-ПЦР с использованием обратной транскриптазы с образованием комплементарной ДНК-цепи и последующей амплификацией посредством полимеразной цепной реакции с использованием праймеров, специфичных для рассматриваемых ДНК-последовательностей. Альтернативно, образец мРНК выделяют с помощью гель-электрофореза, переносят на подходящий носитель, например нитроцеллюлозу, найлон и т.п., а затем зондируют фрагментом рассматриваемой ДНК, используемым в качестве зонда. Могут быть использованы и другие методы, такие как анализы на лигирование олигонуклеотидов, in situ гибридизация и гибридизация с ДНК-зондами, составляющими массив на твердом чипе. Детекция мРНК, гибридизирующейся с рассматриваемой последовательностью, является показателем экспрессии гена в образце.
Рассматриваемые нуклеиновые кислоты, включая фланкирующие промоторные области и кодирующие области, могут быть мутированы различными известными методами, используемыми специалистами для генерирования нужных изменений силы промотора или для изменения последовательности кодируемого белка или свойств кодируемого белка, включая флуоресцентные свойства кодируемого белка.
Белки
Настоящее изобретение также относится к флуоресцирующим белкам Copepoda, к их производным или мутантам, включая полноразмерные белки, а также к их частям или фрагментам. Настоящее изобретение также относится к вариантам природного белка, где указанные варианты являются гомологичными или по существу аналогичными природному белку, и к мутантам природных белков, более подробно описанных ниже.
Во многих вариантах осуществления изобретения рассматриваемые белки имеют максимальную оптическую плотность при длине волны в пределах примерно от 300 нм до 700 нм, обычно примерно от 350 нм до 550 нм, в основном примерно от 450 нм до 550 нм, а чаще всего примерно от 470 нм до 520 нм, например от 470 до 500 нм, а спектры излучения рассматриваемых белков обычно составляют в пределах от 400 нм до 700 нм, обычно примерно от 450 нм до 650 нм, а в основном примерно от 480 нм до 600 нм, а во многих вариантах осуществления изобретения спектры излучения составляют в пределах примерно от 480 нм до 550 нм, например от 490 до 520 нм или от 490 до 510 нм. Рассматриваемые белки обычно имеют максимальный коэффициент экстинкции, который составляет в пределах примерно от 25000 до 150000, а обычно примерно от 45000 до 120000, например от 50000 до 100000. Рассматриваемые белки обычно имеют длину примерно от 150 до 300 аминокислот, а обычно примерно от 200 до 300 аминокислотных остатков, а их молекулярная масса в основном составляет в пределах примерно от 15 до 35 кДа, а обычно примерно от 17,5 до 32,5 кДа.
В некоторых вариантах осуществления изобретения рассматриваемые белки дают яркую флуоресценцию, где термин "яркий" означает, что хромогенные и флуоресцирующие белки могут быть детектированы общеизвестными методами (например, путем визуального скрининга, спектрофотометрии, спектрофлуориметрии, флуоресцентной микроскопии, FACS-сортинга и т.п.). Яркость флуоресценции конкретных флуоресцирующих белков определяют по ее квантовому выходу, умноженному на максимальный коэффициент экстинкции. Яркость хромопротеинов может быть выражена по их максимальному коэффициенту экстинкции.
В некоторых вариантах осуществления изобретения рассматриваемые белки быстро подвергаются сборке после их экспрессии в клетке-хозяине. Термин "быстрая сборка" означает, что данные белки образуют свою третичную структуру, которая п