Последовательность днк, кодирующая белок ehrlichia canis с молекулярной массой 30 килодальтон, вектор, рекомбинантный белок и способ его получения
Реферат
Изобретение относится к области молекулярной биологии. Предложена последовательность ДНК, кодирующая белок Ehrlichia canis с молекулярной массой 30 килодальтон. Также предложены вектор для получения белка, содержащий последовательность ДНК, рекомбинантный белок для получения антител, выбранный из группы, состоящей из SEQ ID NO:4 и 6, и способ его получения. Рекомбинантный белок Ehrlichia canis с молекулярной массой 30 килодальтон иммунореактивен к сыворотке против Ehrlichia canis. Предложенная группа изобретений может быть использована для создания вакцин против эрлихиоза собак. 4 с. и 8 з.п. ф-лы, 10 ил.
Предпосылки изобретения
Область изобретения
Настоящее изобретение касается в целом области молекулярной биологии. Более конкретно настоящее изобретение касается молекулярного клонирования и характеристики генов, кодирующих гомологичные белки молекулярной массой 28 кДа, у Ehrlichia canis и мультигенного локуса, кодирующего гомологичные белки массой 28 кДа у Ehrlichia canis, а также их использования.
Описание уровня техники
Эрлихиоз собак, также известный как тропическая панцитопения собак, - переносимый клещами риккетсиоз домашних собак, впервые описанный в Африке в 1935 году и в США в 1963 году (Donatiеn & Lestoquard, 1935; Ewing, 1963). Заболевание стало лучше диагностируемым после эпизоотической вспышки, произошедшей у армейских собак США в ходе Вьетнамской войны (Walker et al., 1970).
Агентом-возбудителем эрлихиоза собак является Ehrlichia canis - небольшая грам-отрицательная облигатно внутриклеточная бактерия, которая проявляет тропизм в отношении моноядерных фагоцитов (Nyindo et al., 1971) и переносится обыкновенным собачьим клещом Rhipicephalus sanguineus (Groves et al., 1975). Развитие эрлихиоза собак подразделяется на три стадии - острую, субклиническую и хроническую. Острая стадия характеризуется лихорадкой, анорексией, депрессией, лимфаденопатией и мягкой тромбоцитопенией (Troy & Forrester, 1990). Обычно собаки выздоравливают после острой стадии, но становятся постоянно инфицированными носителями возбудителя без клинических симптомов заболевания в течение месяцев и даже лет (Harrus et al., 1998). Хроническая стадия, развивающаяся в некоторых случаях, характеризуется тромбоцитопенией, гиперглобулинемией, анорексией, истощением и кровотечениями, в частности носовым кровотечением, с последующей смертью (Troy & Forrester, 1990).
Молекулярно-таксономический анализ, основанный на параметрах гена 163-рРНК, определил, что E.canis и E.chaffeensis, являющаяся возбудителем моноцитарного эрлихиоза человека (МЭХ), близкородственны (Anderson et al., 1991; Andersоn et al., 1992; Dawson et al., 1991; Chen et al., 1994). Сообщалось о существенной перекрестной реактивности антигенов с молекулярными массами 64, 47, 40, 30, 29 и 23 кДа у E.canis и E.chaffeensis (Chen et al., 1994; Chen et al., 1997; Rikihisa et al., 1994; Rikihisa et al., 1992). Анализ методом иммуноблоттинга иммунореактивных антигенов из сывороток человека и собаки, взятых в период выздоровления, позволил идентифицировать многочисленные иммунодоминантные белки E.canis, включая белок с молекулярной массой 30 кДа (Chen et al., 1997). Кроме того, белок массой 30 кДа E.canis был описан как основной иммунодоминантный антиген, распознаваемый ранним иммунным ответом, который по антигенным свойствам отличается от белка массой 30 кДа E.chaffeensis (Rikihisa et al., 1992; Rikihisa et al., 1994). Другие иммунодоминантные белки E.canis с молекулярными массами в диапазоне 20-30 кДа также были идентифицированы (Brouqui et al., 1992; Nyindo et al., 1991; Chen et al., 1994; Chen et al., 1997).
Недавно клонирование и секвенирование мультигенного семейства (оmр-1), кодирующего белки с массой 23-28 кДа, было описано у E.chaffeensis (Ohashi et al., 1998). Был клонирован ген иммунодоминантного белка внешней мембраны массой 28 кДа (р28) у E.chaffeensis, гомологичный гену map-1 Cowdria ruminantium. Мыши, иммунизованные рекомбинантным белком Р28, оказывались защищенными против инфицирования гомологичным штаммом в соответствии с данными ПЦР-анализа периферической крови через 5 дней после инфекции (Ohashi et al., 1998). Также было сообщено о молекулярном клонировании двух сходных, но неидентичных тандемно организованных генов белков массой 28 кДа у E.canis, гомологичных генному семейству оmр-1 E.chaffeensis и гену mар-1 С.ruminantium (Reddy et al., 1998).
Для уровня техники характерно отсутствие данных по клонированию и характеристике новых генов гомологичных иммунореактивных белков массой 28 кДа у Ehrlichia canis и единого мультигенного локуса, включающего гены гомологичных белков массой 28 кДа. Кроме того, в известном уровне техники отсутствуют данные по рекомбинантным белкам, кодируемым такими иммунореактивными генами у Ehrlichia canis. Настоящее изобретение заполняет этот давно существующий пробел и назревшую потребность данной области техники.
Сущность изобретения
Настоящее изобретение описывает молекулярное клонирование, секвенирование, охарактеризование и экспрессию генов гомологичных зрелых иммунореактивных белков массой 28 кДа у Ehrlichia canis (обозначенных Еса28-1, ECa28SA3 и ECa28SA2), a также идентификацию единого локуса (5592 пары нуклеотидов (п.н.)), включающего пять генов белков массой 28 кДа Ehrlichia canis (ECa28SAl, ECa28SA2, ECa28SA3, Еса28-1 и ЕСа28-2). Сравнения с E.chaffeensis и между генами белков массой 28 кДа Е.canis показали, что ЕСа28-1 проявляет наиболее высокий уровень гомологии аминокислотных последовательностей с мультигенным семейством omp-1 E.chaffeensis и высококонсервативен среди изолятов Е.canis. Пять белков массой 28 кДа, как предсказывается, включают сигнальные сегменты, отщепление которых дает зрелые белки, а уровень аминокислотной гомологии находится в диапазоне 51-72%. Анализ межгенных спейсеров выявил гипотетические промоторные участки для каждого гена: это подтверждает, что данные гены могут быть экспрессированы независимо и дифференцированно. Размер некодирующих межгенных спейсеров составляет от 299 до 355 п.н., и они гомологичны на 48-71%.
В одном осуществлении настоящее изобретение относится к последовательностям ДНК, кодирующим иммунореактивный белок массой 30 кДа Ehrlichia canis. Предпочтительно белок имеет аминокислотную последовательность, выбранную из группы, которая включает SEQ ID NO: 2, SEQ ID NO: 4 и SEQ ID NO: 6, а ген имеет нуклеотидную последовательность, выбранную из группы, которая включает SEQ ID NO: 1, SEQ ID NO: 3 и SEQ ID NO: 5, и входит в состав полиморфного мультигенного семейства. Как правило, белок включает N-концевую сигнальную последовательность, которая отщепляется в ходе посттрансляционного процессинга, в результате чего образуется зрелый белок массой 28 кДа. Еще более предпочтительно ДНК, кодирующие белки массой 28 кДа, входят в состав единого мультигенного локуса, размер которого составляет 5592 п.н. и который кодирует все пять гомологичных белков массой 28 кДа у Ehrlichia canis.
В другом осуществлении настоящее изобретение относится к экспрессирующему вектору, включающему ген, кодирующий иммунореактивный белок массой 28 кДа Ehrlichia canis, способный экспрессировать ген по внесении вектора в клетку.
Еще в одном осуществлении настоящее изобретение относится к рекомбинантному белку, включающему аминокислотную последовательность, выбранную из группы, которая включает SEQ ID NO: 2, SEQ ID NO: 4 и SEQ ID NO: 6. Предпочтительно аминокислотная последовательность кодируется последовательностью нуклеиновой кислоты, выбранной из группы, которая включает SEQ ID NO: I, SEQ ID NO: 3 и SEQ ID NO: 5. Предпочтительно рекомбинантный белок включает четыре вариабельных расположенных на клеточной поверхности участка, являющихся гидрофильными и антигенными. Рекомбинантный белок можно использовать в качестве антигена.
Еще в одном осуществлении настоящее изобретение относится к способу получения рекомбинантного белка, включающему стадии получения вектора, который включает экспрессирующий участок, включающий последовательность, которая кодирует аминокислотную последовательность, выбранную из группы, которая включает SEQ ID NO: 2, SEQ ID NO: 4 и SEQ ID NO: 6, функционально присоединенный к промотору; трансфекцию клетки вектором; и культивирование клетки в условиях, эффективных для экспрессии экспрессирующего участка.
Также настоящее изобретение может быть описано в некоторых осуществлениях как способ подавления инфекции Ehrlichia canis у субъекта, включающий стадии: идентификации субъекта, для которого предполагается воздействие или инфекция Ehrlichia canis; и введение композиции, содержащей антиген массой 28 кДа Ehrlichia canis, в количестве, эффективном для подавления инфекции Ehrlichia canis. Подавление может происходить любыми путями, такими как, например, стимуляция у субъекта гуморального или клеточного иммунных ответов, или за счет других путей, таких как подавление нормальной функции антигена массой 28 кДа, или даже конкуренция с антигеном за взаимодействие с некоторым агентом в организме субъекта.
Другие и последующие аспекты, свойства и преимущества настоящего изобретения будут ясны из нижеследующего описания рассматриваемых предпочтительных осуществлении изобретения, приводимых в связи с целью его раскрытия.
Краткое описание чертежей
С учетом того, что материал, в котором понятны указанные выше свойства, преимущества и объекты настоящего изобретения, а также и другое, что становится ясным, изложен и может быть понят в деталях, более подробное описание изобретения, краткое содержание которого было дано выше, может быть выполнено путем ссылки на некоторые его осуществления, которые проиллюстрированы на прилагающихся чертежах. Эти чертежи образуют часть данной заявки. Необходимо отметить, однако, что прилагающиеся чертежи иллюстрируют предпочтительные осуществления настоящего изобретения и, следовательно, не призваны ограничить его объем.
На фигуре 1 показаны нуклеотидная последовательность (SEQ ID NO: 1) и расшифрованная аминокислотная последовательность (SEQ ID NO: 2) гена ЕСа28-1, включая фланкирующие 5’- и 3’-некодирующие последовательности. Старт-кодон ATG и стоп-кодон ТАА выделены жирным шрифтом, а 23-аминокислотная лидерная сигнальная последовательность подчеркнута.
На фигуре 2 показаны данные электрофореза в ДСН-ПААГ экспрессированного рекомбинантного химерного белка ЕСа28-1-тиоредоксина с молекулярной массой 50 кДа (дорожка 1, стрелка) и контрольного тиоредоксина массой 16 кДа (дорожка 2, стрелка), а также соответствующий иммуноблот рекомбинантного химерного белка ЕСа28-1-тиоредоксина, распознанного антисывороткой собаки, находящейся на стадии выздоровления от заражения E.canis (дорожка 3). Контрольный тиоредоксин антисывороткой к E.canis не выявлялся (не показано).
На фигуре 3 показано сопоставление аминокислотных последовательностей белка ЕСа28-1 (SEQ ID NO: 2) и ECa28SA2 (частичная последовательность: SEQ ID NO: 7) и ECa28SAl (SEQ ID NO: 8), P28 E.chaffeensis (SEQ ID NO: 9), семейства ОМР-1 E.chaffeensis (SEQ ID NO: 10-14) и MAP-1 С.ruminantium (SEQ ID NO: 15). Аминокислотная последовательность ЕСа28-1 представлена как консенсусная последовательность. Не показаны аминокислоты, идентичные аминокислотам ЕСа28-1 - они даны точками. Отличающиеся аминокислоты показаны соответствующими однобуквенными обозначениями. Пробелы, внесенные для соблюдения максимального соответствия аминокислотных последовательностей, даны черточками. Вариабельные сегменты подчеркнуты и обозначены (VR1, VR2, VR3 и VR4). Стрелки указывают на предполагаемый сигнал сайта пептидазного отщепления сигнального пептида.
На фигуре 4 показаны филогенетические отношения ЕСа28-1 с ЕСа28SА2 (частичная последовательность) и ECa28SAl E.canis, шестью членами мультигенного семейства omp-1 E.chaffeensis и mар-1 C.ruminantium по расшифрованным аминокислотным последовательностям с использованием конструирования несбалансированного дерева. Длина каждой пары ветвей соответствует расстоянию между аминокислотными последовательностями в парах. Масштабная линейка определяет расстояние между последовательностями.
На фигуре 5 показаны данные Саузерн-блоттинга геномной ДНК E.canis, полностью расщепленной шестью отдельными рестриктазами и гибридизованной на помеченный дигоксигенином зонд ЕСа28-1 (дорожки 2-7); помеченные дигоксигенином маркеры молекулярной массы (дорожки 1 и 8).
На фигуре 6 отображено сравнение характеристик предсказанных белков ЕСа28-1 (штамм Jake) и Р28 E.chaffeensis (штамм Arkansas). Поверхностная вероятность предсказывает поверхностные остатки с использованием гексапептидного окна. Поверхностным остатком является остаток с превышением 2,0 нм2 по площади поверхности, доступной для воды. Гексапептид, характеризующийся величиной более 1, рассматривался как поверхностный участок. Антигенный индекс предсказывает потенциальные антигенные детерминанты. Участки, характеризующиеся величиной выше 0, являются потенциальными антигенными детерминантами. Т-клеточный мотив локализует потенциальные Т-клеточные антигенные детерминанты с использованием мотива из 5 аминокислот: остаток 1 - глицин или полярный, остаток 2 - гидрофобный, остаток 3 - гидрофобный, остаток 4 - гидрофобный или пролин и остаток 5 - полярный или глицин. Линейка указывает на положения аминокислот.
На фигуре 7 показаны последовательности нуклеиновых кислот и расшифрованные аминокислотные последовательности генов белков массой 28 кДа E.canis - ECa28SA2 (нуклеотиды 1-849: SEQ ID NO: 3; аминокислотная последовательность: SEQ ID NO: 4) и ECa28SA3 (нуклеотиды 1195-2031: SEQ ID NO: 5; аминокислотная последовательность SEQ ID NO: 6), включая межгенные некодирующие последовательности (NC2, нуклеотиды 850-1194: SEQ ID NO: 31). Старт-кодон ATG и стоп-кодоны выделены жирным шрифтом.
На фигуре 8 схематически показаны пять генов локуса белков массой 28 кДа E.canis (5592 п.н.), что указывает на геномную ориентацию и межгенные некодирующие участки (28NC1-4). Гены белков массой 28 кДа, показанные в локусе 1 и 2 (затенены), были описаны ранее (McBride et al., 1999; Reddy et al., 1998; Ohashi et al., 1998). Была определена полная последовательность ECaSA2 и гена нового белка массой 28 кДа, обозначенного ECa28SA3 (без затенения). Некодирующие межгенные участки (28NC2-3) между ECaSA2, ECa28SA3 и ЕСа28-1 были определены полностью путем соединения ранее несвязывавшихся локусов 1 и 2.
На фигуре 9 показаны филогенетические отношения пяти генов белков массой 28 кДа E.canis по параметрам аминокислотных последовательностей с использованием конструирования несбалансированного дерева. Длина каждой пары ветвей соответствует расстоянию между парами аминокислот. Масштабная линейка определяет расстояние между последовательностями.
На фигуре 10 показано сопоставление последовательностей нуклеиновых кислот некодирующего межгенного спейсера генов белков массой 28 кДа E.canis (SEQ ID NO: 30-33). Непоказанные нуклеиновые кислоты, обозначенные точкой (.), идентичны некодирующему участку 1 (28NC1). Дивергенция показана с использованием соответствующих однобуквенных обозначений. Пробелы, внесенные для максимально информативного сопоставления аминокислотных последовательностей, обозначены черточкой (-). Предполагаемые участки промоторов транскрипции (-10 и -35) и сайты рибосомного связывания (RBS) обведены.
Подробное описание изобретения
Настоящее изобретение относится к клонированию, секвенированию и экспрессии гомологичных генов, кодирующих белок Ehrlichia canis с молекулярной массой 30 килодальтон (кДа). Также был проведен сравнительный молекулярный анализ гомологичных генов у семи изолятов A.canis и мультигенного семейства omp-1 E.chaffeensis. Идентифицированы два новых гена, кодирующих белки массой 28 кДа, - ЕСа28-1 и ECa28SA3. ЕСа28-1 имеет 834-нуклеотидную открытую рамку считывания, кодирующую белок из 278 аминокислот (SEQ ID NO: 2) с расчетной молекулярной массой 30,5 кДа. Была идентифицирована N-концевая сигнальная последовательность: это подтверждает, что белок характеризуется посттрансляционной модификацией в зрелый белок массой 27,7 кДа. ECa28SA3 имеет открытую рамку из 840 п.н., которая кодирует белок из 280 аминокислот (SEQ ID NO: 6).
С использованием ПЦР для амплификации генов белков массой 28 кДа E.canis ранее несеквенированный участок ECa28SA2 был определен полностью. Анализ последовательности ECa28SA2 показал наличие 849-нуклеотидной открытой рамки считывания, кодирующей белок из 283 аминокислот (SEQ ID NO: 4). В результате ПЦР-амплификации с использованием праймеров, специфичных для межгенных некодирующих участков генов белков массой 28 кДа, были соединены два ранее разделявшихся локуса с идентификацией единого локуса (5592 п.н.), включающего все пять генов белков массой 28 кДа. Пять белков массой 28 кДа, как было предсказано, включают сигнальные сегменты, обусловливающие образование зрелых белков, а уровень их аминокислотной гомологии составляет 51-72%. Анализ межгенных участков (спейсеров) указал на предполагаемые промоторные участки для каждого гена: это подтверждает то, что эти гены могут экспрессироваться независимо и дифференцированно. Размер межгенных некодирующих участков (28NCl-4) - в пределах от 299 до 355 п.н. при уровне гомологии 48-71%.
Настоящее изобретение относится к двум новым гомологичным генам белков массой 28 кДа у Ehrlichia canis - Еса28-1 и ECa28SA3 - и на полную последовательность ранее частично секвенированного ECa28SA2. Также заявляется мультигенный локус, кодирующий все пять гомологичных внешнемембранных белков массой 28 кДа Ehrlichia canis.
В одном осуществлении настоящее изобретение относится к последовательности ДНК, кодирующей иммунореактивный белок массой 30 кДа Ehrlichia canis. Предпочтительно белок характеризуется аминокислотной последовательностью, выбранной из группы, которая включает SEQ ID NO: 2, SEQ ID NO: 4 и SEQ ID NO: 6, а ген характеризуется нуклеотидной последовательностью, выбранной из группы, которая включает SEQ ID NO: 1, SEQ ID NO: 3 и SEQ ID NO: 5, и входит в состав полиморфного мультигенного семейства. Более предпочтительно белок имеет N-концевую сигнальную последовательность, которая отщепляется в ходе посттрансляционного процессинга, в результате чего образуется зрелый белок массой 28 кДа. Еще предпочтительнее ДНК, кодирующие белки массой 28 кДа, входят в состав единого мультигенного локуса, размер которого составляет 5592 п.н. и который кодирует все пять гомологичных белков массой 28 кДа у Ehrlichia canis.
В другом осуществлении настоящее изобретение относится к экспрессирующему вектору, включающему ген, который кодирует иммунореактивный белок массой 28 кДа Ehrlichia canis, и способный экспрессировать ген после внесения вектора в клетку.
Еще в одном осуществлении настоящее изобретение относится к рекомбинантному белку, включающему аминокислотную последовательность, выбранную из группы, которая включает SEQ ID NO: 2, SEQ ID NO: 4 и SEQ ID NO: 6. Предпочтительно аминокислотная последовательность кодируется последовательностью нуклеиновой кислоты, выбранной из группы, которая включает SEQ ID NO: 1, SEQ ID NO: 3 и SEQ ID NO: 5. Предпочтительно рекомбинантный белок включает четыре вариабельных сегмента, которые находятся на поверхности клетки и являются гидрофильными и антигенными. Еще предпочтительнее рекомбинантный белок является антигеном.
Еще в одном осуществлении настоящее изобретение относится к способу выработки рекомбинантного белка, включающему стадии формирования вектора, который включает экпрессирующий участок, включающий последовательность, которая кодирует аминокислотную последовательность, выбранную из группы, которая включает SEQ ID NO: 2, SEQ ID NO: 4 и SEQ ID NO: 6, функционально присоединенный к промотору; трансфекцию вектором клетки; и культивирование данной клетки в условиях, эффективных по экспрессии экспрессирующего участка.
Также настоящее изобретение может быть описано некоторыми вариантами в виде способа подавления инфекции Ehrlichia canis у субъекта, включающего стадии: идентификации субъекта, предположительно находящегося под влиянием или инфицированного Ehrlichia canis; и введение композиции, содержащей антиген массой 28 кДа Ehrlichia canis в количестве, эффективном по подавлению инфекции Ehrlichia canis. Подавление может происходить за счет любого пути, например за счет стимуляции у субъекта гуморального или клеточного иммунных ответов, или за счет других путей, таких как подавление нормальной функции антигена массой 28 кДа или даже конкуренция с антигеном за взаимодействие с некоторым агентом в организме субъекта.
В соответствии с настоящим изобретением могут быть применены стандартные методы молекулярной биологии, микробиологии и технологий рекомбинантных ДНК, известных специалистам в данной области техники. Такие методы полностью описаны в научной литературе: см., например, Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual" (1982); "DNA Cloning: A Practical Approach", Volumes I & II (D.N.Glover, ed., 1985); "Oligonucleotide Synthesis" (M.J.Gait, ed., 1984); "Nucleic Acid Hybridization" [B.D.Hames & S.L.Higgins, eds. (1985)]; "Transcription and Translation" [B.D.Hames & S.L.Higgins, eds. (1984)]; "Animal Cell Culture" [R.I.Freshney, ed. (1986)]; "Immobilized Cells and Enzymes" [IRL Press (1986)]; B.Perbal, "A Practical Guide to Molecular Cloning" (1984).
Так, по мере появления в данном тексте следующие термины должны быть определены в соответствии с указанным ниже.
“Репликон” обозначает любой генетический элемент (например, плазмиду, хромосому, вирус), который функционирует в качестве автономной единицы процесса репликации ДНК in vivo: т.е. способен реплицироваться под своим собственным контролем.
“Вектор” обозначает репликон, такой как плазмида, фаг или космида, к которой может быть присоединен другой сегмент ДНК таким образом, чтобы обеспечить репликацию присоединенного сегмента.
“Молекула ДНК” обозначает полимерную форму дезоксирибонуклеотидов (аденин, гуанин, тимин или цитозин) либо в одноцепочечной форме, либо в виде двухцепочечной спирали. Этот термин обозначает только первичную и вторичную структуру молекулы и не ограничивает ее по какой-либо конкретной четвертичной форме. Таким образом, данный термин включает двухцепочечную ДНК, обнаруживаемую, помимо прочего, в линейных молекулах ДНК (например, рестрикционных фрагментах, вирусах, плазмидах и хромосомах). При обсуждении структуры в данном тексте в соответствии с принятой нормой дается только последовательность в направлении от 5’ к 3’ в виде нетранскрибируемой (т.е. кодирующей) цепи ДНК (т.е. цепи, имеющей такую же последовательность, как и у мРНК).
“Кодирующая последовательность” ДНК обозначает двухцепочечную последовательность ДНК, которая транскрибируется и транслируется в полипептид in vivo при попадании под контроль подходящих регуляторных последовательностей. Границы кодирующей последовательности определяются старт-кодоном в 5’- конце (N-конце) и стоп-кодоном в 3’-конце (С-конце). Кодирующая последовательность может включать, тем самым не ограничиваясь, прокариотические последовательности, кДНК с эукариотических мРНК, геномные последовательности ДНК эукариот (например, млекопитающих) и даже синтетические последовательности ДНК. Сигнал полиаденилирования и сайт терминации транскрипции обычно должны быть расположены с 3’-стороны от кодирующей последовательности.
Контролирующие транскрипцию и трансляцию последовательности являются регуляторными последовательностями ДНК, такими как промоторы, энхансеры, сигналы полиаденилирования, терминаторы и подобное, которые обеспечивают экспрессию кодирующей последовательности в клетке-хозяине.
“Промоторная последовательность” обозначает ДНК-регуляторный участок, способный связывать РНК-полимеразу в клетке и инициировать транскрипцию расположенной ниже (в направлении 3’) кодирующей последовательности. Для целей определения в настоящем изобретении промоторная последовательность связана по ее 3’-концу с сайтом инициации транскрипции и продолжается вверх (в направлении 5’) так, чтобы включить минимальное число нуклеотидов или элементов, необходимых для инициации транскрипции на уровнях, отчетливо превышающий фоновый уровень. В пределах промоторной последовательности можно найти сайт инициации транскрипции, а также домены белкового связывания (консенсусные последовательности), отвечающие за связывание РНК-полимеразы. Часто, но не всегда, промоторы у эукариот включают боксы ТАТА и боксы CAT. Прокариртические промоторы включают последовательности Шайна-Дальгарно в дополнение к консенсусным последовательностям в положениях -10 и -35.
“Контролирующая экспрессию последовательность” обозначает последовательность ДНК, которая контролирует и регулирует транскрипцию и трансляцию другой последовательности ДНК. Кодирующая последовательность находится “под контролем” последовательностей-регуляторов транскрипции и трансляции в клетке тогда, когда РНК-полимера за транскрибирует кодирующую последовательность в мРНК, которая затем транслируется в белок, кодируемый кодирующей последовательностью.
“Сигнальная последовательность” может быть включена рядом с кодирующей последовательностью. Данная последовательность кодирует сигнальный сегмент, находящийся в N-концевой части полипептида и обеспечивающий клетке-хозяину перенесение полипептида на клеточную поверхность или секрецию полипептида в окружающую среду, причем данный сигнальный сегмент отщепляется клеткой-хозяином перед тем, как белок покидает клетку. Сигнальные последовательности могут быть обнаружены в связи с различными белками, нативными для прокариот и эукариот.
Термин “олигонуклеотид”, по использованию в данном тексте обозначающий зонд по настоящему изобретению, определяет молекулу, состоящую из двух или большего числа рибонуклеотидов, предпочтительно из более чем трех. Его точная длина будет зависеть от многих факторов, которые, в свою очередь, зависят от окончательной функции и использования олигонуклеотида.
Термин “праймер” по использованию в данном тексте обозначает олигонуклеотид, как встречающийся в естественных условиях в виде очищенного рестрикционного фрагмента, так и полученный синтетически, который способен выполнять роль сайта инициации синтеза при попадании в условия, в которых запускается синтез достраиваемого с праймера продукта, комплементарного цепи нуклеиновой кислоты (матрице), т.е. в присутствии нуклеотидов и индуцирующего агента, такого как ДНК-полимераза, и при подходящих температуре и рН. Праймеp может быть либо одноцепочечным, либо двухцепочечным и должен быть достаточно длинным для того, чтобы затравлять синтез желательного достроенного продукта в присутствии индуцирующего агента. Точная длина праймера будет зависеть от многих факторов, включая температуру, источник праймера и используемый метод. Например, для диагностических применений в зависимости от сложности последовательности-мишени олигонуклеотидный праймер обычно состоит из 15-25 или большего числа нуклеотидов, хотя он может включать и меньшее число нуклеотидов.
Праймеры в настоящей заявке выбирают как “существенно” комплементарные разным цепям конкретной последовательности-мишени ДНК. Это означает, что праймеры должны быть комплементарны настолько, чтобы гибридизовать с соответствующими им цепями. Следовательно, последовательность праймера необязательно должна отражать точную последовательность матрицы. Например, некомплементарный нуклеотидный фрагмент может быть присоединен к 5’-концу праймера, а остальная часть последовательности праймера будет комплементарна данной цепи. Как альтернатива, некомплементарные нуклеотиды или более длинные последовательности могут быть диспергированы по праймеру, лишь бы эта последовательность праймера была по существу комплементарной последовательности или гибридизовала бы с ней, тем самым образуя матрицу для синтеза достроенного продукта.
Клетка тогда считается “трансформированной” экзогенной или гетерологичной ДНК, когда такая ДНК была внесена внутрь клетки. Трансформирующая ДНК может интегрироваться (путем ковалентного связывания) или не интегрироваться в геном клетки. У прокариот, дрожжей и клеток млекопитающих, например, трансформирующая ДНК может поддерживаться в виде эписомного элемента, такого как плазмида. В случае эукариотических клеток стабильно трансформированной клеткой является клетка, в которой трансформирующая ДНК становится интегрированной в хромосому таким образом, чтобы она передавалась дочерним клеткам в результате хромосомной репликации. Такая стабильность отражается способностью эукариотической клетки формировать клеточные линии или клоны, включающие популяцию дочерних клеток, несущих трансформирующую ДНК. “Клоном” является популяция клеток, образующаяся от единственной клетки или предка в результате митозов. “Клеточная линия” - это клон первичной клетки, который способен стабильно расти in vitro в течение многих поколений.
Две последовательности ДНК “по существу гомологичны” тогда, когда по крайней мере примерно 75% (предпочтительно по крайней мере примерно 80% и наиболее предпочтительно по крайней мере примерно 90% или 95%) нуклеотидов совпадают на определенном участке последовательностей ДНК. Последовательности, которые по существу гомологичны, могут быть идентифицированы путем сравнения последовательностей с использованием стандартных компьютерных программ на материале последовательностей из баз данных или с помощью метода Саузерн-блоттинга, например, в жестких условиях гибридизации, определенных для данной конкретной системы. Определение подходящих условий гибридизации известно специалистам в данной области техники: см., например, Maniatis et al., цит. выше; "DNA Cloning", Vol.I & II, цит. выше; "Nucleic Acid Hybridization", цит. выше.
“Гетерологичный” участок в ДНК-конструкции - это идентифицируемый сегмент ДНК в большей молекуле ДНК, для которого неизвестна связь с данной более крупной молекулой в природе. Таким образом, когда гетерологичный участок кодирует ген млекопитающего, данный ген обычно фланкирован ДНК, которая не фланкирует ДНК генома млекопитающего в геноме организма-источника. В другом примере кодирующей последовательностью является конструкция, в которой сама кодирующая последовательность в природе не обнаруживается (например, кДНК, в которой геномная кодирующая последовательность включает интроны, или синтетические последовательности, включающие кодоны, отличающиеся от таковых в нативном гене). Аллельные варианты или естественные мутационные события в связи с данным определением не образуют гетерологичного сегмента ДНК.
Метками, наиболее обычно используемыми для данных исследований, являются радиоактивные элементы, ферменты, химические агенты, которые флуоресцируют при облучении ультрафиолетом, и другие. Известен ряд флуоресцентных материалов, которые можно использовать в качестве меток. Ими являются, например, флуоресцеин, родамин, аурамин, техасский красный, АМСА голубой и люциферовый желтый. Конкретным детекционным материалом является антикроличье антитело, генерированное у коз и соединенное с флуоресцеином через изотиоцианат.
Также белки могут быть помечены радиоактивным изотопом или ферментом. Радиоактивная метка может быть выявлена с помощью любой из доступных в настоящее время процедур. Предпочтительный изотоп можно выбрать из 3H,14С, 32Р, 35S, 36Cl, 51Cr, 57Co, 58Co, 59Fe, 90Y, 125I, 131I и 186Re.
Также применимы ферментные метки: они могут быть выявлены с помощью любого из существующих колориметрических, спектрофотометрических, флуороспектрофотометрических, амперометрических или газометрических методов. Фермент соединяют с отобранной частицей с помощью реакции с промежуточной молекулой, такой как карбодиимиды, диизоцианаты, глутаровый альдегид и подобное. Известны и применимы многие ферменты, которые можно использовать в данных процедурах. Предпочтительными являются пероксидаза, -глюкуронидаза, -D-глюкозидаза, -D-галактозидаза, уреаза, глюкооксидаза с пероксидазой и щелочная фосфатаза. В качестве примера можно сослаться на патенты США № 3654090, 3850752 и 4016043 в связи с изложенными в них альтернативными материалами и способами мечения.
По использованию в данном тексте термин “хозяин” призван включить не только прокариот, но также и эукариот, таких как клетки дрожжей, растений и животных. Рекомбинантную молекулу ДНК или ген, которые кодируют иммунореактивный белок массой 28 кДа Ehrlichia canis по настоящему изобретению, можно использовать для трансформации хозяина с использованием любого из методов, хорошо известных специалистам в данной области техники. Наиболее предпочтительным является использование вектора, включающего кодирующие последовательности гена, кодирующего иммунореактивный белок массой 28 кДа Ehrlichia canis по настоящему изобретению, для целей трансформации прокариот.
Прокариотическими хозяевами могут являться E.coli, S.typhimurium, Serratia marcescens и Bacillus subtilis. Эукариотическими хозяевами являются дрожжи, такие как Pichia pastoris, клетки млекопитающих и клетки насекомых.
В целом, экспрессирующие векторы, включающие промоторные последовательности, которые обеспечивают эффективную транскрипцию встроенного фрагмента ДНК, используют согласованно с хозяином. Обычно экспрессирующий вектор включает сайт начала репликации, промотор (промоторы), терминатор (терминаторы), а также конкретные гены, которые способны обеспечивать фенотипический отбор в трансформированных клетках. Трансформированные хозяева могут быть ферментированы и прокультивированы в соответствии со способами, известными в данной области техники в связи с достижением оптимального роста клеток.
Настоящее изобретение включает по существу чистую ДНК, кодирующую иммунореактивный белок массой 28 кДа Ehrlichia canis, цепь которой будет гибридизовать при высокой жесткости с зондом, включающим последовательность из по крайней мере 15 расположенных подряд нуклеотидов из SEQ ID NO: 1 или SEQ ID NO: 3, или SEQ ID NO: 5. Белок, кодируемый ДНК по настоящему изобретению, может характеризоваться по крайней мере 80%-ным уровнем идентичности последовательности (предпочтительно 85%, более предпочтительно 90% и наиболее предпочтительно 95%) с аминокислотами, перечисленными в SEQ ID NO: 2 или SEQ ID NO: 4, или SEQ ID NO: 6. Более предпочтительно ДНК включает кодирующую последовательность нуклеотидов SEQ ID NO: 1 или SEQ ID NO: 3, или SEQ ID NO: 5, или вырожденный вариант такой последовательности.
Зонд, с которым ДНК по настоящему изобретению гибридизует, предпочтительно состоит из по крайней мере 20 расположенных подряд нуклеотидов, более предпочтительно 40 нуклеотидов, даже более предпочтительно 50 нуклеотидов и наиболее предпочтительно 100 нуклеотидов или больше (вплоть до полного размера) из кодирующей последовательности нуклеотидов, перечисленных в SEQ ID NO: 1, или SEQ ID NO: 3, или SEQ ID NO: 5, или их комплементов. Такой зонд применим для выявления экспрессии иммунореактивного белка массой 28 кДа Ehrlichia canis в клетке человека с помощью способа, включающего стадии (а) контакта мРНК, полученной из клетки, с помеченным гибридизационным зондом; и (b) выявление гибридизации зонда с мРНК.
Настоящее изобретение также относится к существенно чистой ДНК, включающей последовательность по крайней мере из 15 расположенных подряд нуклеотидов (предпочтительно 20, более предпочтительно 30, даже более предпочтительно 50 и наиболее предпочтительно все) из участка нуклеотидов, перечисленных в SEQ ID NO: 1, или SEQ ID NO: 3, или SEQ ID NO: 5.
Под “высокой жесткостью” понимаются условия гибридизации ДНК и промывки, отличающиеся высокой температурой и низкой солевой концентрацией, например условиями промывки при 65°С при концентрации солей примерно 0,1SSC или их функциональных эквивалентов. Например, условия высокой жесткости могут включать гибридизацию при примерно 42°С в присутствии примерно 50% формамида; первую промывку при примерно 65°С примерно в 2 SSC, содержащем 1% ДСН; с последующей второй промывкой при примерно 65°С примерно в 0,1 SSC.
Под “по существу чистой ДНК” подразумевается ДНК, которая перестала быть частью среды, в которой ДНК встречается в нативных условиях, в результате отделения (частичной или полной очистки) от некоторых или всех молекул этой среды или в результате изменения последовательностей, которые фланкируют заявленную ДНК. Следовательно, данный термин охватывает, например, рекомбинантную ДНК, которая встроена в вектор, в автономно реплицирующиеся плазмиду или вирус или в геномную ДНК прокариотического или эукариотического организма; или которая существует в виде отдельной молекулы (например, кДНК или фрагмент геномной или кДНК, полученный в полимеразной цепной реакции (ПЦР) или при расщеплении рестрикционными эндонуклеазами) независимо от других последовательностей. Также он охватывает рекомбинантную ДНК, которая является частью химерного гена, кодирующего дополнительную пептидную последовательность, например химерный белок. Также охватывается рекомбинантная ДНК, которая включает часть нуклеотидов, перечисленных в SEQ ID NO: 1, или SEQ ID NO: 3, или SEQ ID NO: 5, которая кодирует альт