Последовательности crispr бифидобактерий

Иллюстрации

Показать все

Изобретение относится к биотехнологии и представляет собой выделенную нуклеиновую кислоту для типирования и/или маркировки штаммов Bifidobacterium lactis, состоящую из последовательности локуса CRISPR В.lactis, выбранной из группы, состоящей из a) Balal (SEQ ID NO: 1); b) последовательности повтора Balal, выбранной из последовательности SEQ ID NO: 2 и ее вариантов; c) последовательности спейсера Balal, выбранной из SEQ ID NO:3-24; где варианты последовательности SEQ ID NO: 2 выбраны из группы, состоящей из: замены Т в положении 12, замены Т в положении 14 и замены А в положении 36. Изобретение относится также к вектору, содержащему нуклеиновую кислоту, клетке, трансформированной нуклеиновой кислотой, и к способу типирования штаммов B. lactis. Изобретение позволяет эффективно проводить типирование микроорганизмов. 14 н. и 1 з.п. ф-лы, 12 ил., 3 табл., 1 пр.

Реферат

Область техники изобретения

Настоящее изобретение относится к локусам CRISPR Bifidobacterium animalis ssp. lactis и способам применения данных последовательностей.

Уровень техники изобретения

CRISPR (короткие палиндромные повторы, регулярно расположенные группами, Clustered Regularly Interspaced Short Palindromic Repeats) представляют собой характерный локус ДНК (то есть, набор или кластер последовательностей ДНК), обнаруженный в геномах многих бактерий и архей (для последнего обзора см., например, Sorek et al., «CRISPR - a widespread system that provides acquired resistance against phages in bacteria and archaea», Nature Reviews Microbiology, AOP, опубликованный в сети 24 декабря 2007 г.; doi:10.1038/nrmicro1793).

Недавно показано, что последовательности CRISPR могут функционировать в качестве разновидности «иммунной системы», которая помогает бактериям защищаться от фаговых инфекций (см., например, Barrangou et al., «CRISPR Provides Acquired Resistance Against Viruses in Prokaryotes», Science 315: 1709-12 (март 2007 г.); Deveau et al., J. Bacteriol. 190(4): 1390-1400 (февраль 2008 г.); Horvath et al., J. Bacteriol. 190(4): 1401-12 (февраль 2008 г.)). По меньшей мере восемь различных локусов CRISPR идентифицированы в геномах молочнокислых бактерий (см. Horvath et al., «Comparative analysis of CRISPR loci in lactic acid bacteria genomes», Int. J. Food Microbiol., электронная публикация 15 июля 2008 г.).

Кроме того, показано, что устойчивость к фагам у бактерий можно изменять путем введения последовательностей CRISPR в бактериальный геном. Например, удаление или добавление определенных последовательностей CRISPR от штаммов S. thermophilus приводит к появлению модифицированного устойчивого к фагу фенотипа (см., например, Barrangou et al. 2007 выше; Deveau et al., 2008, выше). В международной публикации № WO 2007/025097 A2, опубликованной 1 марта 2007 г. (которая включена в данный документ посредством ссылки), в числе прочего раскрыто использование локусов CRISPR для изменения устойчивости бактериального штамма к экзогенной нуклеиновой кислоте (например, фаговой инфекции).

Структура локуса CRISPR включает ряд коротких повторяющихся последовательностей, называемых «повторами». Повторы находятся в кластерах и в одном локусе CRISPR идентифицировано вплоть до 249 повторов (см., например, Sorek et al., 2007, выше), как правило, они правильно чередуются с уникальными вставочными последовательностями, называемыми «спейсерами». Обычно длина повторов CRISPR варьирует от примерно 24 до 47 п.о., и они являются частично палиндромными (см. Sorek et al., 2007, выше). Повторы, как правило, собраны в кластеры (вплоть до примерно 20 или более на геном) из повторяющихся единиц (см. Sorek et al., 2007, выше). Спейсеры расположены между двумя повторами и, как правило, каждый спейсер обладает уникальными последовательностями длиной примерно 20-72 п.о. (см. Sorek et al., 2007, выше). Многие спейсеры идентичны или имеют высокую степень гомологии с известными последовательностями фагов. Было показано, что вставка последовательности спейсера из конкретного фага в CRISPR бактерий может придавать устойчивость к данному фагу (см., например, Barrangou et al., «CRISPR Provides Acquired Resistance Against Viruses in Prokaryotes», Science 315: 1709-12 (март 2007 г.).

Помимо повторов и спейсеров, локус CRISPR также включает лидерную последовательность и, часто, набор из двух-шести связанных cas-генов. Лидерная последовательность, как правило, представляет собой AT-богатую последовательность длиной вплоть до 550 п.о., непосредственно примыкающую к 5'-концу первого повтора (см. Sorek et al., 2007, выше). Новая единица «повтор-спейсер» почти всегда добавляется к локусу CRISPR между лидерной последовательностью и первым повтором (см., например, Sorek et al., 2007, выше). Однако установлено, что приобретение устойчивости к фагу также может происходить в связи с добавлением нового спейсера и сопутствующим удалением спейсера из лидерной последовательности CRISP (см., например, Deveau et al., выше).

Считается, что белки, кодируемые связанными cas-генами, действуют как бактериальная «иммунная система», что придает устойчивость против фагов. Было высказано предположение, что набор из последовательностей «повтор-спейсер» транскрибируется в длинную РНК и повторы способствуют образованию вторичной структуры, которую cas-белки узнают и процессируют с образованием малых РНК, действующих по механизму, подобному РНК-интерференции (см. Sorek et al., 2007, выше). Brouns et al. (2008) сообщали, что комплекс из пяти cas-белков (CasA, CasB, CasC, CasD и CasE) в CRISPR/cas системе E. coli K12, названный «каскадом», расщепляет предшественник РНК CRISPR в каждом повторе и сохраняет продукт расщепления, содержащий происходящую из вируса последовательность. Предполагается, что с помощью Cas3-геликазы эти зрелые РНК CRISPR затем служат в качестве небольших направляющих РНК, которые позволяют каскаду препятствовать распространению вируса (см., например, Brouns et al., «Small CRISPR RNAs Guide Antiviral Defense in Prokaryotes», Science 321: 960-964 (2008)).

Последовательности CRISPR относятся к числу наиболее быстро развивающихся геномных структур у бактерий. Вследствие этого, а также из-за относительной простоты их последовательности (то есть, повтор-спейсер-повтор), последовательности CRISPR представляют собой идеальную геномную систему для обнаружения, типирования и отслеживания определенных штаммов бактерий. Способы использования последовательностей CRISPR для обнаружения, типирования и отслеживания штаммов бактерий раскрыты, например, в опубликованной патентной заявке США 2006/01990190 A1, опубликованной 7 сентября 2006 г., которая включена в данный документ посредством ссылки.

Локус CRISPR также представляет собой очень удобную, надежную, естественную и легко выявляемую геномную систему маркировки, которая не влияет на другие физиологические свойства маркированных прокариот. Способы использования известного фага для индукции CRISPR-метки (например, добавление единицы «повтор-спейсер») в бактериальном штамме раскрыты, например, в опубликованной патентной заявке США 2008/0124725 A1, опубликованной 29 мая 2008 г., которая включена в данный документ посредством ссылки.

Сущность изобретения

В некоторых вариантах осуществления изобретение относится к выделенной нуклеиновой кислоте, содержащей последовательность локуса CRISPR бифидобактерий, выбранную из группы, состоящей из BalalBala1 (SEQ ID NO: 1), CRISPRo9a (SEQ ID NO: 25), CRISPRo9b (SEQ ID NO: 26), CRISPRo91 (SEQ ID NO: 27), CRISPRo164 (SEQ ID NO: 28), CRISPRo228 (SEQ ID NO: 29), CRISPRo245 (SEQ ID NO: 30) и CRISPRo327 (SEQ ID NO: 31).

В некоторых вариантах осуществления изобретение относится к выделенной нуклеиновой кислоте, содержащей последовательность повтора BalalBala1, выбранную из SEQ ID NO: 2 и ее вариантных последовательностей. В некоторых вариантах осуществления варианты последовательности SEQ ID NO: 2 могут быть выбраны из замены Т на С в положении 12, замены Т на С в положении 14 и замены А на G в положении 36.

В некоторых вариантах осуществления изобретение относится к выделенной нуклеиновой кислоте, содержащей последовательность спейсера BalalBala1, выбранную из SEQ ID NO: 3-24. В некоторых вариантах осуществления последовательность спейсера BalalBala1 выбрана из SEQ ID NO: 13, 14 и 15.

В некоторых вариантах осуществления изобретение относится к выделенной нуклеиновой кислоте, содержащей последовательность

единицы «повтор-спейсер» Bala1, в которой последовательность повтора представляет собой SEQ ID NO: 2 и последовательность спейсера Bala1 выбрана из SEQ ID NO: 3-24.

В некоторых вариантах осуществления изобретение относится к выделенной нуклеиновой кислоте, содержащей последовательность повтора CRISPRo, выбранную из SEQ ID NO: 32-42, 53-60, 68-75, 83-92, 102-109, 117-125 и 134-143. В других вариантах осуществления изобретение относится к выделенной нуклеиновой кислоте, содержащей последовательность спейсера CRISPRo, выбранную из SEQ ID NO: 43-52, 61-67, 76-82, 93-101, 110-116, 126-133 и 144-152.

В некоторых вариантах осуществления изобретение относится к выделенной нуклеиновой кислоте, содержащей последовательность единицы «повтор-спейсер» CRISPRo, в которой последовательность повтора выбрана из SEQ ID NO: 32-42, 53-60, 68-75, 83-92, 102-109, 117-125 и 134-143, а последовательность спейсера выбрана из SEQ ID NO: 43-52, 61-67, 76-82, 93-101, 110-116, 126-133 и 144-152.

В других вариантах осуществления изобретение также относится к выделенным нуклеиновым кислотам, содержащим последовательность, способную гибридизоваться в строгих условиях с любой из описанных выше выделенных нуклеотидных последовательностей Bala1 или CRISPRo.

В некоторых вариантах осуществления изобретения любую из описанных выше выделенных нуклеотидных последовательностей Bala1 или CRISPRo можно встраивать в вектор. Таким образом, изобретение относится к вектору, содержащему локус CRISPR, выбранный из группы, состоящей из Bala1 (SEQ ID NO: 1), CRISPRo9a (SEQ ID NO: 25), CRISPRo9b (SEQ ID NO: 26), CRISPRo91 (SEQ ID NO: 27), CRISPRo164 (SEQ ID NO: 28), CRISPRo228 (SEQ ID NO: 29), CRISPRo245 (SEQ ID NO: 30) и CRISPRo327 (SEQ ID NO: 31).

В других вариантах осуществления изобретение относится к вектору, содержащему любую из следующих последовательностей: последовательность повтора Bala1, выбранную из SEQ ID NO: 2 и ее вариантных последовательностей; последовательность спейсера Bala1, выбранную из SEQ ID NO: 3-24; и последовательность единицы «повтор-спейсер» Bala1, в которой последовательность повтора выбирают из SEQ ID NO: 2 и ее вариантов, а последовательность спейсера выбирают из SEQ ID NO: 3-24.

В других вариантах осуществления изобретение относится к вектору, содержащему любую из следующих последовательностей CRISPRo: последовательность повтора CRISPRo, выбранную из SEQ ID NO: 32-42, 53-60, 68-75, 83-92, 102-109, 117-125 и 134-143; последовательность спейсера CRISPRo, выбранную из SEQ ID NO: 43-52, 61-67, 76-82, 93-101, 110-116, 126-133 и 144-152; и последовательность единицы «повтор-спейсер» CRISPRo, в которой последовательность повтора выбирают из SEQ ID NO: 32-42, 53-60, 68-75, 83-92, 102-109, 117-125 и 134-143, а последовательность спейсера выбирают из SEQ ID NO: 43-52, 61-67, 76-82, 93-101, 110-116, 126-133 и 144-152.

В некоторых вариантах осуществления изобретение относится к рекомбинантному штамму бактерий с измененной устойчивостью к фагу, содержащему любую из следующих последовательностей Bala1: последовательность повтора Bala1, выбранную из SEQ ID NO: 2 и ее вариантов; последовательность спейсера Bala1, выбранную из SEQ ID NO: 3-24; и последовательность единицы «повтор-спейсер» Bala1, в которой последовательность повтора выбирают из SEQ ID NO: 2 и ее вариантов, а последовательность спейсера выбирают из SEQ ID NO: 3-24.

В некоторых вариантах осуществления изобретение относится к рекомбинантному штамму бактерий с измененной устойчивостью к фагу, содержащему любую из следующих последовательностей CRISPRo: последовательность повтора CRISPRo, выбранную из SEQ ID NO: 32-42, 53-60, 68-75, 83-92, 102-109, 117-125 и 134-143; последовательность спейсера CRISPRo, выбранную из SEQ ID NO: 43-52, 61-67, 76-82, 93-101, 110-116, 126-133 и 144-152; и последовательность единицы «повтор-спейсер» CRISPRo, в которой последовательность повтора выбирают из SEQ ID NO: 32-42, 53-60, 68-75, 83-92, 102-109, 117-125 и 134-143, а последовательность спейсера выбирают из SEQ ID NO: 43-52, 61-67, 76-82, 93-101, 110-116, 126-133 и 144-152.

В некоторых вариантах осуществления вышеуказанных рекомбинантных штаммов бактерии представляют собой бифидобактерии, а в одном варианте осуществления - B. lactis.

В некоторых вариантах осуществления настоящее изобретение относится к способам получения рекомбинантных штаммов бактерий с измененной устойчивостью к фагу, включающим (a) трансформирование бактерий нуклеиновой кислотой, содержащей последовательность спейсера Bala1, выбранную из SEQ ID NO: 3-24; (b) контактирование трансформированных бактерий с фагом; и (c) выделение трансформированных бактерий, проявляющих устойчивость к фагу. В некоторых вариантах осуществления рекомбинантный штамм бактерий обладает повышенной устойчивостью к фагу (например, полной устойчивостью), а в других вариантах осуществления устойчивость к фагу понижена (например, устойчивость к фаговой инфекции отсутствует). В некоторых вариантах осуществления способа нуклеиновая кислота содержит локус Bala1 или CRISPRo, имеющий последовательность, выбранную из Bala1 (SEQ ID NO: 1), CRISPRo9a (SEQ ID NO: 25), CRISPRo9b (SEQ ID NO: 26), CRISPRo91 (SEQ ID NO: 27), CRISPRo164 (SEQ ID NO: 28), CRISPRO228 (SEQ ID NO: 29), CRISPRo245 (SEQ ID NO: 30) и CRISPRo327 (SEQ ID NO: 31). В других вариантах осуществления способа нуклеиновая кислота содержит последовательность, выбранную из последовательности повтора Bala1 (SEQ ID NO: 2 и ее варианты), последовательности спейсера Bala1 (SEQ ID NO: 3-24) и последовательности единицы «повтор-спейсер», в которой последовательность повтора выбирают из SEQ ID NO: 2 и ее вариантов, а последовательность спейсера выбирают из SEQ ID NO: 3-24. В других вариантах осуществления способа нуклеиновая кислота содержит последовательность, выбранную из последовательности повтора CRISPRo, выбранной из SEQ ID NO: 32-42, 53-60, 68-75, 83-92, 102-109, 117-125 и 134-143; последовательности спейсера CRISPRo, выбранной из SEQ ID NO: 43-52, 61-67, 76-82, 93-101, 110-116, 126-133 и 144-152; и последовательности единицы «повтор-спейсер» CRISPRo, в которой последовательность повтора выбирают из SEQ ID NO: 32-42, 53-60, 68-75, 83-92, 102-109, 117-125 и 134-143, а последовательность спейсера выбирают из SEQ ID NO: 43-52, 61-67, 76-82, 93-101, 110-116, 126-133 и 144-152.

В некоторых вариантах осуществления настоящее изобретение относится к способам типирования штаммов, обнаружения штаммов и/или отслеживания штаммов, включающим (a) амплификацию геномной ДНК из представляющего интерес штамма при помощи по меньшей мере одной пары праймеров, где указанная геномная ДНК содержит по меньшей мере часть последовательности локуса CRISPR; (b) обнаружение ампликона, полученного на этапе (a), где указанный обнаруженный ампликон служит признаком конкретного представляющего интерес штамма. В некоторых вариантах осуществления способа обнаружение ампликона производят методом, выбранным из измерения относительного размера с помощью гель-электрофореза (например, агарозных гелей) или масс-спектрометрического анализа; гибридизации с зондами известной последовательности (например, иммобилизованными зондами на микрочипе) и секвенирования (например, определения частичной или полной последовательности ампликона). В некоторых вариантах осуществления способа каждый праймер из пары комплементарен по меньшей мере части последовательности локуса CRISPR. В некоторых вариантах осуществления один праймер из пары комплементарен первому повтору и другой праймер из пары комплементарен концевому повтору локуса CRISPR, в результате чего полученный ампликон содержит весь локус CRISPR, или по меньшей мере часть каждого повтора и спейсера локуса CRISPR. В некоторых вариантах осуществления пара праймеров включает SEQ ID NO: 153 и 154.

В некоторых вариантах осуществления способов типирования штаммов, обнаружения штаммов и/или отслеживания штаммов каждый праймер из пары комплементарен части геномной ДНК таким образом, что пара праймеров амплифицирует по меньшей мере часть локуса CRISPR. Как правило, указанные части геномной ДНК будут содержать последовательности в непосредственной близости от и/или часть последовательности локуса CRISPR. В некоторых вариантах осуществления способов каждый праймер из пары комплементарен по меньшей мере части последовательности повтора локуса CRISPR, в результате чего при амплификации получают ампликон, содержащий по меньшей мере одну последовательность спейсера локуса CRISPR. В некоторых вариантах осуществления способов последовательности пары праймеров выбирают так, что каждый праймер комплементарен по меньшей мере части другого конца (то есть, либо 5', либо 3') последовательности повтора локуса CRISPR, в результате чего при амплификации получают множество ампликонов с последовательностями множества спейсеров, расположенных между повторами локуса CRISPR. В таком варианте осуществления множество ампликонов обнаруживают путем секвенирования или гибридизации со множеством зондов, комплементарных последовательностям спейсеров. В одном варианте осуществления способа множество ампликонов гибридизуют со множеством иммобилизованных зондов (например, микрочипом), в результате чего множество обнаруженных последовательностей спейсеров является признаком конкретного представляющего интерес штамма.

В некоторых вариантах осуществления способов типирования штаммов, обнаружения штаммов и/или отслеживания штаммов комплементарная последовательность локуса CRISPR представляет собой последовательность повтора, выбранную из SEQ ID NO: 2, 32-42, 53-60, 68-75, 83-92, 102-109, 117-125 и 134-143. В других вариантах осуществления способа каждый праймер из пары комплементарен по меньшей мере части последовательности спейсера локуса CRISPR, а в некоторых вариантах осуществления каждый праймер из пары комплементарен по меньшей мере части последовательности другого спейсера, в результате чего полученный ампликон содержит по меньшей мере одну последовательность повтора, расположенную между двумя последовательностями спейсеров. В некоторых вариантах осуществления способа один праймер из пары комплементарен последовательности спейсера, прилегающей к первому повтору локуса CRISPR. В некоторых вариантах осуществления один праймер из пары комплементарен последовательности спейсера, прилегающей к первому повтору локуса CRISPR, а другой праймер из пары комплементарен последовательности спейсера, прилегающей к концевому повтору локуса CRISPR, в результате чего полученный ампликон содержит все или по меньшей мере часть каждого спейсера в локусе CRISPR.

В некоторых вариантах осуществления способов типирования штаммов, обнаружения штаммов и/или отслеживания штаммов локус CRISPR выбирают из группы, состоящей из Bala1 (SEQ ID NO: 1), CRISPRo9a (SEQ ID NO: 25), CRISPRo9b (SEQ ID NO: 26), CRISPRo91 (SEQ ID NO: 27), CRISPRo164 (SEQ ID NO: 28), CRISPRo228 (SEQ ID NO: 29), CRISPRo245 (SEQ ID NO: 30) и CRISPRo327 (SEQ ID NO: 31).

В некоторых вариантах осуществления настоящее изобретение относится к набору для типирования штаммов, обнаружения штаммов и/или отслеживания штаммов, включающему упакованный комплект из (a) контейнера с композицией реагентов для амплификации, содержащей ДНК-полимеразу, буфер амплификации и по меньшей мере одну пару праймеров, где каждый праймер из пары комплементарен части геномной ДНК так, что пара праймеров способна амплифицировать по меньшей мере часть последовательности повтора или спейсера локуса CRISPR; и (b) контейнера с композицией реагентов для обнаружения, содержащей зонд, способный гибридизоваться в строгих условиях по меньшей мере с частью локуса CRISPR, амплифицированной с помощью пары праймеров. В некоторых вариантах осуществления каждая пара праймеров из набора комплементарна по меньшей мере части последовательности повтора или спейсера локуса CRISPR. В некоторых вариантах осуществления каждый праймер из пары в наборе комплементарен части геномной ДНК, так что пара праймеров способна амплифицировать по меньшей мере часть локуса CRISPR, выбранного из группы, состоящей из Bala1 (SEQ ID NO: 1), CRISPRo9a (SEQ ID NO: 25), CRISPRo9b (SEQ ID NO: 26), CRISPRo91 (SEQ ID NO: 27), CRISPRo164 (SEQ ID NO: 28), CRISPRo228 (SEQ ID NO: 29), CRISPRo245 (SEQ ID NO: 30) и CRISPRo327 (SEQ ID NO: 31). В некоторых вариантах осуществления пара праймеров включает SEQ ID NO: 153 и 154.

В некоторых вариантах осуществления изобретение относится к способу маркировки штамма бифидобактерий, включающему (a) подвергание родительского штамма бифидобактерий действию фага; (b) отбор нечувствительного к фагу мутанта и (c) сравнение последовательности локуса CRISPR или ее части из родительского штамма и нечувствительного к фагу мутантного штамма, в результате чего наличие дополнительной единицы «повтор-спейсер» в последовательности локуса CRISPR нечувствительного к фагу мутанта указывает на то, что штамм маркирован. В некоторых вариантах осуществления способа маркировки штамма локус CRISPR выбирают из группы, состоящей из Bala1 (SEQ ID NO: 1), CRISPRo9a (SEQ ID NO: 25), CRISPRo9b (SEQ ID NO: 26), CRISPRo91 (SEQ ID NO: 27), CRISPRo164 (SEQ ID NO: 28), CRISPRO228 (SEQ ID NO: 29), CRISPRo245 (SEQ ID NO: 30) и CRISPRo327 (SEQ ID NO: 31).

В некоторых вариантах осуществления изобретение относится к выделенной нуклеиновой кислоте, кодирующей cas-ген локуса CRISPR Bala1. В некоторых вариантах осуществления cas-ген локуса CRISPR Bala1 кодирует аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 155, 156, 157, 158, 159 и 160. В одном варианте осуществления выбранная аминокислотная последовательность представляет собой любую из SEQ ID NO: 156, 158 и 159.

В некоторых вариантах осуществления изобретение относится к выделенной нуклеиновой кислоте, содержащей нуклеотидную последовательность, включающую два или более cas-генов, в которой cas-гены кодируют две или более аминокислотных последовательностей, выбранных из группы, состоящей из SEQ ID NO: 155, 156, 157, 158, 159 и 160. В одном варианте осуществления выделенная нуклеиновая кислота содержит все шесть cas-генов локуса CRISPR Bala1.

Краткое описание фигур

На фигуре 1 представлена нуклеотидная последовательность локуса Bala1 из генома B. lactis Bl-04 (SEQ ID NO: 1). 23 повтора, каждый из 36 п.о., которые начинаются с положения 1290, изображены полужирными буквами. 22 спейсера соответствуют записанным строчными буквами последовательностям, расположенным между каждой парой повторов. Подчеркнутые части соответствуют сайтам ПЦР-праймеров праймера 1 и праймера 2, использованных для получения 874 п.о. ампликона, как описано в примере 1.

На фигуре 2 представлены 23 повтора (R1-R23) в последовательности SEQ ID NO: 1 локуса Bala1, выровненные с каждым из 22 спейсеров (S1-S22).

На фигуре 3 представлено схематичное сравнение локуса CRISPR Bala1 из генома B. lactis Bl-04 и четырех других штаммов B. lactis (Bi-07, DSM10140, B420 и HN019). Локус CRISPR Bala1, как он появляется в геноме B. lactis с шестью расположенными ниже cas-генами, приведен сверху. Области «повтор-спейсер» из Bl-04 и DSM10140 показаны в развернутом виде чуть ниже с повторами, представленными в виде черных «бриллиантов», и спейсерами в виде пронумерованных прямоугольников. Лидерная последовательность локуса CRISPR представлена в виде белого прямоугольника, отмеченного буквой «L», и концевой повтор представлен в виде черного «бриллианта» с пометкой «T». Изображены все 22 единицы «повтор-спейсер» локуса CRISPR Bala1 для пяти штаммов. Три единицы «повтор-спейсер» (включающие спейсеры S10, S11 и S12), которые отсутствуют в штаммах DSM10140, B420 и HN019, четко обозначены как делеция.

На фигуре 4 представлено схематичное сравнение локуса CRISPR Bala1 из B. lactis Bl-04 с локусами CRISPR, обнаруженными в геномах семи других бифидобактерий, а также геномные схемы (B. longum NCC2705, B. longum DJO10A, B. dentium ATCC 27678 Bden1, B. dentium ATCC 27678 Bden2, B. catenlatum JCM1194 Bcat1, B. adolescentis ATCC 15703 Bado1a, B. adolescentis L2-32 Bado1b). Области «повтор-спейсер» изображены в виде черных прямоугольников, cas-гены представлены узкими стрелками, тогда как другие гены представлены прямоугольными стрелками. Прямоугольники вокруг стрелок указывают на то, что эти гены делетированы в другом штамме того же вида.

На фигуре 5 представлены аминокислотные последовательности шести Cas-белков, расположенные ниже области «повтор-спейсер» CRISPR Bala1, как схематично показано на фигуре 3. (A) последовательность фермента Cas1; (B) последовательность фермента Cas2; (C) последовательность белка Csb1, кодирующая предполагаемый CRISPR-ассоциированный csb-ген, расположенный непосредственно ниже cas2; (D) последовательность белка Csb2, кодирующая предполагаемый CRISPR-ассоциированный csb-ген, расположенный непосредственно ниже csb1, (E) последовательность фермента Cas3 и (F) последовательность белка Csb3, кодирующая предполагаемый CRISPR-ассоциированный csb-ген, расположенный непосредственно ниже cas3.

На фигуре 6 представлена последовательность локуса CRISPRo9a. Расположение рядов нуклеотидов скорректировано таким образом, что все одиннадцать повторов из 25 п.о. (полужирные заглавные буквы) выровнены, и последовательные номера добавлены для обозначения каждого из десяти спейсеров, исходя из очередности его появления в последовательности.

На фигуре 7 представлена последовательность локуса CRISPRo9b. Расположение рядов нуклеотидов скорректировано таким образом, что все восемь повторов из 25 п.о. (полужирные заглавные буквы) выровнены, и каждый из семи спейсеров обозначен последовательным номером, исходя из очередности его появления в последовательности.

На фигуре 8 представлена последовательность локуса CRISPRo91. Расположение рядов нуклеотидов скорректировано таким образом, что все восемь повторов из 25 п.о. (полужирные заглавные буквы) выровнены, и каждый из семи спейсеров обозначен последовательным номером, исходя из очередности его появления в последовательности.

На фигуре 9 представлена последовательность локуса CRISPRo164. Расположение рядов нуклеотидов скорректировано таким образом, что все десять повторов из 25 п.о. (полужирные заглавные буквы) выровнены, и каждый из девяти спейсеров обозначен последовательным номером, исходя из очередности его появления в последовательности.

На фигуре 10 представлена последовательность локуса CRISPRo228. Расположение рядов нуклеотидов скорректировано таким образом, что все восемь повторов из 25 п.о. (полужирные заглавные буквы) выровнены, и каждый из семи спейсеров обозначен последовательным номером, исходя из очередности его появления в последовательности.

На фигуре 11 представлена последовательность локуса CRISPRo245. Расположение рядов нуклеотидов скорректировано таким образом, что все девять повторов из 25 п.о. (полужирные заглавные буквы) выровнены, и каждый из восьми спейсеров обозначен последовательным номером, исходя из очередности его появления в последовательности.

На фигуре 12 представлена последовательность локуса CRISPRo327. Расположение рядов нуклеотидов скорректировано таким образом, что все десять повторов из 25 п.о. (полужирные заглавные буквы) выровнены, и каждый из девяти спейсеров обозначен последовательным номером, исходя из очередности его появления в последовательности.

Подробное описание изобретения

I. Обзор

Настоящее изобретение относится к локусам CRISPR, обнаруженным у вида Bifidobacterium animalis подвида lactis (называемого в данном документе «B. lactis») и к использованию нуклеотидных последовательностей данных локусов в различных способах применения, включая генную инженерию устойчивости к фагам, типирование и отслеживание штаммов, а также маркировку штаммов.

По меньшей мере два различных семейства локусов CRISPR идентифицировано в геноме B. lactis Bl-04BL-04: «Bala1» и «CRISPRo». Локус Bala1 сопровождается cas-генами, имеет высоко консервативные повторы и присутствует только однократно в геноме Bl-04Bl-04. Напротив, локус CRISPRo не сопровождается cas-генами, имеет вырожденные повторы (то есть, последовательности повторов, обладающие некоторой изменчивостью) и присутствует по меньшей мере в семи различных участках генома Bl-04Bl-04.

Настоящее изобретение относится к композициям нуклеиновых кислот, способам и наборам, в которых используют нуклеотидные последовательности локусов Bala1 и CRISPRo, раскрытые в данном документе.

II. Определения

Все патенты и публикации, включая все последовательности, раскрытые в таких патентах и публикациях, на которые ссылаются в данном документе, специально включены посредством ссылки. Если в данном документе не указано иное, все технические и научные термины, используемые в данном документе, имеют тот же смысл, который в них обычно вкладывает рядовой специалист в той области, к которой относится изобретение (см., например, Singleton et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 2D ED, John Wiley and Sons, New York [1994]; и Hale and Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, NY [1991], оба источника предоставляют специалисту основной словарь многих терминов, используемых в данном документе). Любые способы и материалы, аналогичные или эквивалентные различным вариантам осуществления, описанным в данном документе, можно использовать на практике или при тестировании настоящего изобретения.

Предполагается, что каждое максимальное (или минимальное) численное ограничение, раскрытое в данной спецификации, включает все меньшие (или большие) численные ограничения, как если бы такие меньшие (или большие) численные ограничения были специально прописаны в данном документе. Кроме того, подразумевается, что каждый числовой диапазон, раскрытый в данном описании, включает каждый более узкий числовой диапазон, находящийся в пределах более широкого числового диапазона, как если бы такие более узкие числовые диапазоны были специально прописаны в данном документе.

Используемые в данном документе формы единственного числа включают их множественное число, если из контекста ясно не следует иное. Так, например, ссылка на «клетку-хозяина» включает множество таких клеток-хозяев.

Предполагается, что используемое в данном документе словосочетание «по меньшей мере» при употреблении совместно со списком значений или терминов относится к каждому значению или термину в списке. Например, фразу «по меньшей мере 85%, 90%, 95% и 99% идентичности последовательности» используют для обозначения по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95% и/или по меньшей мере 99% идентичности последовательности.

Используемый в данном документе термин «содержащий» и родственные ему слова используют в их включающем смысле, то есть, эквивалентно термину «включающий» и соответствующим ему родственным словам.

Если не указано иное, нуклеиновые кислоты пишутся слева направо в ориентации от 5'- к 3'-концу; аминокислотные последовательности пишутся слева направо в ориентации от амино- к карбоксильному концу, соответственно. Разделы, представленные в данном документе, не являются ограничениями для различных аспектов или вариантов осуществления изобретения, которые можно воплощать, исходя из спецификации в целом. Соответственно, термины, определенные непосредственно ниже, более полно определены, исходя из спецификации в целом.

В данном документе при описании белков и кодирующих их генов обозначение гена, как правило, пишется курсивом. Обозначение белка, как правило, не пишется курсивом и, как правило, пишется с заглавной буквы.

Используемые в данном документе термины «выделенная» и «очищенная» означают молекулу (например, выделенную нуклеиновую кислоту) или другой компонент, который отделен от по меньшей мере одного другого компонента, с которым он связан естественным образом.

При использовании в данном документе выражение «производный из» охватывает выражения «происходящий из», «полученный из» или «выделенный из».

Используемый в данном документе термин «бактерии» означает любой из прокариотических микроорганизмов, существующих в виде отдельной клетки или в кластере или агрегате из отдельных клеток.

Используемый в данном документе термин «бифидобактерии» означает любой из видов грамположительных анаэробных разветвленных палочковидных бактерий, которые обычно составляют кишечную микрофлору и относятся к членам рода Bifidobacterium, включая, но не ограничиваясь ими, B. angulatum; B. animalis; B. asteroides; B. bifidum; B. boum; B. breve; B. catenulatum; B. choerinum; B. coryneforme; B. cuniculi; B. dentium; B. gallicum; B. gallinarum; B indicum; B. longum; B. magnum; B. merycicum; B. minimum; B. pseudocatenulatum; B. pseudolongum; B. psychraerophilum; B. pullorum; B. ruminantium; B. saeculare; B. scardovii; B. simiae; B. subtile; B. thermacidophilum; B. thermophilum; B. urinalis; B. sp.

При использовании в данном документе «B. lactis» означает Bifidobacterium animalis подвид lactis.

Используемый в данном документе термин «локус CRISPR» означает сегмент ДНК, включающий все из повторов и спейсеров CRISPR, начиная от первого нуклеотида первого повтора CRISPR и кончая последним нуклеотидом последнего (концевого) повтора CRISPR. Как правило, каждая последовательность спейсера в локусе CRISPR расположена между двумя повторами и, следовательно, локус содержит на одну последовательность больше повторов, чем спейсеров.

Используемые в данном документе термины «повтор CRISPR», «последовательность повтора» или «повтор» имеют обычный смысл, используемый в данной области - то есть, несколько коротких прямых повторяющихся последовательностей, демонстрирующих крайне незначительную или полное отсутствие вариаций последовательности в данном локусе CRISPR.

Используемые в данном документе термины «спейсер CRISPR», «последовательность спейсера» или «спейсер» означают неповторяющиеся последовательности, расположенные между повторами локуса CRISPR.

В некоторых вариантах осуществления настоящего изобретения «спейсер» означает сегмент нуклеиновой кислоты, фланкированный двумя повторами. Последовательности спейсеров CRISPR часто обладают значительной гомологией с природными последовательностями фагов или плазмид. Как правило, спейсеры расположены между двумя идентичными или почти идентичными последовательностями повторов. Таким образом, спейсеры часто идентифицируют путем анализа последовательностей сегментов ДНК, расположенных между двумя повторами CRISPR.

Используемый в данном документе термин «cas-ген» имеет свое обычное значение, используемое в данной области, где он означает один или более генов, которые присоединены, связаны, расположены рядом или в непосредственной близости от локуса CRISPR. Как правило, cas-гены, связанные с локусом CRISPR, кодируются нуклеотидами, расположенными в 5'-положении от лидерной последовательности CRISPR. Исчерпывающий обзор семейства cas-белков представлен Haft et al. (Haft et al., Comput. Biol., 1, 6 e60 [2005]; см. также Brouns et al. (2008) выше).

Используемые в данном документе термины «лидер CRISPR», «лидерная последовательность» или «лидер» означают некодирующую последовательность, расположенную непосредственно выше от 5'-конца локуса CRISPR. Как правило, лидерная последовательность CRISPR расположена между первым нуклеотидом первого повтора в локусе CRISPR и стоп-кодоном последнего cas-гена.

Используемый в данном документе термин «трейлер CRISPR» означает некодирующую последовательность, расположенную непосредственно ниже от 3'-конца локуса CRISPR - то есть, сразу после последнего нуклеотида последнего повтора CRISPR. Этот последний повтор CRISPR также называют «концевым повтором».

Используемый в данном документе термин «бактериофаг» или «фаг» имеет свое обычное значение, используемое в данной области, то есть, вирус, избирательно инфицирующий один или несколько видов бактерий.

Все используемые в данном документе термины «маркированные бактерии», «маркированная бактерия» и «меченые бактерии» используются взаимозаменяемо для обозначения бактерий, подвергнутых воздействию фага, и в которых один или несколько локусов CRISPR или их части были модифицированы таким образом, что бактерии стали устойчивыми к фагу. Как описано более подробно в данном документе, в некоторых вариантах осуществления маркированные бактерии подвергают воздействию более чем одного фага (например, либо итеративно, последовательно, либо одновременно), так что более одной геномной модификации накапливается в их локусах CRISPR таким образом, что они становятся нечувствительными к каждому из фагов, воздействию которых их подвергли.

Используемые в данном документе термины «измененный» или «изменения», используемые в контексте клеточной устойчивости к нуклеиновой кислоте, могут означать подавление, снижение, сокращение, индукцию, придание, восстановление, возрастание, увеличение или иное воздействие на устойчивость клетки к целевой нуклеиновой кислоте.

Используемый в данном документе термин «устойчивость к целевой нуклеиновой кислоте» означает, что устойчивость придана против любого элемента, который содержит или продуцирует целевую нуклеиновую кислоту или продукт ее транскрипции (например, клетки, фага, плазмид, «голой» ДНК). Типы элементов не ограничиваются живыми элементами, такими как клетки и фаги, но также включают неживые элементы, например, плазмиды или перемещающиеся элементы. Таким образом, в некоторых вариантах осуществления последовательности CRISPR по настоящему изобретению могут обеспечивать устойчивость против любого содержащего аминокислоту элемента и даже последовательностей свободной или «голой» нуклеиновой кислоты, которые включают целевую нуклеиновую кислоту. Устойчивость можно измерять с точки зрения выживания устойчивой клетки или с точки зрения предотвращения сохранения и/или выживания внесенной нуклеиновой кислоты (например, предотвращения репликации и/или транскрипции и/или экспрессии целевой нуклеиновой кислоты). Устойчивость не предназначена служить признаком того, что чужеродная ДНК обязательно встречает препятствие при проникновении в устойчивую клетку (то есть, при проникновении через клеточную мембрану). Более того, термин «устойчивость» не подразумевает, что клетка на 100% устойчива к целевой нуклеиновой кислоте или продукту ее транскрипции, но охватывает клетки, толерантные к целевой нуклеиновой кислоте или продукту ее транскрипции.

При использовании в данном документе «амплификация» означает производство дополнительных копий последовательности нуклеиновой кислоты. Амплификацию используют во многих способах применения последовательностей CRISPR (см., например, Mojica et al., «