Способ и система для определения нуклеотидной последовательности в заданной области генома плода

Иллюстрации

Показать все

Группа изобретений относится к области биотехнологии. Предложены способ и система для определения нуклеотидной последовательности в заданной области генома плода. Способ включает следующие этапы: конструирование библиотеки для секвенирования из образца геномной ДНК из периферической крови беременной женщины; секвенирование библиотеки для секвенирования с целью получения результата секвенирования. Результат секвенирования плода включает множество полученных при секвенировании данных. Нуклеотидную последовательность в заданной области генома определяют посредством использования скрытой марковской модели на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике с помощью алгоритма Витерби. Система состоит из аппарата конструирования библиотеки, секвенатора и анализатора. Использование изобретений позволяет произвести генотипирование с высокой точностью. 2 н. и 12 з.п. ф-лы, 2 ил., 1 табл., 1 пр.

Реферат

ОБЛАСТЬ ТЕХНИКИ

Объекты предлагаемого изобретения, в целом, относятся к способу определения нуклеотидной последовательности в заданной области генома плода, и используемых с этой целью системы и машиночитаемой среды.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ

К генетическим заболеваниям относятся заболевания, вызванные изменениями генетического материала - врожденными, семейными, необратимыми и наследуемыми. Генетические заболевания могут быть подразделены на 3 класса: моногенные заболевания, полигенные нарушения и хромосомные нарушения. Моногенное заболевание, в большинстве случаев, представляет собой аномальное функционирование гена, вызванное наследованием единственного гена, вызывающего заболевание, по доминантному или рецессивному типу, тогда как к полигенным нарушениям относятся заболевания, вызванные изменениями во множестве генов, на которые в определенной степени может влиять внешняя среда. Хромосомные нарушения включают аномальное число хромосом и структурные аномалии, наиболее часто встречающимся примером является синдром Дауна, возникающий в результате трисомии по 21 хромосоме, при которой у больного ребенка присутствуют врожденные признаки монголизма, тело имеет аномальную форму и т.д. В связи с тем, что эффективные методы лечения генетических заболеваний до настоящего времени отсутствуют, возможны лишь правильно подобранная поддерживающая терапия и дорогостоящая медикаментозная ремиссия, которые ложатся тяжелым бременем на экономику и сознание общества и семьи. Поэтому крайне необходимо проводить профилактическую работу для обнаружения патологии у плода до рождения, с целью обеспечения хорошего медицинского обслуживания в пренатальном и постнатальном периодах.

Однако существующие методы обнаружения патологии нуждаются в усовершенствовании.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Предлагаемое изобретение направлено на решение, по крайней мере, частичное, одной из существующих проблем в данной области техники.

Первым объектом предлагаемого изобретения в широком смысле является создание способа для определения нуклеотидной последовательности в заданной области генома плода. В соответствии с вариантами предлагаемого изобретения, способ может включать: конструирование библиотеки для секвенирования из образца геномной ДНК плода; секвенирование библиотеки для секвенирования с целью получения результата секвенирования, включаюшего множество полученных при секвенировании данных плода; и определение нуклеотидной последовательности в заданной области генома на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике, посредством использования скрытой марковской модели. Образование генома потомка равнозначно случайной рекомбинации геномов родителей (т.е. рекомбинации посредством обмена гаплотипов и случайной комбинации гамет). В случае плазмы беременной женщины, если исходят из того, что гаплотип плода (рекомбинация родительских гаплотипов) находится в скрытом состоянии, можно использовать данные, полученные при секвенировании плазмы, поскольку наблюдения (наблюдаемые последовательности), вероятности переходов, вероятности наблюдаемых символов и распределение исходных состояний могут быть прослежены по предшествовавшим данным, затем можно определить наиболее вероятную рекомбинацию гаплотипов плода, используя скрытую марковскую модель и алгоритм Витерби, что позволит получить больше информации о плоде до рождения. Таким образом, в соответствии с вариантами предлагаемого изобретения, в скрытой модели Маркова, например, используя алгоритм Витерби и соотносясь с генетической информацией родственника, можно определить нуклеотидную последовательность в заданной области генома плода, тем самым провести пренатальную генетическую диагностику по генетической информации, содержащейся в геноме плода.

Вторым объектом предлагаемого изобретения в широком смысле является создание системы для определения нуклеотидной последовательности в заданной области генома плода. В соответствии с вариантами предлагаемого изобретения, система может включать: аппарат конструирования библиотеки, предназначенный для конструирования библиотеки для секвенирования образца геномной ДНК плода; аппарат секвенирования, соединенный с аппаратом конструирования библиотеки и предназначенный для секвенирования библиотеки, с целью получения результата секвенирования последовательностей плода, включающего множество полученных при секвенировании данных плода; и аппарат анализа, соединенный с аппаратом секвенирования и предназначенный для определения нуклеотидной последовательности в заданной области генома на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике, посредством использования скрытой марковской модели. Использование системы позволяет эффективно осуществить описанный выше способ определения нуклеотидной последовательности в заданной области генома плода, на основании которой может быть определена нуклеотидная последовательность заданной области генома плода посредством использования скрытой марковской модели и алгоритма Витерби и соотносясь с генетической информацией о родственнике, тем самым провести пренатальную генетическую диагностику по генетической информации, содержащейся в геноме плода.

Третьим объектом предлагаемого изобретения в широком смысле является создание машиночитаемой среды. В соответствии с вариантами предлагаемого изобретения машиночитаемая среда, включающая множество команд, предназначена для определения нуклеотидной последовательности в заданной области генома на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике, посредством использования скрытой марковской модели. Использование машиночитаемой среды, являющейся объектом предлагаемого изобретения, позволяет процессору эффективно выполнять множество команд для определения нуклеотидной последовательности в заданной области генома плода в скрытой марковской модели при использовании, например, алгоритма Витерби, на основании данных о секвенировании последовательностей плода в сочетании с генетической информацией о родственнике, и, тем самым, провести пренатальную генетическую диагностику по генетической информации, содержащейся в геноме плода.

Дополнительные особенности и преимущества предлагаемого изобретения будут частично представлены в описании, частично станут очевидными из описания или станут известны из практики осуществления вариантов предлагаемого изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Эти и другие особенности и преимущества предлагаемого изобретения будут более понятны и наглядны из последующего описания с отсылками к прилагаемым чертежам, на которых:

Фиг. 1 - блок-схема, показывающая процесс анализа с использованием скрытой марковской модели, согласно варианту предлагаемого изобретения; и

Фиг. 2 - диаграмма, показывающая систему для определения нуклеотидной последовательности в заданной области генома плода, согласно варианту предлагаемого изобретения.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В дальнейших подробных ссылках на варианты предлагаемого изобретения одинаковые или аналогичные элементы и элементы с одинаковыми или аналогичными функциями по всему описанию обозначены одними и теми же цифрами. Описанные в настоящем документе варианты со ссылками на чертежи представлены с разъяснительной, иллюстративной целью и использованы для общего понимания предлагаемого изобретения. Интерпретация вариантов не должна ограничивать предлагаемое изобретение.

Следует понимать, что термины «первый» и «второй», используемые только с описательной целью, не указывают и не подразумевают относительную важность или значение признаков. Также, признаки, определенные как «первый» или «второй», могут явно или неявно включать один или несколько упомянутых признаков. Кроме того, в описании предлагаемого изобретения термин «множество» означает «два или более», если не указано иное.

Способ определения нуклеотидной последовательности в заданной области генома плода

Первым объектом предлагаемого изобретения является способ определения нуклеотидной последовательности в заданной области генома плода. Согласно вариантам предлагаемого изобретения, способ может включать:

на первом этапе, конструирование библиотеки для секвенирования из образца геномной ДНК плода. Согласно предлагаемому изобретению, на источник образца геномной ДНК плода не накладываются специальные ограничения. Могут быть использованы любые образцы, полученные у беременной женщины и содержащие нуклеиновую кислоту плода. Например, согласно вариантам предлагаемого изобретения, образцом от беременной женщины может быть образец молока, мочи и периферической крови, полученный у беременной женщины. При этом наиболее предпочтителен образец периферической крови. Использование периферической крови беременной женщины в качестве источника образца геномной ДНК плода позволяет эффективно получать образец геномной ДНК плода неинвазивным способом, при возможности осуществлять эффективный мониторинг генома плода, не оказывая влияния на нормальное развитие растущего плода. В отношении способов и процессов, используемых для конструирования библиотеки для секвенирования из образца нуклеиновой кислоты, специалист в данной области может сделать надлежащий выбор, с учетом различных технологий секвенирования. Подробное описание процесса может быть представлено производителем, например, компанией Illumina Company, в «Руководстве по мультиплексированной подготовке образца» (Часть №1005063; февраль 2010 г.) или «Руководстве по приготовлению образца для парного секвенирования с концов ДНК» (Часть №1005063; февраль 2010 г.), которые включены в данный документ в форме ссылки. Согласно вариантам предлагаемого изобретения, на способы и устройства для выделения нуклеиновой кислоты из биологического образца специальные ограничения не накладываются, и эта процедура может быть выполнена при использовании коммерческого набора для выделения нуклеиновой кислоты.

После того как библиотека для секвенирования сконструирована, эту библиотеку вносят в секвенатор для получения результата секвенирования, представляющего собой множество данных секвенирования. Согласно вариантам предлагаемого изобретения, на способы и устройства для секвенирования специальные ограничения не накладываются, и может быть использован, в частности, способ обрыва нуклеотидной цепи (Sanger); предпочтение отдается высокопроизводительным методам. Таким образом, использование аппарата, обеспечивающего высокопроизводительное и глубокое секвенирование, позволяет дополнительно повысить эффективность процесса и, тем самым, дополнительно улучшить точность и сходимость последующего анализа (например, статистической проверки) полученных в результате секвенирования данных. Методы высокопроизводительного секвенирования включают, в частности, технологии секвенирования нового поколения или технологию секвенирования одиночных молекул (одномолекулярного секвенирования). Платформа секвенирования нового поколения (Metzker ML. Технологии секвенирования нового поколения. Nat Rev Genet. 2010 Jan; 11(1): 31-46) включают, в частности, платформы секвенирования Illumina-Solexa (GATM, HiSeq2000TM, etc), ABI-Solid и Roche-454 (пиросеквенирование). Платформа (технология) одномолекулярного секвенирования, в частности, включает технологию истинного одномолекулярного секвенирования ДНК компании Helicos Company, технологию одномолекулярного секвенирования в режиме реального времени (SMRT™) компании Pacific Biosciences Company и технологию нанопорового секвенирования, разработанную компанией Oxford Nanopore Technologies (Rusk, Nicole (2009-04-01), Cheap Third-Generation Sequencing (Дешевые технологии секвенирования третьего поколения) Nature Methods 6 (4): 244-245), и т.д. По мере постепенного развития технологии секвенирования специалисту в данной области станут понятными другие методы и оборудование для секвенирования, которые также могут быть использованы для полногеномного секвенирования. Согласно отдельным примерам предлагаемого изобретения, для секвенирования полногеномной библиотеки может быть использован, по крайней мере, один из следующих аппаратов: Illumina-Solexa, ABI-SOLiD, Roche-454 и аппарат для одномолекулярно секвенирования.

Полученный результат секвенирования может быть совмещен с эталонной последовательностью для определения данных секвенирования, соответствующих заданной области. Используемый в описании термин «заданная область» следует понимать в широком смысле, как относящийся к любой области молекулы нуклеиновой кислоты, содержащей возможный заданный объект. В случае анализа однонуклеотидного полиморфизма (ОНП; SNP), заданной областью может быть область, содержащая участок с ОНП. В случае анализа хромосомной анеуплодидии термин «заданная область» относится к подлежащей анализу части хромосомы или целой хромосоме, т.е. к выборочным данным секвенирования хромосомы. На методы выбора данных секвенирования, полученных для соответствующей области в результате секвенирования не накладываются специальные ограничения. Согласно вариантам предлагаемого изобретения, для получения данных секвенирования заданной области, все полученные данные секвенирования могут быть картированы к эталонной последовательности известной нуклеиновой кислоты. Дополнительно, согласно вариантам предлагаемого изобретения, заданная область может также представлять собой множество дискретных точек, непрерывно расположенных в геноме. Согласно вариантам предлагаемого изобретения, на тип используемой эталонной последовательности не накладываются специальные ограничения, и заданной последовательностью может являться любая известная последовательность, содержащая искомую область. Согласно вариантам предлагаемого изобретения, в качестве эталонной поверхности может быть использована известная эталонная последовательность генома человека. Например, согласно вариантам предлагаемого изобретения, эталонной последовательностью генома человека является последовательность NCBI 36.3, HG18. Согласно вариантам предлагаемого изобретения, специальные ограничения не накладываются также и на методы картирования. В конкретных примерах, для картирования может быть использовано программное обеспечение SOAP.

Следующим этапом является определение части последовательности нуклеиновой кислоты в заданной области генома на основании данных секвенирования, соответствующих заданной области; и определение других частей последовательности нуклеиновой кислоты на основании определенной части последовательности нуклеиновой кислоты в заданной области посредством использования алгоритма Витерби, для получения последовательности нуклеиновой кислоты в заданной области. Согласно изобретению, нуклеотидную последовательность в заданной области определяют на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике посредством использования скрытой марковской модели. Согласно вариантам предлагаемого изобретения, для определения нуклеотидной последовательности в заданной области используют скрытую марковскую модель и алгоритм Витерби. Таким образом, может быть выполнена пренатальная генетическая диагностика по генетической информации, содержащейся в геноме плода.

На Фиг. 1 подробно описан принцип анализа в скрытой марковской модели посредством использования алгоритма Витерби:

В генетическом значении термин «родственник» относится к лицам, имеющим генетическое родство с плодом. Например, согласно вариантам предлагаемого изобретения, «родственником» может быть представитель родительского поколения, т.е. отец и мать плода. Так, образование генома потомка равнозначно случайной рекомбинации геномов родителей (т.е. рекомбинации посредством обмена гаплотипов и случайной комбинации гамет). В случае плазмы беременной женщины, если исходят из того, что гаплотип плода (рекомбинация родительских гаплотипов) находится в скрытом состоянии, можно использовать данные, полученные при секвенировании плазмы, поскольку наблюдения (наблюдаемые последовательности), вероятности транзиций, вероятности наблюдаемых символов и распределение исходных состояний могут быть прослежены по предшествовавшим данным, затем можно определить наиболее вероятную рекомбинацию гаплотипов плода, используя скрытую марковскую модель и алгоритм Витерби, что позволит получить больше информации о плоде до рождения.

Ниже подробно показаны этапы анализа:

Marker:

I. Количество участков, которые необходимо детектировать, обозначают как N.

II. Гаплотипы родителей обозначают, соответственно, и ,

где

, i=1, 2, 3, …, N

III. Неизвестный гаплотип плода обозначают , в частности h0 и h1 соответственно, отражают наследование от матери и отца.

где , ,

Подстрочные индексы xi и yi, соответственно, представляют собой парные последовательности, и - это скрытые состояния, которые требуется декодировать.

При этом все, возможно, присутствующие скрытые состояния представляют собой набор Q.

IV. Данные секвенирования записывают следующим образом: , где представляет собой информацию, полученную при секвенировании участка, содержащего в некотором количестве четыре основания А, Ц, Т и Г.

V. Среднюю концентрацию (образца) плода и среднюю частоту ошибок при секвенировании, соответственно, записывают как ε и e.

Этап 1. Конструирование вектора распределения вероятностей для исходного состояния и матрицы переходов для рекомбинации гаплотипов:

I. Распределение вероятностей исходных состояний записывают как (j∈Q).

Согласно вариантам предлагаемого изобретения, в случае отсутствия референсных данных, можно исходить из того, что , т.е. возможности присутствия каждого скрытого состояния на каждом участке равны.

II. Согласно вариантам предлагаемого изобретения, вероятность рекомбинации гаплотипов записывают как pr=re/N, где re - это среднее число рекомбинаций гамет человека, и предшествующие данные варьирует от 25 до 30.

III. Согласно вариантам предлагаемого изобретения, матрицу переходов для рекомбинации гаплотипов записывают как (j,k∈Q), где ajk - это вероятность перехода скрытых состояний, т.е.

Подстрочные индексы xi и yi гаплотипов плода и составляют пару последовательности, и представляют собой скрытые состояния, подлежащие кодированию. Например, xi=0 означает "в материнской хромосоме аллелем в соответствующем локусе является mi0".

Этап 2. Конструирование матрицы вероятности наблюдений:

Согласно вариантам предлагаемого изобретения, матрицу вероятности наблюдений записывают как (i=1, 2, 3, …, N, j∈Q) где bi,j(si) означает «наблюдаемую возможность данной, полученной при секвенировании, информации на участке i, учитывая гаплотип матери и гаплотип плода (состояние j, )", т.е.

где Pi,base - это "возможность присутствия основания на участке i, учитывая, что гаплотип матери и гаплотип плода (состояния j, )", т.е.

где индикаторной функцией является

На данном этапе выполняется скрытое марковское моделирование (СММ; НММ); расчет распределения вероятности наблюдения на каждом участке bi,j(si), т.е. расчет возможности присутствия текущих данных секвенирования (наблюдений) в плазме беременной женщины, исходя из предположения о различии гаплотипов плода на каждом участке.

Этап 3. Конструирование частичной матрицы вероятностей и обратного перемещения (рассмотрим в качестве примера конструирование одномерной матрицы вероятности):

Определение: частичная вероятность

Определение: обратное перемещение

Используемые в настоящем документе термины «частичная вероятность» δi(qi) и «обратное перемещение» Ψi(qi) соответствуют классическим определениям алгоритма Витебри. Подробные описания определения параметра см. в публикации Lawrence R. Rabiner. PROCEEDINGS OF THE IEEE. Vol. 77. No. 2. February 1989, включенной в данный документ в форме ссылки.

Этап 4. Определение конечного состояния и отслеживание альтернативного пути

Определение конечного состояния,

Наиболее вероятный гаплотип плода (i=1, 2, 3, …, N-1) получают посредством отслеживания альтернативного пути на основании обратного перемещения.

Этап 5. Выведение результата

Таким образом, существует возможность эффективного анализа генома плода. По сравнению с другими известными способами антенатальной диагностики способ согласно предлагаемому изобретению может иметь следующие технические преимущества, главным образом, заключающиеся в точности и количестве получаемой информации:

1) Согласно вариантам предлагаемого изобретения, участок, который требуется обнаружить, не ограничивается участком отцовской ДНК; применительно к материнскому участку, т.е. гетерозиготному материнскому участку, также можно успешно выявить возможное наследование плодом материнского дефектного участка с точностью до 95% и более; и можно обнаружить аномалии, принадлежащие к множеству типов, что расширяет список диагностируемых заболеваний.

2) Информацию о множестве участков и заболеваний можно получить посредством однократного секвенирования; при этом метод, согласно предлагаемому изобретению ,позволяет точно и достоверно определить последовательности генов с малой степенью покрытия в плазме беременной женщины, которые невозможно точно определить посредством лишь увеличения глубины секвенирования.

3). Согласно предлагаемому изобретению, может быть получено графическое изображение генетического заболевания, по информации о других участках могут быть непосредственно установлены родственные заболевания, при возможности получения большого объема информации одномоментно, что особенно целесообразно при клинической диагностике.

Дополнительно, согласно вариантам предлагаемого изобретения, способ определения нуклеотидной последовательности в заданной области генома плода, не ограниченный определенными участками с генетическим полиморфизмом, такими как однонуклеотидный полиморфизм (SNP) или короткий тандемный повтор (STR), а адаптированный для всех генетических полиморфизмов, может параллельно применяться в отношении множества участков, для взаимного подтверждения. Помимо применения для антенатального неинвазивного получения информации о геноме плода с целью диагностики заболевания, способ, согласно предлагаемому изобретению, может применяться также для неинвазивного антенатального установления отцовства, т.е. определения личности отца плода до рождения, тем самым способствуя решению спорных вопросов, связанных с ответственностью и обязательствами, собственностью, случаями изнасилования и пр.

Система для определения нуклеотидной последовательности в заданной области генома плода

Предлагаемое изобретение также касается создания системы для определения нуклеотидной последовательности в заданной области генома плода. Согласно вариантам предлагаемого изобретения (см. Фиг. 2) система 1000 может включать: аппарат 100 конструирования библиотеки, аппарат 200 секвенирования (секвенатор) и аппарат 400 анализа (анализатор).

Согласно вариантам предлагаемого изобретения, аппарат 100 конструирования библиотеки предназначен для создания библиотеки для секвенирования, полученной из образца геномной ДНК плода. Согласно вариантам предлагаемого изобретения, секвенатор 200 соединен с аппаратом 100 конструирования библиотеки и предназначен для секвенирования библиотеки для секвенирования с целью получения результата, включающего множество полученных при секвенировании данных плода. Согласно вариантам предлагаемого изобретения, система 1000 может также включать аппарат выделения образца ДНК, предназначенный для выделения образца геномной ДНК плода из периферической крови беременной женщины. Таким образом, система предназначена для неинвазивной антенатальной диагностики.

Согласно изобретению, система может включать также аппарат 300 картирования, который соединен с секвенатором 200 и предназначен для картирования результата секвенирования последовательности плода к эталонной последовательности с целью получения результата секвенирования, соответствующего заданной области. В предлагаемом изобретении на способы и устройства для секвенирования специальные ограничения не накладываются, и можно использовать, в частности, способ обрыва нуклеотидной цепи (Sanger); предпочтение отдается высокопроизводительным методам. Так, использование аппарата, обеспечивающего высокопроизводительное и глубокое секвенирование, позволяет дополнительно повысить эффективность процесса и, тем самым дополнительно улучшить точность и сходимость последующего анализа (например, статистической проверки) полученных в результате секвенирования данных. Методы высокопроизводительного секвенирования включают, в частности, технологию секвенирования Next-Generation или технологию секвенирования одиночных молекул (одномолекулярного секвенирования). Платформа секвенирования Next-Generation (Metzker ML. Технологии секвенирования нового поколения. Nat Rev Genet. 2010 Jan; 11(1): 31-46) включает, в частности, платформы секвенирования Illumina-Solexa (GATM, HiSeq2000TM, etc), ABI-Solid и Roche-454 (пиросеквенирование). Платформа (технология) одномолекулярного секвенирования, в частности, включает технологию истинного одномолекулярного секвенирования ДНК компании Helicos Company, технологию одномолекулярного секвенирования в режиме реального времени (SMRT™) компании Pacific Biosciences Company и технологию нанопорового секвенирования, разработанную компанией Oxford Nanopore Technologies (Rusk, Nicole (2009-04-01), Cheap Third-Generation Sequencing (Дешевые технологии секвенирования третьего поколения) Nature Methods 6 (4): 244-245), и т.д.

По мере постепенного развития технологии секвенирования специалисту в данной области станут понятными другие методы и оборудование для секвенирования, которые также могут быть использованы для полногеномного секвенирования. Согласно отдельным примерам предлагаемого изобретения, для секвенирования полногеномной библиотеки может быть использован, по крайней мере, один из следующих аппаратов: Illumina-Solexa, ABI-SOLiD, Roche-454 и аппарат для одномолекулярноо секвенирования. В предлагаемом изобретении на тип используемой эталонной последовательности не накладываются специальные ограничения, и эталонной может являться любая известная последовательность, содержащая искомую область. В частности в качестве эталонной последовательности может быть использована известная эталонная последовательность генома человека, например последовательность NCBI 36.3, HG18. Также предлагаемое изобретение, не накладывает специальные ограничения на методы картирования. Согласно конкретным примерам, для картирования может быть использовано программное обеспечение SOAP.

Согласно вариантам предлагаемого изобретения, анализатор 400 соединен с секвестором и позволяет определить нуклеотидную последовательность в заданной области на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике посредством использования скрытой марковской модели.

В соответствии с изобретением, в алгоритме Витерби 0,25 используют в качестве распределения вероятности исходных состояний, re/N используют как вероятность рекомбинации, где re равен 25~30, предпочтительно, re равен 25 и N - длина заданной области,

используют в качестве матрицы переходов для рекомбинации, где pr равен re/N.

Согласно изобретению, аппарат картирования предназначен для определения основания, присутствующего с наибольшей вероятностью, на основании следующей формулы:

где .

Анализ полученных в результате секвенирования данных также применяется в системе для определения нуклеотидной последовательности в заданной области генома плода. Он подробно описан выше и не включен в данный раздел для краткости.

Таким образом, использование системы позволяет эффективно осуществить описанный выше способ определения нуклеотидной последовательности в заданной области генома плода, на основании которой может быть определена нуклеотидная последовательность заданной области генома плода посредством использования скрытой марковской модели и алгоритма Витерби и, соотносясь с генетической информации о родственнике, тем самым провести пренатальную генетическую диагностику по генетической информации, содержащейся в геноме плода.

Согласно предлагаемому изобретению, заданная область - это участок, в котором ранее был определен генетический полиморфизм, и генетический полиморфизм представлен, по крайней мере, одним из следующих полиморфизмов: однонуклеотидным полиморфизмом или коротким тандемным повтором (STR).

Термин «соединенный» следует понимать в широком смысле. Он может относиться к прямому соединению и непрямому соединению, при условии достижения вышеописанного функционального соединения.

Специалистам в данной области техники следует принять во внимание, что описанные выше характеристики и преимущества способа определения нуклеотидной последовательности в заданной области генома плода могут быть адаптированы для применения вместе с системой для определения нуклеотидной последовательности в заданной области генома плода.

Машиночитаемая среда

Еще одним объектом предлагаемого изобретения является машиночитаемая среда, которая включает множество команд, предназначенных для определения нуклеотидной последовательности в заданной области на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике посредством использования скрытой марковской модели. Таким образом, использование машиночитаемой среды позволяет эффективно осуществить описанный выше способ определения нуклеотидной последовательности в заданной области генома плода, на основании которой может быть определена нуклеотидная последовательность заданной области генома плода посредством использования скрытой марковской модели и, например, алгоритма Витерби и, соотносясь с генетической информацией о родственнике, тем самым провести пренатальную генетическую диагностику по генетической информации, содержащейся в геноме плода.

Согласно изобретению, множество команд предназначено для определения нуклеотидной последовательности в заданной области генома посредством использования скрытой марковской модели и алгоритма Витерби. Согласно вариантам предлагаемого изобретения, в алгоритме Витерби 0,25 используют в качестве распределения вероятности исходных состояний, re/N - как вероятность рекомбинации, где re равен 25~30, предпочтительно, re равен 25 и N - длина заданной области.

используют в качестве матрицы переходов для рекомбинации, где pr равен re/N.

В предлагаемом изобретении множество команд адаптируют для определения основания, присутствующего с наибольшей вероятностью, на основании следующей формулы:

где .

Подробно описанный выше анализ полученных в результате секвенирования данных также может быть осуществлен в машиночитаемой среде и не включен в данный раздел для краткости.

В предлагаемом изобретении заданная область - это участок, в котором ранее был определен генетический полиморфизм, и генетический полиморфизм представлен, по крайней мере, одним из следующих полиморфизмов: однонуклеотидным полиморфизмом или коротким тандемным повтором (STR).

В данном описании «машиночитаемой средой» может быть любое устройство, пригодное для включения в себя, хранения, обмена, распространения или передачи программ, используемых системой, устройством или исполняющим команды оборудованием, или взаимодействующее с этой системой, устройством или оборудованием. Частные примеры машиночитаемой среды включают, например: электронное соединение (электронное устройство) с одним или несколькими проводами; портативный компьютер (магнитное устройство), оперативное запоминающее устройство (ОЗУ; ROM), стираемое программируемое постоянное запоминающее устройство (СППЗУ; EPROM или флэш-память), оптоволоконное устройство и портативное постоянное запоминающее устройство на основе компакт-диска (ПЗУ-КД; CDROM). Дополнительно, машиночитаемой средой может быть даже бумага или другая соответствующая среда, на которой могут быть напечатаны программы, в связи с возможностью оптического сканирования бумаги или другой соответствующей среды с последующим редактированием, дешифровкой или обработкой другими надлежащими способами при необходимости получения программы в электронном виде, после чего программы могут храниться в компьютерной памяти.

Следует понимать, что каждая часть предлагаемого изобретения может быть реализована при использовании аппаратного обеспечения, программного обеспечения, аппаратно-программного обеспечения и их сочетания. В приведенных выше вариантах изобретения множество этапов или методов может быть реализовано программным обеспечением или аппаратно-программным обеспечением, хранящимся в памяти, и может быть исполнено соответствующей системой исполнения команд. Например, в случае реализации аппаратным обеспечением (аналогично тому, как и в другом варианте изобретения), этапы или методы могут быть реализованы одним из технических приемов или несколькими техническими приемами, известными из уровня техники: дискретной логической схемой, предназначенной для реализации логической функции или сигнала данных; специализированной интегральной схемой, имеющей соответствующую комбинационную логическую стробирующую схему; программируемой логической матрицей (ПЛМ; PGA), программируемой пользователем логической матрицей (ППЛМ; FPGA) и т.д.

Специалистам в данной области очевидно, что этапы приведенного выше в качестве примера способа, согласно предлагаемому изобретению, полностью или частично, могут быть достигнуты посредством использования программ для управления аппаратным обеспечением. Программы могут храниться в машиночитаемом хранилище данных, и программы включают один этап или комбинацию этапов в вариантах способа, согласно предлагаемому изобретению, при осуществлен