Способ обнаружения микроделеций в области хромосомы с днк-маркирующим участком
Иллюстрации
Показать всеИзобретение касается способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком. Способ включает выбор области хромосомы с ДНК-маркирующим участком; получение зонда захвата, соответствующего последовательности ДНК в указанной области; гибридизацию зонда захвата со смешанной библиотекой для связывания с последовательностью из множества образцов ДНК из области с ДНК-маркирующим участком; секвенирование захваченной последовательности ДНК из области с ДНК-маркирующим участком для получения данных секвенирования и анализ результатов секвенирования с использованием метода математической статистики с получением результата, показывающего наличие или отсутствие микроделеции в области хромосомы с ДНК-маркирующим участком в каждом из множества образцов ДНК. Изобретение позволяет эффективно и точно детектировать известные и неизвестные микроделеции в области хромосомы с ДНК-маркирующим участком при обработке большого количества образцов ДНК. 13 з.п. ф-лы, 29 ил., 8 табл.
Реферат
ОБЛАСТЬ ТЕХНИКИ
Объекты предлагаемого изобретения, в целом, относятся к генной инженерии и, в частности, к способу обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком, и используемому с этой целью устройству.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ
Делеция - это частичная потеря хромосомы или молекул ДНК в геноме, которая является одной из важнейших причин, приводящих к генетической мутации.
В настоящее время для обнаружения микроделеций в ДНК-маркирующем участке обычно используют метод ПЦР (полимеразной цепной реакции). Метод ПЦР позволяет выборочно амплифицировать определенный участок ДНК in vitro, воспроизводя сценарий репликации ДНК in vivo. Преимущества использования метода ПЦР включают быстроту и удобство при детекции небольшого числа участков. Кроме того, для конструирования зонда требуется заранее знать последовательности на обоих концах определенной области ДНК, и с этой целью необходимо, чтобы эти микроделеций в ДНК-маркирующем сайте хромосомы были заранее известны.
Но детекция методом ПЦР при наличии большого числа образцов или неизвестных микроделеций может иметь серьезные ограничения. Так, при необходимости обнаружения области с ДНК-маркирующим участком, включающей относительно большое число участков, или, в частности, в процессе поиска, традиционный метод ПЦР не отвечает поставленным требованиям, в связи с чем существует потребность в новом методе исследования.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Основная техническая проблема, которую решает предложенное изобретение, заключается в создании способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком и используемого с этой целью аппарата, которые позволят обнаруживать микроделеций в области хромосомы с ДНК-маркирующим участком при работе с большим количеством образцов и ограниченности ресурсов, и также позволят обнаруживать неизвестные микроделеций в области хромосомы с ДНК-маркирующим участком.
Для решения вышеуказанной технической проблемы в предложенном изобретении используется техническое решение, относящееся к способу обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком, который включает:
получение зонда захвата, соответствующего последовательности ДНК в области с ДНК-маркирующим участком;
гибридизацию зонда захвата со смешанной библиотекой из множества образцов ДНК для связывания с последовательностью ДНК из области с ДНК-маркирующим участком, из множества образцов ДНК;
секвенирование захваченной последовательности ДНК из области с ДНК-маркирующим участком, для получения данных секвенирования, и
анализ результатов секвенирования с использованием метода математической статистики с получением результата, показывающего наличие или отсутствие микроделеций в области хромосомы с ДНК-маркирующим участком в каждом из множества образцов ДНК.
В предпочтительном варианте этап анализа полученных при секвенировании данных с использованием статистических критериев включает:
нормализацию значения глубины секвенирования области с ДНК-маркирующим участком с целью получения нормализованного значения глубины секвенирования; и
поиск резко отклоняющихся («выбрасывающихся») значений глубины секвенирования области с ДНК-маркирующим участком, основанный на нормализованном значении глубины секвенирования, с использованием метода математической статистики, для получения результата, показывающего наличие или отсутствие микроделеций в области хромосомы с ДНК-маркирующим участком в каждом из множества образцов ДНК.
В предпочтительном варианте, этап нормализации значения глубины секвенирования ДНК-маркирующего участка включает:
деление всех значений глубины секвенирования одной и той же области в каждом из множества образцов ДНК на среднее значение глубины каждого из множества образцов ДНК, с целью получения нормализованных значений глубины секвенирования одной и той же области для множества образцов ДНК.
Предпочтительный вариант этапа поиска резко отклоняющихся значений глубины секвенирования области с ДНК-маркирующим участком включает:
расчет среднего значения и дисперсии на основании всех нормализованных значений глубины секвенирования одной и той же области во множестве образцов ДНК;
построение графика нормального распределения по всем «невыбрасывающимся» значениям для одной и той же области, на основании рассчитанного среднего значения и дисперсии всех нормализованных значений глубины в одной и той же области для каждого из множества образцов ДНК;
расчет вероятности для каждого из множества образцов ДНК в каждой области, для которой имеется конкретное значение глубины секвенирования, на основании графика нормального распределения;
определение первого критического значения вероятности на основании вероятности, полученной для каждого из множества образцов ДНК в заданной области, для которой имеется конкретное значение глубины секвенирования; и
получение результата R1, показывающего наличие микроделеций в заданной области, если для одного из множества образцов ДНК вероятность в заданной области, для которой имеется конкретное значение глубины секвенирования, меньше первого критического значения вероятности.
В предпочтительном варианте после этапа получения результата R1 способ включает:
экспериментальную проверку результата R1 для получения результата проверки;
определение второго критического значения вероятности на основании результата проверки, в котором второе критическое значение вероятности меньше первого критического значения вероятности; и
получение результата R2, показывающего наличие микроделеций в заданной области, если для одного из множества образцов ДНК вероятность в заданной области, для которой имеется конкретное значение глубины секвенирования, меньше второго критического значения вероятности.
Предпочтительный вариант этапа поиска резко отклоняющихся значений глубины секвенирования области с ДНК-маркирующим участком включает:
расчет первого отношения D/S между нормализованным значением глубины в заданной области, полученным для множества образцов ДНК; и медианой всех значений глубины секвенирования, полученных для каждого из множества образцов ДНК, на основании нормализованного значения глубины области с ДНК-маркирующим участком, рассчитанного для множества образцов ДНК;
расчет первого отношения D/R между нормализованным значением глубины в заданной области, полученным для множества образцов ДНК; и медианой значений глубины секвенирования, полученных для всех областей, на основании нормализованного значения глубины области с ДНК-маркирующим участком, рассчитанного для множества образцов ДНК;
обучение критического значения первого отношения первому отношению D/S с использованием алгоритма ID3 и обучение критического значения второго отношения первому отношению D/R с использованием алгоритма ID3;
получение результата, показывающего отсутствие микроделеций в заданной области множества образцов ДНК, если первое отношение D/S больше критического значения первого отношения;
получение результата, показывающего отсутствие микроделеций в заданной области множества образцов ДНК, если первое отношение D/S меньше критического значения первого отношения и первое отношение D/R больше критического значения второго отношения; и
получение результата, показывающего наличие микроделеций в заданной области множества образцов ДНК, если первое отношение D/S меньше критического значения первого отношения и первое отношение D/R меньше критического значения второго отношения.
В предпочтительном варианте этап поиска резко отклоняющегося значения глубины секвенирования области с ДНК-маркирующим участком включает:
расчет среднего значения и дисперсии на основании всех нормализованных значений глубины одной и той же области для каждого из множества образцов ДНК;
построение графика нормального распределения по всем «невыбрасьшающимся» значениям для одной и той же области, на основании рассчитанного среднего значения и дисперсии всех нормализованных значений глубины в одной и той же области для каждого из множества образцов ДНК;
расчет вероятности для каждого из множества образцов ДНК в каждой области, для которой имеется конкретное значение глубины секвенирования, на основании графика нормального распределения;
определение третьего критического значения вероятности на основании вероятности, полученной для каждого из множества образцов ДНК в заданной области, для которой имеется конкретное значение глубины секвенирования;
получение результата R3, показывающего наличие микроделеций в заданной области, если для одного из множества образцов ДНК вероятность в заданной области, для которой имеется конкретное значение глубины секвенирования, меньше третьего критического значения вероятности;
расчет второго отношения D/S между нормализованным значением глубины в заданной области, полученным для множества образцов ДНК; и медианой всех значений глубины секвенирования, полученных для каждого из множества образцов ДНК в результате R3;
расчет второго отношения D/R между нормализованным значением глубины в заданной области, полученным для множества образцов ДНК; и медианой значений глубины секвенирования, полученных для всех областей, в результате R3;
обучение критического значения третьего отношения второму отношению D/S при использовании алгоритма ID3 и обучение критического значения четвертого отношения второму отношению D/R при использовании алгоритма ID3;
получение результата, показывающего отсутствие микроделеций в заданной области множества образцов ДНК, если второе отношение D/S больше критического значения третьего отношения;
получение результата, показывающего отсутствие микроделеций в заданной области множества образцов ДНК, если второе отношение D/S меньше критического значения третьего отношения и второе отношение D/R больше критического значения четвертого отношения; и
получение результата, показывающего наличие микроделеций в заданной области множества образцов ДНК, если второе отношение D/S меньше критического значения третьего отношения и второе отношение D/R меньше критического значения четвертого отношения.
Предпочтительно этап получения зонда захвата включает:
нахождение последовательности ДНК в области с ДНК-маркирующим участком в геномной базе данных;
выбор квалифицированной последовательности ДНК в области с ДНК-маркирующим участком, соответствующей требованиям к конструированию зонда захвата; и
проектирование и синтез зонда захвата на основании квалифицированной последовательности ДНК.
В предпочтительном варианте создание смешанной библиотеки из множества образцов ДНК включает следующие этапы:
создание множества библиотек ДНК для множества отдельных образцов ДНК, таким образом, чтобы каждая из множества библиотек ДНК имела адаптор, отличающийся от адаптора других библиотек ДНК;
смешивание множества библиотек ДНК в заданном соотношении; и
определение полученной смеси как смешанной библиотеки, если полученная смесь соответствует требованиям контроля качества.
В предпочтительном варианте на этапе создания множества библиотек ДНК из множества отдельных образцов ДНК конструирование библиотеки ДНК для каждого из множества отдельных образцов ДНК включает следующие подэтапы:
фрагментацию геномной ДНК на фрагменты ДНК заданного размера с использованием для этого физических или химических методов;
концевую репарацию фрагментов ДНК с получением фрагментов ДНК с репарированными - фосфорилированными концами;
добавление основания "А" к фрагментам ДНК с репарированными концами с 3'-конца, для того чтобы получить фрагменты ДНК с основанием "А" на 3'-конце;
лигирование Индекс-адаптора с фрагментами ДНК, имеющими основание «А» на 3'-конце, для получения фрагментов ДНК, лигированных с Индекс-адаптором;
амплификацию фрагментов ДНК, лигированных с Индекс-адаптором, при использовании праймера, включающего последовательность, специфичную к Индекс-адаптору, для получения продукта амплификации; и
определение продукта амплификации как библиотеки ДНК, если продукта амплификации соответствует требованиям контроля качества.
В предпочтительном варианте, после этапа секвенирования захваченной последовательности ДНК и до этапа анализа результатов секвенирования способ включает контроль качества результатов секвенирования.
Предпочтительно, этап контроля качества результатов секвенирования включает:
фильтрование первых неквалифицированных данных, содержащихся в результате секвенирования, для получения первых квалифицированных данных секвенирования;
картирование первых квалифицированных данных секвенирования к эталонной геномной последовательности посредством использования программного обеспечения для картирования коротких последовательностей, и расчет первого параметра корреляции для значения глубины секвенирования для каждого из множества образцов ДНК и второго параметра корреляции для значения глубины секвенирования для области с ДНК-маркирующим участком, содержащей заданную последовательность среди множества образцов ДНК;
фильтрование вторых неквалифицированных данных, содержащихся в результате секвенирования, на основании первого рассчитанного параметра корреляции, для получения вторых квалифицированных данных секвенирования; и
фильтрование третьих неквалифицированных данных, содержащихся в результате секвенирования, на основании второго рассчитанного параметра корреляции, для получения третьих квалифицированных данных секвенирования области с ДНК-маркирующим участком, содержащей заданную последовательность.
В предпочтительном варианте, этап фильтрования первых неквалифицированных данных, содержащихся в результате секвенирования, для получения первых квалифицированных данных секвенирования, включает:
получение первого набора секвенированных данных посредством фильтрования неквалифицированных данных, содержащих больше заданного процента низкокачественных оснований, из данных секвенирования;
получение второго набора секвенированных данных посредством фильтрования неквалифицированных данных, содержащих более 10% неопределенных оснований, из первого набора секвенированных данных;
получение третьего набора секвенированных данных посредством фильтрования неквалифицированных данных, содержащих последовательность сиквенс-адаптора, из второго набора секвенированных данных после картирования к библиотеке последовательностей сиквенс-адаптеров; и
получение первых квалифицированных данных секвенирования посредством фильтрования неквалифицированных данных, содержащих экзогенную последовательность, из третьего набора секвенированных данных после картирования ко всем внесенным экзогенным последовательностям.
В предпочтительном варианте, этап фильтрования вторых неквалифицированных данных, содержащихся в результате секвенирования, включает:
получение нижнего квартиля Q1, верхнего квартиля Q3 и межквартильного размаха (МКР) посредством использования квартальной функции и упорядочивание всех значений глубины секвенирования для множества образцов ДНК в первых квалифицированных данных секвенирования в возрастающем порядке; и
фильтрование неквалифицированных данных секвенирования со значениями глубины секвенирования вне интервала от Q1-1,5 МКР до Q3+l,5 МКР, для получения вторых квалифицированных данных секвениирования.
В предпочтительном варианте, этап фильтрования третьих неквалифицированных данных, содержащихся в результате секвенирования, включает:
получение нижнего квартиля Q1, верхнего квартиля Q3 и межквартильного размаха (МКР) посредством использования квартальной функции и упорядочивание всех значений глубины секвенирования в заданной области для различных образцов ДНК во вторых квалифицированных данных секвенирования в возрастающем порядке; и
фильтрование неквалифицированных данных, у которых медиана значений глубины секвенирования в заданной области в различных образцах ДНК равна нулю или больше чем Q3+1,5 МКР, с получением третьих квалифицированных данных секвенирования.
Для решения вышеуказанной технической проблемы служит другой объект предлагаемого изобретения - аппарат для обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком, который может включать:
устройство для получения зонда захвата, соответствующего последовательности ДНК в области с ДНК-маркирующим участком;
устройство для гибридизации зонда захвата со смешанной библиотекой образцов ДНК, для связывания последовательности ДНК в области с ДНК-маркирующим участком из множества образцов ДНК;
устройство для получения данных секвенирования захваченной последовательности ДНК из области с ДНК-маркирующим участком; и
устройство для получения результата при выявлении микроделеций, выполняющее анализ данных секвенирования посредством использования метода математической статистики с получением результата, показывающего наличие или отсутствие микроделеций в области хромосомы с ДНК-маркирующим участком в каждом из множества образцов ДНК.
Предпочтительно устройство для получения результата при выявлении микроделеций включает:
блок для нормализации значения глубины секвенирования области с ДНК-маркирующим участком с получением нормализованного значения глубины секвенирования; и
блок выявления микроделеций для обнаружения резко отклоняющихся значений глубины секвенирования области с ДНК-маркирующим участком на основании нормализированного значения глубины секвенирования при использовании метода математической статистики с получением результата, показывающего наличие или отсутствие микроделеций в области хромосомы с ДНК-маркирующим участком в каждом из множества образцов ДНК.
В предпочтительном варианте, блок для нормализации значений глубины секвенирования используют для деления всех значений глубины секвенирования одной и той же области в каждом из множества образцов ДНК на среднее значение глубины каждого из множества образцов ДНК, чтобы получить нормализованные значения глубины в одной и той же области для множества образцов ДНК.
В предпочтительном варианте, блок выявления микроделеций включает:
модуль для получения среднего значения и дисперсии для расчета среднего значения и дисперсии на основании всех нормализованных значений глубины секвенирования в одной и той же области каждого из множества образцов ДНК;
модуль построения графика нормального распределения по всем «невыбрасывающимся» значениям для одной и той же области, на основании рассчитанных средних значений и дисперсии всех нормализованных значений глубины в одной и той же области каждого из множества образцов ДНК;
модуль расчета вероятности, для расчета вероятности для каждого из множества образцов ДНК в каждой области, для которой имеется конкретное значение глубины секвенирования, на основании графика нормального распределения; и
первый модуль определения, для определения первого критического значения вероятности на основании вероятности, полученной для каждого из множества образцов ДНК в заданной области, для которой имеется конкретное значение глубины секвенирования, и для получения результата R1, показывающего наличие микроделеций в заданной области, если для одного из множества образцов ДНК вероятность в заданной области, для которой имеется конкретное значение глубины секвенирования, меньше первого критического значения вероятности.
Предпочтительно, блок выявления микроделеций, кроме того, включает:
модуль определения критического значения вероятности, для экспериментальной проверки результата R1 с получением результата проверки, и для определения второго критического значения вероятности, основанного на результате проверки, в котором второе критическое значение вероятности меньше первого критического значения вероятности; и
второй модуль определения, для получения результата R2, показывающего наличие микроделеций в заданной области, если для одного из множества образцов ДНК вероятность в заданной области, для которой имеется конкретное значение глубины, меньше второго критического значения вероятности.
В предпочтительном варианте, блок выявления микроделеций также включает:
модуль получения первого отношения D/S, для расчета первого отношения D/S между нормализованным значением глубины в заданной области, полученным для множества образцов ДНК, и медианой всех значений глубины секвенирования, полученных для каждого из множества образцов ДНК, на основании нормализованного значения глубины области с ДНК-маркирующим участком, рассчитанного для множества образцов ДНК;
модуль получения первого отношения D/R, для расчета первого отношения D/R между нормализованным значением глубины в заданной области, полученным для множества образцов ДНК, и медианой значений глубины секвенирования, полученных для всех областей, на основании нормализованного значения глубины области с ДНК-маркирующим участком, рассчитанного для множества образцов ДНК;
модуль получения критического значения первого отношения, для обучения критического значения первого отношения первому отношению D/S при использовании алгоритма ID3, и обучения критического значения второго отношения первому отношению D/R при использовании алгоритма ID3;
третий модуль определения, для получения результата, показывающего отсутствие микроделеций в заданной области множества образцов ДНК, если первое отношение D/S больше критического значения первого отношения;
четвертый модуль определения, для получения результата, показывающего отсутствие микроделеций в заданной области множества образцов ДНК, если первое отношение D/S меньше критического значения первого отношения, и первое отношение D/R больше критического значения второго отношения; и
пятый модуль определения, для получения результата, показывающего наличие микроделеций в заданной области множества образцов ДНК, если первое отношение D/S меньше критического значения первого отношения, и первое отношение D/R меньше критического значения второго отношения.
Предпочтительно, блок для выявления микроделеций, кроме того, включает:
модуль получения среднего значения и дисперсии, для расчета среднего значения и дисперсии на основании всех нормализованных значений глубины секвенирования в одной и той же области каждого из множества образцов ДНК;
модуль построения графика нормального распределения, для построения графика нормального распределения по всем «невыбрасывающимся» значениям для одной и той же области, на основании рассчитанных средних значений и дисперсии всех нормализованных значений глубины в одной и той же области каждого из множества образцов ДНК;
модуль расчета вероятности, для расчета вероятности для каждого из множества образцов ДНК в каждой области, для которой имеется конкретное значение глубины секвенирования, на основании графика нормального распределения;
шестой модуль определения, для определения третьего критического значения вероятности на основании вероятности, полученной для каждого из множества образцов ДНК в заданной области, для которой имеется конкретное значение глубины секвенирования, и для получения результата R3, показывающего наличие микроделеций в заданной области, если для одного из множества образцов ДНК вероятность в заданной области, для которой имеется конкретное значение глубины секвенирования, меньше третьего критического значения вероятности;
модуль получения второго отношения D/S для расчета второго отношения D/S между нормализованным значением глубины в заданной области, полученным для множества образцов ДНК, и медианой всех значений глубины секвенирования полученных для каждого из множества образцов ДНК в результате R3;
модуль получения второго отношения D/R для расчета второго отношения между нормализованным значением глубины в заданной области, полученным для множества образцов ДНК, и медианой значений глубины секвенирования, полученных для всех областей в результате R3;
модуль определения критического значения второго отношения, для обучения критического значения третьего отношения второму отношению D/S при использовании алгоритма ID3, и обучения критического значения четвертого отношения второму отношению D/R при использовании алгоритма ID3;
седьмой модуль определения, для получения результата, показывающего отсутствие микроделеций в заданной области множества образцов ДНК, если второе отношение D/S больше критического значения третьего отношения;
восьмой модуль определения, для получения результата, показывающего отсутствие микроделеций в заданной области множества образцов ДНК, если второе отношение D/S меньше критического значения третьего отношения и второе отношение D/R больше критического значения четвертого отношения; и
девятый модель определения, для получения результата, показывающего наличие микроделеций в заданной области множества образцов ДНК, если второе отношение D/S меньше критического значения третьего отношения и второе отношение D/R в результате R3 меньше критического значения четвертого отношения.
В предпочтительном варианте, устройство для получения зонда захвата включает:
блок нахождения области, для нахождения в геномной базе данных последовательности ДНК, соответствующей области с ДНК-маркирующим участком,
блок выбора последовательности, для выбора квалифицированной последовательности ДНК в области с ДНК-маркирующим участком, соответствующей требованиям к конструированию зонда захвата; и
блок получения зонда захвата, для проектирования и синтеза зонда захвата на основании квалифицированной последовательности ДНК.
В предпочтительном варианте аппарат согласно изобретению может включать устройство для создания смешанной библиотеки, которое содержит:
блок создания множества библиотек ДНК для множества отдельных образцов ДНК, таким образом, чтобы каждая из множества библиотек ДНК имела адаптор, отличающийся от адаптора других библиотек ДНК;
блок смешивания, для смешивания множества библиотек ДНК в заданном соотношении; и
блок создания смешанной библиотеки, для определения полученной смеси, как смешанной библиотеки, если полученная смесь соответствует требованиям контроля качества.
В предпочтительном варианте, аппарат в соответствии с предложенным изобретением может включать устройство контроля качества, которое содержит:
первый блок фильтрования, для фильтрования первых неквалифицированных данных, содержащихся в результате секвенирования, и получения первых квалифицированных данных секвенирования;
блок расчета значения глубины секвенирования, для картирования первых квалифицированных данных секвенирования к эталонной геномной последовательности посредством использования программного обеспечения для картирования коротких последовательностей, и расчета первого параметра корреляции для значения глубины секвенирования для каждого из множества образцов ДНК и второго параметра корреляции для значения глубины секвенирования для области с ДНК-маркирующим участком, содержащей заданную последовательность, среди множества образцов ДНК;
второй блок фильтрования, для фильтрования вторых неквалифицированных данных, содержащихся в результате секвенирования, на основании первого рассчитанного параметра корреляции, и получения вторых квалифицированных данных секвенирования; и
третий блок фильтрования, для фильтрования третьих неквалифицированных данных, содержащихся в результате секвенирования, на основании второго рассчитанного параметра корреляции, и получения третьих квалифицированных данных секвенирования области с ДНК-маркирующим участком, содержащей заданную последовательность.
Предложенное изобретение включает отличающиеся от предшествующего уровня техники способ обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком, и используемый с этой целью аппарат, посредством которых получают зонд захвата, перекрывающий полную область хромосомы с ДНК-маркирующим участком, связывают последовательность ДНК, в области с ДНК-маркирующим участком из множества образцов ДНК, и после гибридизации со смешанной библиотекой, включающей множество образцов ДНК, эффективно и точно детектируют известные и неизвестные микроделеций в области хромосомы с ДНК-маркирующим участком при обработке большого количества образцов ДНК. Процесс анализа секвенированных данных с помощью метода математической статистики является научно-обоснованным, стабильным, высокочувствительным, обеспечивает низкую частоту ложноположительных результатов, что позволяет использовать его для эффективного анализа микроделеций. В предложенном изобретении также используется машиночитаемый носитель, включающий команды с настройками для осуществления процессором описанного выше способа.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
На Фиг. 1 - Фиг. 7, Фиг. 10, Фиг. 12 - Фиг. 15 и Фиг. 19 представлены согласно предложенному изобретению блок-схемы, показывающие этапы способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком;
Фиг. 8 - гистограмма, показывающая отсеянный/забракованный образец с резко отклоняющимся значением глубины секвенирования, определенный при использовании способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг. 9 - гистограмма, показывающая образец с нормальным значением глубины секвенирования, определенный при использовании способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг. 11 - гистограмма, показывающая образец с нормальным значением глубины секвенирования, определенный при использовании способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг. 16 - диаграмма, на которой показан иллюстративный пример дерева решений, полученный при использовании алгоритма ID3, включенного в способ обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг. 17 - часть блок-схемы, на которой показан анализ с использованием дерева решений, включенный в способ обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг. 18 - блок-схема, на которой показан анализ с использованием дерева решений, включенный в способ обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с другим вариантом данного изобретения;
Фиг. 20 - гистограмма и коробчатая диаграмма, показывающая медиану значения глубины секвенирования образца, полученные при использовании способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг.21 - гистограмма и коробчатая диаграмма, показывающая значение глубины секвенирования области, полученные при использовании способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг. 22 - диаграмма, показывающая вероятность при определенном значении глубины секвенирования согласно способу обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг. 23 - диаграмма, показывающая порог вероятности и взаимосвязь между ожиданием порога вероятности и наблюдаемым порогом вероятности, полученная при использовании способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг. 24 - диаграмма, показывающая отношение частоты истинно положительных значений к частоте ложноположительных значений при использовании способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг. 25 - схема аппарата для обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с вариантом данного изобретения;
Фиг. 26 - схема аппарата для обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с другим вариантом данного изобретения;
Фиг. 27 - схема аппарата для обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с иным вариантом данного изобретения;
Фиг. 28 - схемы аппарата для обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с еще одним вариантом данного изобретения;
Фиг. 29 - диаграмма, показывающая схему аппарата для обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком в соответствии с еще одним вариантом данного изобретения.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Далее приводятся подробные ссылки на чертежи и варианты предлагаемого изобретения. Термины «первый» и «второй» используются в настоящем документе с описательной целью и не указывают и не подразумевают относительную важность или значение признаков.
Фиг. 1 - блок-схема способа обнаружения микроделеций в области хромосомы с ДНК-маркирующим участком, в соответствии с вариантом предложенного изобретения. Как показано на Фиг. 1, способ включает:
этап 101: Получение зонда захвата соответствующего последовательности ДНК в области с ДНК-маркирующим участком.
ДНК-маркирующий участок (STS) - это короткая однокопийная последовательность ДНК с известной локализацией, служащая маркером, которая может быть уникально картирована при амплификации методом ПЦР, с целью получения участка для картирования, а именно, детекция с использованием серии STS позволяет картировать область генома. Зонд - это короткий фрагмент одноцепочечной ДНК или РНК (состоящий приблизительно из 20-500 п.н.), используемый для детекции комплементарной ему последовательности нуклеиновой кислоты.
этап 102: Гибридизация зонда захвата с множеством образцов ДНК из смешанной библиотеки (сложной смеси), для связывания/захвата последовательности ДНК в области с ДНК-маркирующим участком, во множестве образцов ДНК.
В данном описании выражение «смешанные библиотеки» относится ко всем последовательностям ДНК, используемым для секвенирования и полученным посредством смешивания библиотек ДНК, которые были созданы для множества отдельных образцов ДНК. Этапы создания смешанной библиотеки подробно описаны ниже.
этап 103: секвенирование захваченной последовательности ДНК, из соответствующей области с ДНК-маркирующим участком, для получения данных секвенирования.
этап 104: анализ результатов секвенирования с использованием метода математической статистики с получением результата, показывающего наличие или отсутствие микроделеций в области хромосомы с ДНК-маркирующим участком в каждом из множества образцов ДНК.
Математическая статистика - одно из направлений математики, которая развивается вместе с разработкой теории вероятности, изучает эффективную оптимизацию, систематизацию и анализ данных, зависимых от случайных факторов, создающих основу для принятия определенных решений или выполнения определенных действий, на основании которых можно делать логические выводы или прогнозировать исходы рассматриваемых ситуаций.
В соответствии с одним из вариантов изобретения, показанным на Фиг. 2, этап получения зонда захвата включает:
этап 201: нахождение последовательности ДНК в области с ДНК-маркирующим участком в геномной базе данных.
Основываясь на координатах, последовательность ДНК, локализованная в области Y-хромосомы с ДНК-маркирующим участком, может быть найдена в базе данных UCSC с координатами, соответствующими референсной последовательности генома челов