Способ анализа нарушений, связанных с раком яичников

Иллюстрации

Показать все

Изобретение относится к области генной инженерии, конкретно к анализу нарушений, связанных с раком яичников, и может быть использовано в медицине. Способ включает определение геномного статуса метилирования CpG-динуклеотидов в каждой последовательности из группы последовательностей SEQ ID NO:1-10 с использованием набора зондов, специфичных для указанных последовательностей и способных гибридизоваться с последовательностью по всей длине. Указанные последовательности используются в составе чипа для детекции, диагностики или мониторинга пролиферативных нарушений, связанных с пролиферацией клеток яичника, а также для детекции предрасположенности к пролиферативным нарушениям или лечения пролиферативных нарушений яичника. Изобретение позволяет проводить идентификацию пролиферативных нарушений в клетках яичника и выявлять генетическую предрасположенность к указанным нарушениям. 4 н. и 6 з.п. ф-лы, 3 ил., 2 табл., 1 пр.

Реферат

ОБЛАСТЬ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к области биологии и химии, более конкретно, к области молекулярной биологии и генетики человека. Изобретение относится к области определения метилированных участков в ДНК человека, в особенности метилированных участков в некоторых определенных последовательностях, которые в тех случаях, когда метилированы, являются признаком рака яичников.

УРОВЕНЬ ТЕХНИКИ

Рак яичников является пятой основной причиной смертности от злокачественных опухолей у женщин, основной причиной смертности от гинекологических злокачественных заболеваний и вторым чаще всего диагностируемым гинекологическим злокачественным заболеванием (The Merck Manual of Diagnosis and Therapy Section 18. Gynecology And Obstetrics Chapter 241. Gynecologic Neoplasms).

Оно является идиопатическим, что означает, что точная причина обычно неизвестна. Это заболевание больше распространено в промышленно развитых странах, за исключением Японии. В Соединенных Штатах Америки риск возникновения рака яичников у женщин за время жизни составляет от 1,4% до 2,5% (1 из 40-60 женщин).

Более половины смертей от рака яичников имеет место у женщин в возрасте от 55 до 74 лет, и приблизительно одна четверть смертей от рака яичников имеет место у женщин в возрасте от 35 до 54 лет.

На риск возникновения рака яичников, по-видимому, влияют несколько факторов.

Зависимость от использования средства для лечения бесплодия, такого как цитрат кломифена, являлась неоднозначной. Анализ в 1991 году увеличил вероятность того, что использование лекарственных средств может увеличить риск возникновения рака яичников. С тех пор было проведено несколько групповых исследований и исследования методом случай-контроль, не предоставляющих убедительное доказательство для такой зависимости.

Существуют достоверные сведения, что важную роль играют генетические факторы. Носители определенных мутаций гена BRCA1 или BRCA2, чаще встречаемых в некоторых популяциях (например, еврейские женщины ашкенази), находятся в группе более высокого риска возникновения как рака молочной железы, так и рака яичников, часто в более раннем возрасте, чем в основной популяции. У пациентов с раком молочной железы в анамнезе или с раком молочной железы и/или яичников в семейном анамнезе, особенно если в молодом возрасте, может иметь место повышенный риск. Тяжелый семейный анамнез в отношении рака матки, рака толстого кишечника или других злокачественных образований желудочно-кишечного тракта может указывать на наличие синдрома, известного как наследственный неполипозный колоректальный рак (HNPCC, также известного как синдром Линча II), который придает более высокий риск возникновения рака яичников.

Другие факторы, которые были исследованы, такие как использование талька, воздействие асбеста, высокое содержание жира в пище и инфицирование свинкой в детстве, являются неоднозначными и не были окончательно доказаны.

Рак яичников классифицируют в зависимости от гистологии опухоли (коды ICD-O). Гистология определяет множество аспектов клинической терапии, коррекции и прогноза.

Опухоли яичников можно классифицировать по их предполагаемой клетке-предшественнице. Основные категории представляют собой поверхностные эпителиально-стромальные опухоли, опухоли стромы полового тяжа яичников (ICD-O 8590), герминогенные опухоли (ICD-O 9060-9090) и вторичные или метастатические опухоли.

Поверхностные эпителиально-стромальные опухоли являются наиболее распространенными и типичными видами рака яичников. Они, как полагают, происходят из поверхностной выстилки яичника и включают в себя серозную цистаденокарциному (8441/3) и муцинозную цистаденокарциному (8470/3). Брюшная полость выстлана такими же клетками, которые составляют поверхностную выстилку яичника, и возможно, что рак начался там, в таком случае его называют первичным перитонеальным раком. Лечение, однако, в основном такое же, как и лечение рака яичников.

Опухоли стромы полового тяжа яичников (8590) включают в себя поражения, которые являются гормонально активными, такие как эстроген-продуцирующая гранулезоклеточная опухоль (8620/3) и вирилизирующая опухоль из сертолилейдиговских клеток или арренобластома.

Герминогенные опухоли (9060-9090) яичника происходят из половых клеток и имеют тенденцию возникать у молодых женщин и девочек. Эти опухоли составляют приблизительно 5% случаев рака яичников. Они имеют тенденцию хорошо инкапсулироваться, и большинство является доброкачественными, таким образом, прогноз, чем для других опухолей яичников.

Существуют также смешанные опухоли, вторичные или метастатические опухоли.

Рак яичников часто является первичным, но также может быть вторичным, то есть быть результатом метастазов от первичных злокачественных опухолей в других местах организма, например от рака молочной железы или рака желудочно-кишечного тракта, и в этом случае рак яичников является раком Крукенберга.

Исторически рак яичников называли «тихим убийцей», поскольку считалось, что симптомы не проявлялись до тех пор, пока шанс на излечение не становился мал. Тем не менее, недавние исследования показали, что этот термин неверный и что следующие ниже симптомы, по всей вероятности, имеют место у женщин с раком яичников, чем у женщин в основной популяции. Такие симптомы включают в себя вздутие, тазовую или брюшную боль, затрудненное питание или быстрое чувство насыщения, симптомы со стороны мочевой системы (императивные позывы или частота).

Диагностика на ранней стадии связана с улучшенным прогнозом.

Женщины с раком яичников обычно сообщали о нескольких других симптомах. Эти симптомы включают в себя утомляемость, расстройство пищеварения, позвоночную боль, боль при половом контакте, запор и нарушение менструального цикла. Однако эти другие симптомы не применимы при распознавании рака яичников, поскольку их также обнаруживают с одинаковой частотой у женщин из основной популяции, у которых нет рака яичников.

Рак яичников на его ранних стадиях (I/II) трудно диагностировать, пока он не распространится и не перейдет на более поздние стадии (III/IV). Это происходит вследствие того, что большинство обычных симптомов являются неспецифичными.

Рак яичников имеет неблагоприятный прогноз. Он непропорционально летален, поскольку симптомы смазаны и неспецифичны, таким образом диагностирование запаздывает. Более чем у 60% пациентов, страдающих этим раком, уже имеет место рак III стадии или IV стадии, когда он уже распространился за пределы яичников.

Из видов рака яичников, которые являются злокачественными, клетки отслаиваются в естественную жидкость в брюшной полости. Эти клетки могут имплантироваться в другие брюшные (перитонеальные) структуры, включающие в себя матку, мочевой пузырь, кишечник, выстилку стенок кишечника (сальник) и даже может распространиться в легкие. Эти клетки могут начать формировать новый опухолевый рост прежде, чем даже начнут подозревать наличие рака.

Более чем 50% женщинам с раком яичников диагноз ставят на поздних стадиях заболевания, поскольку не существует экономичного по стоимости скрининг-теста в отношении рака яичников. Пятилетняя выживаемость для всех стадий составляет только от 35% до 38%. Если, тем не менее, диагноз поставили на ранней стадии заболевания, пятилетняя выживаемость может достигать от 90% до 98%.

Таким образом, было бы полезно обладать способом анализа нарушений, связанных с раком яичников, а также способом выявления рака яичников у пациента.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

В настоящем изобретении описан способ анализа нарушений, связанных с раком яичников, включающий определение в панели последовательностей ДНК геномного статуса метилирования одного или нескольких CpG-динуклеотидов в каждой последовательности, где последовательности ДНК выбраны из группы SEQ ID NO:1-91 и в особенности из группы последовательностей согласно SEQ ID NO:1-10 и/или SEQ ID NO:50-60.

Изучаемые области обозначены в таблице 1A и таблице 1B («начало» и «конец»).

CpG-островки представляют собой области, где присутствует большое количество цитозина и гуанина, расположенных рядом друг с другом в основной цепи ДНК (то есть связаны фосфодиэфирными связями). Они расположены в промоторах или поблизости приблизительно 40% промоторов генов млекопитающих (приблизительно в 70% промоторов человека). «p» в условном обозначении CpG обозначает фосфодиэфирную связь между цитозином и гуанином.

Размер CpG-островка обычно составляет 100-3000 нуклеотидных пар. Эти области характеризуются содержанием CpG-динуклеотида равным или большим, чем статистически ожидалось бы (≈6%), тогда как у остальной части генома имеет место намного более низкая частота CpG (≈1%), явление, называемое супрессией CG. В отличие от CpG-участков в кодирующей области гена, в большинстве случаев, CpG-участки в CpG-островах промоторов неметилированны, если гены экспрессируются. Это наблюдение привело к предположению, что метилирование CpG-участков в промоторе гена может блокировать экспрессию гена. Метилирование является основным для импринтинга наряду с модификациями гистонов. Обычным формальным определением CpG-островка является область по меньшей мере из 200 н.п. и с процентным содержанием CG, которое больше 50%, и с соотношением наблюдаемых/ожидаемых CpG, которое больше 0,6.

В настоящем изобретении CpG-динуклеотид представляет собой CpG-динуклеотид, который можно обнаружить в метилированном и неметилированном состоянии in vivo, в частности, у человека.

Изобретение относится к способу, где первичное злокачественное новообразование выявляют, используя паттерн метилирования одной или нескольких описываемых в настоящем документе последовательностей, и также, где полученный паттерн метилирования используют для предсказания терапевтического ответа при лечении рака яичников.

В настоящем изобретении под пациентом понимают всех лиц, пациентов, животных, безотносительно того, проявляются ли у них или нет патологические изменения. В толковании по изобретению любой образец, полученный из клеток, тканей, органов, организмов или тому подобного, может представлять собой образец пациента, которому необходимо поставить диагноз. В предпочтительном варианте осуществления пациент по изобретению является человеком. В дополнительном предпочтительном варианте осуществления изобретения пациент является человеком, у которого, как полагают, имеет место заболевание, выбранное из группы первичного рака яичников, вторичного рака яичников, поверхностной эпителиально-стромальной опухоли, опухоли стромы полового тяжа яичников, герминогенной опухоли.

Способ предназначен для применения при усовершенствованной диагностике, лечении и отслеживании пролиферативных нарушений в клетках яичника, например, обеспечивая улучшенную идентификацию и дифференцирование между подклассами указанного нарушения и генетической предрасположенности к указанным нарушениям. Изобретение представляет собой усовершенствования существующего уровня техники, в котором оно обеспечивает высокоспецифичную классификацию пролиферативных нарушений в клетках яичника, таким образом позволяя проводить усовершенствованное и информированное лечение пациентов.

В настоящем изобретении заявленные последовательности также охватывают последовательности, которые обратно комплементарны обозначенным последовательностям.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

На фиг.1 показан способ определения дифференциально метилированных областей генома. Этот способ более подробно описан в примерах.

На фиг.2 показаны разделенные на кластеры образцы (колонки) в зависимости от локусов метилирования (строки). Характерные признаки метилирования могут отличаться между опухолями (левая часть шкалы сверху) и нормальной тканью (правая часть шкалы сверху).

На фиг.3 показана кластеризация образцов яичника на основании характеристик метилирования. Неконтролируемая кластеризация может отличать нормальные и опухолевые образцы.

ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

Авторы изобретения неожиданно обнаружили, что небольшую подборку последовательностей ДНК можно использовать для анализа нарушений, связанных с раком яичников. Это осуществили, определяя геномный статус метилирования одного или нескольких CpG-динуклеотидов в любой из последовательностей, описываемых в настоящем документе, или ее обратно комплементарной последовательности. Идентифицировали всего приблизительно 900 последовательностей, которые подходят для такого анализа. Оказалось, что 91 последовательность особенно подходят.

На основе только 10 последовательностей, таких как первые десять из таблицы 1A или B (p-значение 0,0001), возможно достичь точности классификации 94%. Последовательности можно обнаружить в генах, как можно увидеть в таблице 1A ниже.

Таблица 1A
SEQ ID NO: ID Хромосома Начало Конец Р-значение Ген
Промотор
1 ID88611 chr19 5631787 5631904 0,0000315 AY313896
2 ID175860 chr9 5440496 5442012 0,0000634 BC069381
3 ID83251 chr18 42804624 42805591 0,0000758 TCEB3C
4 ID123662 chr22 46348054 46348410 0,0000952 FLJ46257
5 ID90252 chr19 12706515 12706562 0,000100964 ASNA1
6 ID88853 chr19 6410747 6411538 0,000109899 CRB3
7 ID106715 chr2 1,53E+08 1,53E+08 0,000132458 FMNL2
8 ID76937 chr17 45397876 45398117 0,000136 DLX4
9 ID22548 chr10 1,01E+08 1,01E+08 0,000148441 NKX2-3
10 ID45743 chr13 35818685 35818932 0,000157858 SPG20
11 ID106499 chr2 1,39E+08 1,39E+08 0,000180479 LOC339745
12 ID131616 chr3 1,63E+08 1,63E+08 0,000188374 BC071875
13 ID33153 chr11 77528404 77528466 0,00021029 ALG8
14 ID69601 chr16 88084505 88084566 0,000224742 ANKRD11
15 ID55562 chr15 39412526 39412630 0,000231649 OIP5
16 ID82852 chr18 31178284 31178321 0,00026884 AF542097
17 ID188098 chrX 1,14E+08 1,14E+08 0,000276279 BC028688
18 ID125695 chr3 28365531 28365798 0,000277255 AZI2
19 ID69407 chr16 87450852 87451117 0,000303853 BC011369
20 ID147776 chr5 1,75E+08 1,75E+08 0,000354 DRD1
21 ID129197 chr3 1,12E+08 1,12E+08 0,000378924 BC067808
22 ID39382 chr12 54509420 54509575 0,000415538 AK057179
23 ID138427 chr4 1,21E+08 1,21E+08 0,00047605 MAD2L1
24 ID5570 chr1 31752564 31752750 0,000526242 HCRTR1
25 ID120807 chr22 23313706 23314029 0,000548859 LOC388886
26 ID175953 chr9 6747544 6747604 0,000597361 AB018323
27 ID163464 chr7 89868741 89869864 0,000623 PFTK1
28 ID119641 chr22 17268168 17268417 0,000639985 BC047039
29 ID43355 chr12 1,24E+08 1,24E+08 0,000681142 BRI3BP
30 ID148329 chr5 1,77E+08 1,77E+08 0,000707 NY-REN-7
31 ID178503 chr9 88845701 88845932 0,000731649 AK129921
32 ID21652 chr10 88717549 88718107 0,000744071 C10orf116
33 ID179700 chr9 1,07E+08 1,07E+08 0,000767134 RAD23B
34 ID77161 chr17 46299407 46299451 0,000793328 TOB1
35 ID40416 chr12 74712124 74712190 0,000802 PHLDA1
36 ID149652 chr6 6572127 6575902 0,000808 FLJ33708
37 ID56526 chr15 54812868 54813104 0,000829585 SUHW4
38 ID18295 chr10 14960697 14960796 0,000868353 SUV39H2
39 ID68291 chr16 82398697 82399030 0,000934789 HSBP1
40 ID51334 chr14 72673142 72673174 0,000939 PSEN1
41 ID128265 chr3 62836031 62836284 0,000954756 CADPS
42 ID100401 chr2 25387018 25387063 0,000974638 DNMT3A
43 ID184276 chrX 550487 550772 0,00100771 SHOX
44 ID2370 chr1 7778659 7778715 0,001043041 PER3
45 ID34541 chr11 1,18E+08 1,18E+08 0,001059334 MIZF
46 ID78653 chr17 68699787 68700038 0,001078955 COG1
47 ID55183 chr15 35180110 35180409 0,001083766 MEIS2
48 ID160402 chr7 27993506 27993623 0,00112 JAZF1
49 ID121081 chr22 27793491 27793540 0,001117003 BC063787

Последовательности можно также обнаружить в межгенных областях, как можно увидеть в таблице 1В ниже.

Таблица 1В
SEQ ID NO: ID Хромосома Начало Конец Р-значение
50 ID89944 chr19 10843569 10843613 0,0000227
51 ID102184 chr2 63152348 63153687 0,0000231
52 ID28331 chr11 27698553 27698834 0,0000338
53 ID144851 chr5 114908035 114908080 0,0000553
54 ID128185 chr3 58546910 58547629 0,00008
55 ID93003 chr19 40483018 40483248 0,000110513
56 ID136801 chr4 68239844 68239927 0,000144546
57 ID146275 chr5 140146252 140146717 0,000215464
58 ID131177 chr3 148621317 148621647 0,000216975
59 ID12952 chr1 158307786 158308067 0,000242093
60 ID39999 chr12 63439190 63439288 0,000286113
61 ID116585 chr20 61967316 61967544 0,000287984
62 ID73971 chr17 26742913 26742971 0,000311873
63 ID125133 chr3 13654044 13654318 0,000372628
64 ID99092 chr2 1654591 1654895 0,000372925
65 ID69936 chr16 88767910 88769082 0,000397396
66 ID78601 chr17 67623230 67623629 0,00041658
67 ID148836 chr5 179854129 179854384 0,000420579
68 ID21285 chr10 79714238 79714714 0,000425735
69 ID158039 chr7 922643 922835 0,000459
70 ID32408 chr11 70345916 70347923 0,000464267
71 ID76532 chr17 43973948 43974107 0,00051907
72 ID178855 chr9 93408533 93408596 0,0005196
73 ID81125 chr17 78514384 78516444 0,000559665
74 ID100286 chr2 24625709 24625843 0,000582927
75 ID155118 chr6 119711684 119711950 0,000636
76 ID89463 chr19 8668749 8668987 0,000646711
77 ID9880 chr1 94718230 94718935 0,000655989
78 ID177108 chr9 37016858 37016916 0,000661917
79 ID68281 chr16 81219051 81219377 0,000665387
80 ID178263 chr9 83765733 83765839 0,000669707
81 ID34175 chr11 113165828 113166488 0,00067498
82 ID147847 chr5 175420376 175420628 0,000688163
83 ID47981 chr13 111756373 111756614 0,000693087
84 ID146308 chr5 140181734 140181814 0,000694524
85 ID17523 chr10 1273925 1274241 0,00074504
86 ID166673 chr7 149355326 149355615 0,000762
87 ID91016 chr19 15399966 15400044 0,000779943
88 ID101572 chr2 45143519 45143913 0,000805715
89 ID39294 chr12 52897679 52898035 0,000854819
90 ID50743 chr14 61349222 61349293 0,00087795
91 ID157888 chr7 750241 750295 0,000912

Гены, которые образуют основу настоящего изобретения, необходимо предпочтительно использовать для создания «панели генов», то есть коллекции, включающей определенные генетические последовательности по настоящему изобретению и/или их соответствующие информативные участки метилирования. Создание панели генов позволит проводить быстрый и специфичный анализ определенных аспектов рака яичника. Панель(и) генов, как описано и используется в изобретении, можно использовать с удивительно высокой производительностью для диагностики, лечения и отслеживания и также анализа предрасположенности к пролиферативным нарушениям в клетках яичника, в особенности, тем не менее, для выявления опухоли яичника.

Кроме того, применение множества CpG-участков из различных чипов генов предусматривают относительно высокую степень чувствительности и специфичности по сравнению со средствами диагностики и выявления и отдельного гена.

Изобретение относится к способу анализа нарушений, связанных с раком яичников, включающему определение в панели по меньшей мере из четырех последовательностей ДНК геномного статуса метилирования одного или нескольких CpG-динуклеотидов в каждой последовательности, выбранной из группы последовательностей согласно SEQ ID NO:1-10 и/или SEQ ID NO:50-60.

В одном из вариантов осуществления предпочтительно, что статус метилирования определяют по меньшей мере в четырех последовательностях согласно SEQ ID NO:1-91, где последовательности характеризуются p-значением, которое меньше 0,0001, как указано в таблице 1A или 1B.

Статус метилирования CpG-островков указывает на рак яичников. Предпочтительно, тем не менее, статус метилирования определяют для каждого CpG и определяют дифференциальный паттерн метилирования, поскольку не все CpG-островки обязательно должны быть метилированы.

В одном из вариантов осуществления способа по изобретению анализ представляет собой выявление рака яичников у пациента и где осуществляют следующие ниже стадии: (a) получение образца у пациента, который необходимо проанализировать, (b) определение в панели по меньшей мере из четырех последовательностей ДНК статуса метилирования одного или нескольких CpG-динуклеотидов в каждой последовательности, выбранной из группы последовательностей согласно SEQ ID NO:1-10 и/или SEQ ID NO:50-60.

Необязательно, осуществляют дополнительные следующие ниже стадии: (a) один или несколько результатов из анализа статуса метилирования является входными данными для классификатора, который получают из многомерной диагностической модели, (b) вычисляют вероятность того, происходит ли образец от нормальной ткани или из ткани рака яичника и/или (c) вычисляют соответствующее p-значение для достоверности предсказания.

Например, авторы изобретения используют классификатор на основе метода опорных векторов для «обучения» в отношении важных отличительных признаков для опухолевого или нормального образца основываясь на предварительно определенной выборке тканей пациента. В настоящее время алгоритм выдает в результате классификатор (уравнение, в котором переменными являются степени метилирования из выборки используемых отличительных признаков). Степени метилирования в образцах от новых пациентов затем вводят в классификатор. Результат может представлять собой 1 или 0. Расстояние от минимального уровня используют для определения p-значения.

Предпочтительно, что дополнительно геномный статус метилирования определяют для одной или нескольких последовательностей ДНК, выбранных из группы последовательностей согласно SEQ ID NO:11-49 и/или SEQ ID NO:61-91.

В одном из вариантов осуществления статус метилирования ДНК определяют по меньшей мере для десяти последовательностей, двадцати последовательностей, тридцати последовательностей, сорока последовательностей или более сорока последовательностей из последовательностей согласно SEQ ID NO:1-91. Особенно предпочтительно, что статус метилирования определяют для всех последовательностей согласно SEQ ID NO:1-91.

В одном из вариантов осуществления статус метилирования ДНК определяют для последовательностей согласно SEQ ID NO:1-10 и SEQ ID NO:50-60. По существу, изобретение также относится к определению статуса метилирования только в одной из последовательностей согласно SEQ ID NO:1-91.

Существует большое количество способов для определения статуса метилирования молекулы ДНК. Предпочтительно, что статус метилирования определяют при помощи одного или нескольких способов, выбранных из группы бисульфитного секвенирования, пиросеквенирования, чувствительного к метилированию конформационного анализа однонитевой ДНК (MS-SSCA), высокоточного анализа кинетики плавления (HRM), чувствительной к метилированию однонуклеотидной достройки праймера (MS-SnuPE), специфичного для основания расщепления/MALDI-TOF, специфичной к метилированию ПЦР (MSP), основанных на микрочипах способов, расщепления MspI. Общее представление о дополнительных известных способах выявления 5-метилцитозина можно получить из обзорной статьи: Rein, T., DePamphilis, M. L., Zorbas, H., Nucleic Acids Res. 1998, 26, 2255. Дополнительные способы описаны в способы US 2006/0292564A1.

В предпочтительном варианте осуществления статус метилирования определяют посредством расщепления MspI, лигирования адапторов, расщепления McrBC, ПЦР-амплификации, мечения и последующей гибридизации.

Предпочтительно, что образец, который необходимо проанализировать, происходит из типа ткани, выбранной из группы тканей, таких как биопсия ткани из анализируемой ткани, вагинальная ткань, язык, поджелудочная железа, печень, селезенка, яичник, мышцы, соединительная ткань, нервная ткань, ткань желудочно-кишечного тракта, опухолевая ткань, биологические жидкости, кровь, сыворотка, слюна и моча.

В предпочтительном варианте осуществления определяют первичный рак яичника.

В одном из вариантов осуществления способа по изобретению получаемый паттерн метилирования применяют для предсказания терапевтического ответа при лечении рака яичников.

Изобретение относится к зондам, таким как олигонуклеотиды, которые находятся в области перед CpG-участками. Олигомеры по настоящему изобретению обычно применяют в так называемых «наборах», которые содержат по меньшей мере один олигонуклеотид для каждого из CpG-динуклеотидов в последовательностях SEQ ID NO:1-91 включительно или по меньшей мере для 10, предпочтительно, 20, более предпочтительно, 30 и наиболее предпочтительно для более 50 указанных последовательностей. Изобретение также относится к обратно комплементарной последовательности олигонуклеотидов, которые находятся в области CpG-участков.

Зонды, которые используют для такого анализа, определяют на основе одного или нескольких из следующих ниже критериев: (1) последовательность зонда встречается только один раз в геноме человека; (2) содержание в зонде нуклеотидов C/G находится в диапазоне от 30% до 70%; (3) характеристики плавления гибридизация и другие критерии соответствуют Mei R et al, Proc Natl Acad Sci US A. 2003 Sep 30; 100(20):11237-42.

В самом предпочтительном варианте осуществления ссылка относится к набору олигонуклеотидов, которые специфичны для последовательностей согласно SEQ ID NO:1-10 и/или SEQ ID NO:50-60. Олигонуклеотид по изобретению может быть специфичен для последовательности, которая встречается in vivo, или он может быть специфичен для последовательности, которую обрабатывали бисульфитом. Такой зонд содержит от 10 до 80 нуклеотидов в длину, более предпочтительно, от 15 до 40 нуклеотидов в длину.

В случае наборов олигонуклеотидов по настоящему изобретению, предпочтительно, что по меньшей мере один олигонуклеотид связан с твердой фазой. Дополнительно предпочтительно, что все олигонуклеотиды из одного набора(ряда) связаны с твердой фазой.

Настоящее изобретение дополнительно относится к набору по меньшей мере из 10 зондов (олигонуклеотиды и/или PNA-олигомеры), используемых для определения метилированного состояния цитозина геномной ДНК посредством анализа указанной последовательности или обработанных вариантов указанной последовательности (согласно последовательностям SEQ ID NO:1-91 включительно и комплементарных им последовательностям).

Эти зонды позволяют проводить усовершенствованное выявление, диагностику, лечение и отслеживание пролиферативных нарушений в клетках яичника.

Набор олигонуклеотидов также можно использовать для определения однонуклеотидных полиморфизмов (SNP) посредством анализа указанной последовательности или обработанного варианта указанной последовательности согласно одной из последовательностей SEQ ID NO:1-91 включительно.

По настоящему изобретению, предпочтительно, что множество различных олигонуклеотидов и/или PNA-олигомеров (так называемый «чип»), предлагаемых настоящим изобретением, представлено таким способом, что они также связаны с твердой фазой.

Этот чип с различными олигонуклеотидными и/или PNA-олигомерными последовательностями может отличаться тем, что он размещен на твердой фазе в виде прямоугольной или шестиугольной решетки. Поверхность твердой фазы предпочтительно состоит из кремния, стекла, полистирола, алюминия, стали, железа, меди, никеля, серебра или золота. Тем не менее, нитроцеллюлоза, а также пластмассы, такие как нейлон, который может находиться в виде шариков, или также матрицы из смолы, являются подходящими альтернативами.

Следовательно, дополнительный объект по настоящему изобретению представляет собой способ промышленного получения чипа, присоединенного к материалу носителя, для усовершенствованного выявления, диагностики, лечения и отслеживания пролиферативных нарушений в клетках яичника и/или выявления предрасположенности к пролиферативным нарушениям в клетках яичника. В указанном способе по меньшей мере один олигонуклеотид по настоящему изобретению присоединен к твердой фазе. Известны, например, из патента США № 5744305 способы промышленного производства таких чипов посредством твердофазной химии и светочувствительных защитных групп. Дополнительный объект настоящего изобретения относится к ДНК-чипу для усовершенствованного выявления диагностики, лечения и отслеживания пролиферативных нарушений в клетках яичника. Более того, ДНК-чип позволяет выявить предрасположенность к пролиферативным нарушениям в клетках яичника.

ДНК-чип содержит по меньшей мере одну нуклеиновую кислоту и/или олигонуклеотид по настоящему изобретению. ДНК-чипы известны, например, в патенте США № 5837832.

Изобретение также относится к композиции или чипу, содержащему нуклеиновые кислоты с последовательностями, которые идентичны по меньшей мере 10 из последовательностей согласно SEQ ID NO:1-91, где композиция или чип содержит не более 100 различных молекул нуклеиновой кислоты.

Настоящее изобретение относится к композиции или чипу, содержащему по меньшей мере 5 последовательностей с совокупным p-значением менее 0,001, предпочтительно, менее 0,0001.

Кроме того, объектом по настоящему изобретению является набор, который можно составить, например, из содержащих бисульфит реагентов, ряда олигонуклеотидов праймеров, содержащих по меньшей мере два олигонуклеотида, чьи последовательности в каждом случае соответствуют или комплементарны сегменту длиной по меньшей мере 15 оснований из последовательностей оснований, определенных в последовательности SEQ ID NO:1-91. Предпочтительно, что праймеры представляют собой последовательности SEQ ID NO:1-10 включительно и/или последовательности SEQ ID NO:50-60 включительно.

ПРИМЕРЫ

ОБРАЗЦЫ

Образцы от пациентов получали из Norwegian Radium Hospital в Осло, Норвегия и согласие пациентов получали в соответствии с законодательными требованиями.

CPG-ОСТРОВКИ

Аннотированные CpG-островки получили из программного средства для просмотра генома UCSC. Эти островки предсказали, используя опубликованное определение Гардинер-Гардена (Gardiner- Garden, M. and M. Frommer (1987). "CpG islands in vertebrate genomes". J MoI Biol 196(2): 261-82), применяя следующие ниже критерии: длина ≥200 н.п., %GC≥50%, наблюдаемое/ожидаемое количество CpG≥0,6. В геноме существует ~26219 CpG-островков в диапазоне от 200 н.п. до 2000 н.п. Эти островки хорошо покрываются при рестрикционной фрагментации Msp I.

Чипы производились Nimblegen Systems Inc, используя формат 390K со следующей ниже спецификацией. Аннотацию для CpG-островка из генома человека сборки 33 (hgl7) использовали для конструирования чипа с мозаичным размещением 50-меров. 50-меры смещали в обе стороны относительно координат последовательности островка для того, чтобы равномерно распределить островок. Формат 390K обладает 367658 доступными элементами, которые бы не охватили все островки при мозаичном размещении 50-меров. Поэтому авторы изобретения, исходя из размера, сократили островки, которые будут предоставлены так, что будут анализировать только CpG-островки размером 200-2000 н. Контрольные зонды конструировали для отражения фонового сигнала. Приготовление образца: способ был описан ранее (Lucito, R., J. Healy, et al. (2003). "Representational oligonucleotide microarray analysis: a high-resolution method to detect genome copy number variation". Genome Res 13(10): 2291-305.) со следующими ниже изменениями. Основной используемой рестрикционной эндонуклеазой является MspI. После расщепления лигировали следующие ниже линкеры (MspI24-мер и MSPI12-мер). 12-мер нефосфорилирован и его не лигируют. После лигирования продукт очищают фенолом, хлороформом, осаждают, центрифугируют и ресуспендируют. Продукт разделяют на две половины, причем половину расщепляют эндонуклеазой McrBC и для другой половины проводят мнимое расщепление. Четыре пробирки объемом 250 мкл использовали для каждой пары образца для амплификации каждого материала в объеме реакции 100 мкл. Условия в цикле представляли собой 95°C в течение 1 мин, 72°C в течение 3 мин, в течение 15 циклов, после чего следовало удлинение в течение 10 мин при 72°C. Содержание пробирок для каждой пары объединяли, как только заканчивали. Материалы очищали экстракцией в смеси фенол:хлороформ, осаждали, ресуспендировали и определяли концентрацию. ДНК метили, как описано, с небольшими изменениями (Lucito, R., J. Healy, et al. (2003). "Representational oligonucleotide microarray analysis: a high-resolution method to detect genome copy number variation". Genome Res 13(10): 2291-305). В кратком изложении, 2 мкг матричной ДНК помещали (растворенной в TE при pH 8) в пробирки для ПЦР объемом 0,2 мл. Добавляли 5 мкл случайных нонамеров (Sigma Genosys), доводили до объема 25 мкл при помощи dH2O и перемешивали. Пробирки помещали в Tetrad при 100°C в течение 5 мин, затем на лед в течение 5 мин. К данной смеси добавляли 5 мкл NEB буфера 2, 5 мкл dNTP (0,6 нМ dCTP, 1,2 нМ dATP, dTTP, dGTP), 5 мкл метки (Cy3-dCTP или Cy5-dCTP) от GE Healthcare, 2 мкл NEB фрагмента Кленова и 2 мкл dH2O. Процедуры гибридизации и отмывки проводили, как описано ранее (Lucito, R., J. Healy, et al. (2003). "Representational oligonucleotide microarray analysis: a high-resolution method to detect genome copy number variation." Genome Res 13(10): 2291-305) за исключением того, что температуру в печи при гибридизации увеличивали до 50°C. Чипы сканировали при помощи сканера Axon GenePix 4000B с размером пикселя 5 мкм. Программное обеспечение GenePix Pro 4,0 использовали для количественного определения интенсивности на чипах. Данные с чипов импортировали в S-PLUS для дальнейшего анализа.

АНАЛИЗ ДАННЫХ

Изображения микрочипов сканировали на сканере GenePix 4000B и данные экстрагировали, используя программное обеспечение Nimblescan (Nimblegen Systems Inc). Для каждого зонда вычисляли геометрическое среднее для соотношений (GeoMeanRatio) обработанных McrBc и контрольных образцов для каждого эксперимента и ассоциированных с ними изменений окрашивания. GeoMeanRatios для всех образцов в выборке затем нормализовали, используя способ квантильной нормализации (Bolstad, B. M., R. A. Irizarry, et al. (2003). "A comparison of normalization methods for high density oligonucleotide array data based on variance and bias" Bioinformatics 19(2): 185-93). Нормализованные соотношения для каждого эксперимента затем сжимали для того, чтобы получить одно значение для всех зондов в каждом фрагменте MspI, используя модель медианного сглаживания. Сжатые данные затем использовали для дальнейшего анализа.

Дисперсионный анализ применяли для идентификации наиболее значимых островков. Для того чтобы определить наиболее постоянно встречающиеся изменения при метилировании между опухолевыми и нормальными образцами, авторы изобретения применяли подход с критерием Стьюдента. Используя отсечение по p-значению 0,001 после коррекции при множественном тестировании (вероятность обнаружения ложной зависимости, Benjamini и Hotchberg (Benjamini 1995)), авторы изобретения получили список из 916 MspI-фрагментов, для которых показано дифференциальное метилирование.

Обучение с учителем: Авторы изобретения использовали классификатор на основе машинного обучения с учителем для определения количества признаков, необходимых для того, чтобы отличить опухолевые образцы от нормальных образцов. Общедоступную библиотеку метода опорных векторов (SVM) (LibSVM Ver 2,8) использовали для получения точности классификации, применяя способ исключения по одному (Lin, C.J. and Chang C.C. (2001). LIBSVM: a library for support vector machines). Отличительные признаки метилирования для классификации первоначально выбирали, используя критерий