Способ анализа онкологических заболеваний молочной железы
Иллюстрации
Показать всеИзобретение относится к области генной инженерии, конкретно к способу анализа онкологических заболеваний молочной железы, и может быть использовано в медицине. Способ включает определение статуса геномного метилирования динуклеотидов CpG в каждой последовательности из группы последовательностей SEQ ID NO.1-SEQ ID NO.10, полученных из образцов человеческой ткани молочной железы, введение одного или нескольких результатов теста на определение статуса метилирования в классификатор, полученный исходя из диагностической поливариативной модели, построенной на основе базы данных по молочной железе и группы последовательностей SEQ ID NO.1-10. Затем рассчитывают вероятность того, получен ли образец из нормальной ткани или ткани рака молочной железы, и рассчитывают ассоциированную величину р для достоверности в прогнозе. Матрица содержит не более 100 различных молекул нуклеиновой кислоты и включает нуклеиновые кислоты с последовательностями, которые идентичны последовательностям ДНК, соответствующим SEQ ID NO.1-SEQ ID NO.10. Изобретение позволяет эффективно идентифицировать, диагностировать, лечить и наблюдать клеточно-пролиферативные заболевания молочной железы, а также определять предрасположенность к клеточно-пролиферативным заболеваниям молочной железы. 2 н. и 7 з. п. ф-лы, 3 ил., 2 табл.
Реферат
Область техники, к которой относится изобретение
Настоящее изобретение относится к области биологии и химии, более конкретно к области молекулярной биологии и генетики человека. Изобретение относится к области идентификации метилированных сайтов в ДНК человека, в частности метилированных сайтов в некоторых определенных последовательностях, которые при метилировании указывают на рак молочной железы.
Уровень техники
Во всем мире рак молочной железы занимает пятое место среди самых распространенных причин смерти от рака (после рака легких, рака желудка, рака печени и рака толстого кишечника). В 2005 рак молочной железы был причиной смерти 502000 пациентов (7% летальных исходов от рака; почти 1% всех летальных исходов) во всем мире. Среди женщин во всем мире рак молочной железы представляет собой самую распространенную форму рака и самую частую причину летального исхода от рака.
В Соединенных Штатах Америки рак молочной железы занимает третье место среди самых распространенных причин смерти от рака (после рака легких и рака толстого кишечника). Считается, что в 2007 в США рак молочной железы явился причиной 40910 летальных исходов (7% летальных исходов от рака; почти 2% всей смертности). Среди женщин в США рак молочной железы является самой распространенной формой рака и второй из самых частых причин смерти от рака (после рака легких). Женщины в США имеют риск развития инвазивного рака молочной железы 1 на 8 и риск рака молочной железы, приводящего к их летальному исходу, 1 на 33.
Рак молочной железы диагностируется с помощью патологической (микроскопической) оценки ткани молочной железы, удаленной хирургическим путем. Ткань или клетки могут быть получены большим числом способов перед окончательной обработкой для гистологической или цитологической оценки. К таким способам относятся аспирационная диагностическая пункция, аспираты из сосков, протоковый лаваж, толстоигольная биопсия и локальная биопсия, осуществляемая хирургическим путем. Эти диагностические стадии при сочетании с радиографическим изображением, как правило, точны в диагностике поражения молочной железы, такого как рак. Иногда предхирургические способы, такие как аспирационная диагностическая пункция, могут не дать достаточного количества ткани для постановки диагноза или могут совсем не распознать рак. Для детекции метастаза иногда используют тесты с получением изображения, к ним относятся рентген грудной клетки, остеосцинтиграфия, СТ, MRI и PET-сканирование. Несмотря на то, что исследования с получением изображения можно использовать в определении наличия метастазирующего заболевания, их не используют для этого, и они сами по себе не диагностируют рак. Лишь с помощью микроскопической оценки биопсийного образца можно поставить диагноз рака. Са 15.3 (углеводный антиген 15.3, эпителиальная слизь) представляет собой маркер опухоли, определяемый в крови, который может быть использован для отслеживания активности заболевания с течением времени после окончания лечения. Тестирование маркера опухоли, присутствующего в крови, как правило, не осуществляют для скрининга рака молочной железы, и оно обладает неудовлетворительными рабочими показателями для этой цели.
Поэтому было бы полезно иметь способ анализа онкологических заболеваний молочной железы, который был бы быстрым, достоверным и мог быть теоретически осуществлен необученным персоналом. Такой способ теоретически не требовал бы анализа обученным врачом.
Сущность изобретения
Настоящее изобретение относится к способу анализа онкологических заболеваний молочной железы, включающему определение в панели последовательностей ДНК статуса геномного метилирования одного или нескольких динуклеотидов CpG в каждой последовательности, где последовательности ДНК выбирают из группы SEQ ID NO.1-100, в частности из группы последовательностей, соответствующих SEQ ID NO.1-SEQ ID NO.10 и SEQ ID NO.50-SEQ ID NO.60.
Представляющие интерес области приведены в таблице 1А и таблице 1В («начало» и «конец»).
Области CpG представляют собой области с большим числом цитозина и гуанина, прилегающих друг к другу в скелете ДНК (т.е. связанных фосфодиэфирными связями). Они расположены внутри и около примерно 40% промоторов генов млекопитающих (около 70% в промоторах человека). Под «р» в обозначении CpG понимают фосфодиэфирную связь между цитозином и гуанином.
Длина области CpG обычно составляет 300-3000 пар оснований. Эти области отличаются содержанием динуклеотидов CpG, равным или большим, чем можно было бы предположить статистически (≈6%), тогда как остальная часть генома имеет гораздо меньшую частоту встречаемости CpG (≈1%), явление, называемое супрессией CG. В отличие от сайтов CpG в кодирующей области гена в большинстве случаев сайты CpG в областях CpG промоторов неметилированы при экспрессии генов. Эта находка привела к предположению, что метилирование сайтов CpG в промоторе гена может ингибировать экспрессию гена. Метилирование является основой импринтинга наряду с модификациями гистонов. Принятое формальное определение области CpG - это область по меньшей мере из 200 п.н. и с процентом GC больше 50% и с соотношением обнаруженные/ожидаемые CpG больше 0,6.
В рамках изобретения динуклеотид CpG представляет собой динуклеотид CpG, который может быть обнаружен в метилированном и неметилированном состоянии in vivo, в частности, у человека.
Изобретение относится к способу, в котором первичный рак детектируют, используя паттерн метилирования одной или нескольких последовательностей, описанных в настоящем описании, а также в котором полученный паттерн метилирования используют для прогнозирования терапевтического ответа на лечение рака молочной железы.
В рамках изобретения под индивидуумом понимают всех людей, пациентов, животных, вне зависимости от того, наблюдаются ли у них или нет патологические изменения. В рамках изобретения образцом диагностического пациента может быть любой образец, собранный из клеток, тканей, органов, организмов или подобного. В предпочтительном варианте осуществления пациентом по изобретению является человек. В дополнительном предпочтительном варианте осуществления изобретения пациентом является человек, предположительно страдающий заболеванием, выбранным из следующей группы: первичный рак молочной железы, вторичный рак молочной железы, поверхностная эпителиально-стромальная опухоль, опухоль стромы полового тяжа яичников, опухоль из герминативных клеток.
Способ используется в улучшенной диагностике, лечении и мониторинге клеточно-пролиферативных заболеваний молочной железы, например, содействуя улучшенной идентификации и дифференциации между подклассами указанного заболевания и определению генетической предрасположенности к указанным заболеваниям. Изобретение представляет улучшения существующего уровня техники в том, что оно дает возможность высокоспецифичной классификации клеточно-пролиферативных заболеваний молочной железы, таким образом, содействуя улучшенному и информированному лечению пациентов.
В рамках изобретения заявленные последовательности также охватывают последовательности, которые обратно комплементарны указанным последовательностям.
Краткое описание чертежей
На фиг.1 представлен способ определения дифференциально метилированных областей генома. Это более подробно изложено в примерах.
На фиг.2 показаны сгруппированные образцы (колонки) против локусов метилирования (ряды). Показатели метилирования могут различаться между опухолями (левая часть полосы сверху) и нормальной тканью (правая часть полосы сверху).
На фиг.3 показано группирование способа построения изобретения и его характерные особенности. Собирают образец пациента и определяют статус метилирования специфических последовательностей любым из предпочтительных вариантов осуществления. Затем результаты вводят в классификатор, такой как машина опорных векторов, которая классифицирует как опухолевый образец или нормальный образец и дает величину р.
Подробное описание вариантов осуществления
Авторы изобретения неожиданно обнаружили, что для анализа онкологических заболеваний молочной железы можно использовать небольшую селекцию последовательностей ДНК. Это осуществляют, определяя статус геномного метилирования одного или нескольких динуклеотидов CpG в какой-либо из последовательностей, описанных в настоящем описании, либо обратно комплементарной ей. В целом идентифицировали около 900 последовательностей, которые подходят для такого анализа. Оказалось, что особенно подходят 100 последовательностей.
На основе лишь 10 последовательностей, таких как верхние десять элементов из таблицы 1А или 1В (величина р 0,0001), возможно достичь точности классификации 94% (суммарное правильное прогнозирование в отношении вопроса, получен ли данный образец из опухоли молочной железы или нет, по сравнению со всем осуществленным прогнозированием 49/52). Чувствительность детекции опухоли составляла 92,5% (37/40), специфичность детекции опухоли=100%. Увеличение количества элементов до 50 дает коэффициент классификации 96% (50/52 классифицировано правильно).
Последовательности могут быть обнаружены в генах, как можно видеть в таблице 1А ниже.
Таблица 1A | ||||||
SEQ ID NO. | ID | Хромосома | Начало | Конец | Величина p | Название гена |
1 | ID173583 | chr8 | 125810238 | 125810819 | 0,0000217 | MTSS1 |
2 | ID135122 | chr4 | 9040795 | 9041453 | 0,000058 | DUB3 |
3 | ID59231 | chr15 | 87711410 | 87711904 | 0,0000000747 | hsa-mir-9-3 |
4 | ID135160 | chr4 | 9459627 | 9459776 | 0,0000000115 | DRD5 |
5 | ID123222 | chr22 | 43445548 | 43445907 | 0,000000192 | PRR5 |
6 | ID41349 | chr12 | 105476974 | 105477298 | 0,000000362 | RFX4 |
7 | ID146518 | chr5 | 140703634 | 140703867 | 0,000000443 | PCDHGA3 |
8 | ID66687 | chr16 | 65169983 | 65170374 | 0,000000574 | AY862139 |
9 | ID11596 | chr1 | 146066973 | 146067308 | 0,000000872 | AK123662 |
10 | ID112724 | chr20 | 22514937 | 22515431 | 0,0000012 | FOXA2 |
11 | ID56406 | chr15 | 50874380 | 50874668 | 0,00000131 | ONECUT1 |
12 | ID11658 | chr1 | 146486000 | 146486341 | 0,00000157 | AK123662 |
13 | ID114005 | chr20 | 39198472 | 39198934 | 0,00000162 | PLCG1 |
14 | ID41387 | chr12 | 105851242 | 105851742 | 0,00000276 | MGC17943 |
15 | ID130737 | chr3 | 138963266 | 138963653 | 0,0000029 | SOX 14 |
16 | ID27050 | chr11 | 3819507 | 3820119 | 0,00000306 | RHOG |
17 | ID98568 | chr19 | 63407518 | 63407732 | 0,00000467 | ZNF274 |
18 | ID160851 | chr7 | 35070796 | 35071213 | 0,0000062 | TBX20 |
19 | ID9698 | chr1 | 92126308 | 92126790 | 0,00000624 | BRDT |
20 | ID35001 | chr11 | 124134059 | 124134403 | 0,0000129 | AY189281 |
21 | ID188098 | chrX | 113641444 | 113641884 | 0,0000135 | BC028688 |
22 | ID41218 | chr12 | 103034912 | 103035336 | 0,0000139 | NFYB |
23 | ID4450 | chr1 | 23416592 | 23417362 | 0,0000151 | HNRPR |
24 | ID97179 | chr19 | 56695742 | 56696075 | 0,0000166 | SIGLEC12 |
25 | ID137603 | chr4 | 89285337 | 89285745 | 0,0000208 | PKD2 |
26 | ID77777 | chr17 | 55854004 | 55854719 | 0,0000242 | LOC124773 |
27 | ID146531 | chr5 | 140715120 | 140715429 | 0,0000303 | PCDHGB2 |
28 | ID76724 | chr17 | 44159203 | 44159574 | 0,0000679 | PRAC |
29 | ID135120 | chr4 | 9006410 | 9006713 | 0,0000874 | DUB3 |
30 | ID135121 | chr4 | 9017069 | 9017727 | 0,0000911 | AY509884 |
31 | ID71929 | chr17 | 7695823 | 7696284 | 0,000130076 | LOC92162 |
32 | ID11593 | chr1 | 146066575 | 146066841 | 0,000154186 | AK123662 |
33 | ID120446 | chr22 | 20546877 | 20547317 | 0,0001669 | MAPK1 |
34 | ID146484 | chr5 | 140601695 | 140601937 | 0,000192752 | PCDHB15 |
35 | ID103546 | chr2 | 86334450 | 86334476 | 0,000264959 | MRPL35 |
36 | ID161220 | chr7 | 43853299 | 43853383 | 0,00030013 | DBNL |
37 | ID11654 | chr1 | 146485690 | 146485868 | 0,000310651 | AK123662 |
38 | ID146595 | chr5 | 140777723 | 140778009 | 0,000318226 | PCDHGA11 |
39 | ID173389 | chr8 | 121206506 | 121207025 | 0,000396103 | COL14A1 |
40 | ID160133 | chr7 | 26919212 | 26919376 | 0,000432818 | HOXA2 |
41 | ID118279 | chr21 | 42946007 | 42946287 | 0,000498108 | PDE9A |
42 | ID68965 | chr16 | 86694584 | 86695293 | 0,000498402 | AK126852 |
43 | ID16024 | chr1 | 224770811 | 224771150 | 0,000548832 | BC043916 |
44 | ID91933 | chr19 | 18831977 | 18832267 | 0,000607126 | AK125797 |
45 | ID146581 | chr5 | 140768066 | 140768556 | 0,000680057 | PCDHGA10 |
46 | ID61023 | chr16 | 954593 | 954879 | 0,000792141 | AK127296 |
47 | ID146570 | chr5 | 140757958 | 140758452 | 0,000996446 | PCDHGA9 |
48 | ID171504 | chr8 | 65454257 | 65455748 | 0,000953039 | hsa-mir-124a-2 |
49 | ID168737 | chr8 | 9798186 | 9798550 | 0,000137444 | hsa-mir-124a-1 |
50 | ID12521 | chr1 | 153203369 | 153203671 | 0,000101994 | hsa-mir-9-1 |
Последовательности могут быть обнаружены в межгенных областях, как можно видеть в таблице 1В.
Таблица 1B | |||||
SEQ ID NO. | ID | Хромосома | Начало | Конец | Величина p |
51 | ID33426 | chr11 | 89160048 | 89160322 | 1,14E-10 |
52 | ID90896 | chr19 | 15148984 | 15149357 | 1,14E-10 |
53 | ID29499 | chr11 | 49026728 | 49027002 | 4,06E-10 |
54 | ID169777 | chr8 | 24827761 | 24828171 | 6,48E-10 |
55 | ID109204 | chr2 | 220021958 | 220022344 | 8,65E-10 |
56 | ID103749 | chr2 | 91295935 | 91296161 | 1,82E-09 |
57 | ID99161 | chr2 | 2812784 | 2813304 | 1,82E-09 |
58 | ID45297 | chr13 | 27400198 | 27400742 | 3,38E-09 |
59 | ID166666 | chr7 | 149354316 | 149354562 | 6,06E-09 |
60 | ID167174 | chr7 | 152884159 | 152884405 | 6,96E-09 |
61 | ID34211 | chr11 | 113989177 | 113989682 | 9,11E-09 |
62 | ID152478 | chr6 | 42253517 | 42253868 | 9,63E-09 |
63 | ID24712 | chr10 | 130382122 | 130382412 | 9,63E-09 |
64 | ID49246 | chr14 | 28324500 | 28324758 | 1,30E-08 |
65 | ID34960 | chr11 | 123811259 | 123816128 | 1,34E-08 |
66 | ID112713 | chr20 | 22506327 | 22506681 | 1,59E-08 |
67 | ID54570 | chr15 | 24795835 | 24796140 | 2,70E-08 |
68 | ID89508 | chr19 | 9469673 | 9470021 | 2,98E-08 |
69 | ID 13622 | chr1 | 177614171 | 177614509 | 3,10E-08 |
70 | ID 1820 | chr1 | 3672455 | 3672910 | 3,10E-08 |
71 | ID29015 | chr11 | 45136542 | 45137024 | 3,10E-08 |
72 | ID91861 | chr19 | 18622132 | 18622478 | 3,46E-08 |
73 | ID77745 | chr17 | 55571595 | 55571965 | 4,18E-08 |
74 | ID98238 | chr19 | 61846590 | 61847055 | 4,44E-08 |
75 | ID76689 | chr17 | 44074514 | 44074967 | 4,50E-08 |
76 | ID76692 | chr17 | 44075076 | 44075400 | 6,20E-08 |
77 | ID59231 | chr15 | 87711410 | 87711904 | 7,47E-08 |
78 | ID124608 | chr3 | 6878205 | 6878499 | 8,97E-08 |
79 | ID10950 | chr1 | 116868496 | 116868706 | 9,58E-08 |
80 | ID159953 | chr7 | 24097508 | 24097911 | 9,58E-08 |
81 | ID115475 | chr20 | 58536847 | 58537548 | 1,23E-07 |
82 | ID126115 | chr3 | 38714269 | 38714730 | 1,92E-07 |
83 | ID71392 | chr17 | 6057091 | 6057605 | 2,51E-07 |
84 | ID105601 | chr2 | 121341432 | 121341916 | 2,61E-07 |
85 | ID168382 | chr8 | 1982797 | 1983256 | 2,61E-07 |
86 | ID147288 | chr5 | 158456751 | 158457100 | 2,69E-07 |
87 | ID137304 | chr4 | 81466911 | 81467150 | 3,30E-07 |
88 | ID179567 | chr9 | 101579069 | 101579476 | 3,92E-07 |
89 | ID3487 | chr1 | 16606704 | 16606778 | 4,25E-07 |
90 | ID92361 | chr19 | 34425570 | 34426104 | 4,25E-07 |
91 | ID177598 | chr9 | 66276397 | 66276499 | 4,45E-07 |
92 | ID3846 | chr1 | 18994906 | 18995319 | 5,42E-07 |
93 | ID35773 | chr12 | 125067 | 125386 | 5,88E-07 |
94 | ID117488 | chr21 | 33327565 | 33327930 | 7,29E-07 |
95 | ID89802 | chr19 | 10450948 | 10451249 | 8,72E-07 |
96 | ID64615 | chr16 | 29702807 | 29703873 | 8,92E-07 |
97 | ID168612 | chr8 | 7917174 | 7917432 | 9,20E-07 |
98 | ID16187 | chr1 | 225850241 | 225850586 | 9,73E-07 |
99 | ID73339 | chr17 | 21160807 | 21161232 | 1,13E-06 |
100 | ID 18029 | chr10 | 11462206 | 11463043 | 1,53E-06 |
Гены, которые образуют основу настоящего изобретения, предпочтительно используют для формирования «панели генов», т.е. коллекции, содержащей конкретные генетические последовательности по настоящему изобретению и/или соответствующие им информативные сайты метилирования. Формирование панелей генов дает возможность быстрого и специфического анализа специфических аспектов рака молочной железы. Панель(и) генов, описанная(ые) и используемая(ые) в этом изобретении, может(гут) быть с неожиданно высокой эффективностью использована(ы) для диагностики, лечения и мониторинга, а также анализа предрасположенности к клеточно-пролиферативным заболеваниям молочной железы, в частности, опять же для детекции опухоли молочной железы.
Кроме того, применение большого числа сайтов CpG из различного набора генов дает возможность относительно высокой степени чувствительности и специфичности в сравнении со способами диагностики и детекции по одному гену.
Изобретение относится к способу анализа онкологических заболеваний молочной железы, включающему определение в панели по меньшей мере из четырех последовательностей ДНК статуса геномного метилирования одного или нескольких динуклеотидов CpG в каждой последовательности, где последовательности выбирают из группы последовательностей согласно SEQ ID NO.1-SEQ ID NO.10 и SEQ ID NO.50-SEQ ID NO.60.
В одном из вариантов осуществления предпочтительно, чтобы определяли статус метилирования одной или нескольких последовательностей, соответствующих SEQ ID NO.1-100, где последовательность имеет величину р, определенную в настоящем описании, которая меньше, чем 1Е-4 (0,0001), как указано в таблице 1А или 1В.
В одном из вариантов осуществления способа по изобретению анализ представляет собой детекцию рака молочной железы у индивидуума и при этом осуществляют следующие стадии: (а) получение образца от анализируемого индивидуума, (b) определение в панели по меньшей мере из четырех последовательностей ДНК статуса метилирования одного или нескольких динуклеотидов CpG в каждой последовательности, где последовательности ДНК выбирают из группы последовательностей согласно SEQ ID NO.1-SEQ ID NO.10 и SEQ ID NO.50-SEQ ID NO.60.
Статус метилирования областей CpG указывает на рак молочной железы. Предпочтительно, тем не менее, статус метилирования определяют для каждого CpG и определяют дифференциальный паттерн метилирования, поскольку не все области CpG обязательно должны быть метилированы.
Необязательно, осуществляют следующие стадии: (а) один или несколько результатов теста на определение статуса метилирования вводят в классификатор, который получают исходя из диагностической поливариативной модели, (b) рассчитывают вероятность того, получен ли образец из нормальной ткани или ткани рака молочной железы, и/или (с) рассчитывают ассоциированную величину р для степени достоверности в прогнозе.
Например, авторы изобретения используют классификатор метода опорных векторов для «изучения» важных характеристик опухоли или нормального образца на основе предварительно определенного набора тканей, полученных от пациентов. В настоящее время алгоритм выводится классификатором (уравнение, в котором переменные представляют собой коэффициенты метилирования из набора используемых элементов). Коэффициенты метилирования образца нового пациента затем вносят в этот классификатор. Результат может быть 1 или 0. Для получения величины р используют расстояние от критического уровня.
Предпочтительно, чтобы дополнительно определяли статус геномного метилирования одной или нескольких последовательностей ДНК, выбранных из группы последовательностей, соответствующих SEQ ID NO.11-SEQ ID NO.49 и SEQ ID NO.61-SEQ ID NO.100.
В одном из вариантов осуществления статус метилирования определяют по меньшей мере для десяти последовательностей ДНК, по меньшей мере двадцати последовательностей, по меньшей мере тридцати последовательностей, по меньшей мере сорока последовательностей или более чем сорока последовательностей из последовательностей согласно SEQ ID NO.1-SEQ ID NO.100. Особенно предпочтительно, чтобы статус метилирования определяли для всех последовательностей, соответствующих SEQ ID NO.1-SEQ ID NO.100.
В одном из вариантов осуществления статус метилирования определяют для последовательностей ДНК, соответствующих SEQ ID NO.1-SEQ ID NO.10 и SEQ ID NO.50-SEQ ID NO.60. По существу изобретение также относится к определению статуса метилирования лишь одной из последовательностей, соответствующих SEQ ID NO.1-SEQ ID NO.100.
Существует большое число способов определения статуса метилирования молекулы ДНК. Предпочтительно, чтобы статус метилирования определяли с помощью одного или нескольких способов, выбранных из следующей группы: бисульфитное секвенирование, пиросеквенирование, одноцепочечный конформационный анализ, чувствительный к метилированию (MS-SSCA), анализ кривых плавления с высоким разрешением (HRM), однонуклеотидное удлинение праймеров, чувствительное к метилированию (MS-SnuPE), расщепление по специфическим парам оснований/MALDI-TOF, ПЦР, специфичная к метилированию (MSP), способы на основе микроматриц и расщепление рестриктазой MspI. Общий обзор дополнительных известных способов определения 5-метилцитозина может быть получен из следующей обзорной статьи: Rein, T., DePamphilis, M.L., Zorbas, H., Nucleic Acids Res. 1998, 26, 2255. Дополнительные способы описаны в заявке на патент США 2006/0292564А1.
В предпочтительном варианте осуществления статус метилирования определяют путем расщепления с помощью MspI, лигирования адапторов, расщепления ферментом McrBC, ПЦР-амплификации, мечения и последующей гибридизации.
Предпочтительно, чтобы анализируемый образец был получен из типа тканей, выбранного из группы тканей, например тканевой биопсии, полученной из анализируемой ткани, вагинальной ткани, языка, поджелудочной железы, печени, селезенки, яичника, мышцы, соединительной ткани, нервной ткани, ткани желудочно-кишечного тракта, опухолевой ткани, жидкостей организма, крови, сыворотки, слюны и мочи.
В предпочтительном варианте осуществления определяют первичный рак молочной железы.
В одном из вариантов осуществления способа по изобретению полученный паттерн метилирования используют для прогнозирования терапевтического ответа на лечение рака молочной железы.
Настоящее изобретение также относится к зондам, таким как олигонуклеотиды, которые находятся в области вблизи сайтов CpG. Олигомеры по настоящему изобретению обычно используются в так называемых «наборах», которые содержат по меньшей мере один олигонуклеотид для каждого из динуклеотидов CpG в последовательности от SEQ ID NO.1 вплоть до SEQ ID NO.100 или по меньшей мере для 10, предпочтительно 20, более предпочтительно 30, наиболее предпочтительно более чем 50 указанных последовательностей. Изобретение также относится к обратному комплементу олигонуклеотидов, которые расположены в области сайтов CpG.
Зонды, используемые для такого анализа, определяют исходя из одного или нескольких из следующих условий: (1) последовательность зонда встречается в геноме человека лишь один раз; (2) плотность нуклеотидов С/G в зонде составляет от 30% до 70%; (3) характеристики плавления гибридизации и другие критерии соответствуют описанным в статье Mei R et al. Proc. Natl. Acad. Sci. USA, 2003, Sept.30; 100(20).11237-42.
В очень предпочтительном варианте осуществления изобретение относится к набору олигонуклеотидов, которые специфичны для последовательностей, соответствующих SEQ ID NO.1-10 и/или SEQ ID NO:50-60, или SEQ ID NO.50-60. Олигонуклеотид по изобретению может быть специфичным для последовательности, которая встречается in vivo, или он может быть специфичен для последовательности, которую обработали бисульфитом. Такой зонд имеет длину от 10 до 80 нуклеотидов, более предпочтительно длину от 15 до 40 нуклеотидов.
В случае наборов олигонуклеотидов по настоящему изобретению предпочтительно, чтобы по меньшей мере один олигонуклеотид связывался с твердой фазой. Дополнительно предпочтительно, чтобы все олигонуклеотиды одного набора связывались с твердой фазой.
Настоящее изобретение дополнительно относится к набору по меньшей мере из 10 зондов (олигонуклеотидов и/или PNA-олигомеров), используемому для детекции состояния метилирования цитозина геномной ДНК путем анализа указанной последовательности или обработанных версий указанной последовательности (согласно SEQ ID NO.1 вплоть до SEQ ID NO.100 и последовательностей, комплементарных им).
Эти зонды дают возможность улучшить детекцию, диагностику, лечение и мониторинг клеточно-пролиферативных заболеваний молочной железы.
Набор олигонуклеотидов также может быть использован для определения однонуклеотидных полиморфизмов (SNP) путем анализа указанной последовательности или обработанных версий указанной последовательности, соответствующей одной из последовательностей SEQ ID NO.1-SEQ ID NO.100.
По настоящему изобретению предпочтительно, чтобы расположение различных олигонуклеотидов и/или PNA-олигомеров (так называемая «матрица»), доступных по настоящему изобретению, было подобрано таким образом, чтобы также связываться с твердой фазой.
Эта матрица из последовательностей различных олигонуклеотидов и/или PNA-олигомеров может отличаться тем, что она располагается на твердой фазе в виде прямоугольной или гексагональной решетки. Поверхность твердой фазы предпочтительно состоит из силикона, стекла, полистирола, алюминия, стали, железа, меди, никеля, серебра или золота. Тем не менее, подходящими альтернативами являются нитроцеллюлоза, а также пластмассы, такие как найлон, который может существовать в виде гранул, или также как смоляные матрицы.
Поэтому дополнительным объектом настоящего изобретения является способ получения матрицы, фиксированной на материале носителя, для улучшенной идентификации, диагностики, лечения и наблюдения клеточно-пролиферативных заболеваний молочной железы и/или определения предрасположенности к клеточно-пролиферативным заболеваниям молочной железы. В указанном способе по меньшей мере один олигонуклеотид по настоящему изобретению связывается с твердой фазой. Способы получения таких матриц известны, например, из патента США № 5744305, с помощью твердофазной химии и светочувствительных защитных групп. Дополнительный объект настоящего изобретения относится к ДНК-чипу для улучшенной идентификации, диагностики, лечения и мониторинга клеточно-пролиферативных заболеваний молочной железы. Более того, ДНК-чип позволяет определять предрасположенность к клеточно-пролиферативным заболеваниям молочной железы.
ДНК-чип содержит по меньшей мере одну нуклеиновую кислоту и/или олигонуклеотид по настоящему изобретению. ДНК-чипы известны, например, из патента США № 5837832.
Изобретение также относится к композиции или матрице, содержащей нуклеиновые кислоты с последовательностями, которые идентичны по меньшей мере 10 последовательностям, соответствующим с SEQ ID NO.1-SEQ ID NO.100, где композиция или матрица содержит не более 100 различных молекул нуклеиновых кислот.
Настоящее изобретение относится к композиции или матрице, содержащей по меньшей мере 5 последовательностей с суммарной величиной р менее 0,001, предпочтительно менее 0,0001.
Более того, объектом настоящего изобретения является набор, который может быть составлен, например, из реагента, содержащего бисульфит, набора праймерных олигонуклеотидов, содержащего по меньшей мере два олигонуклеотида, последовательности которых в каждом случае соответствуют или комплементарны сегменту длиной по меньшей мере 15 оснований нуклеотидных последовательностей, заданных в SEQ ID NO.1- SEQ ID NO.100. Предпочтительно, чтобы праймеры имелись для последовательностей с SEQ ID NO. 1 по SEQ ID NO. 10 и с SEQ ID NO. 50 по SEQ ID NO. 60.
ПРИМЕРЫ
ОБРАЗЦЫ
Образцы пациентов получали из Norwegian Radium Hospital, Oslo, Norway и National Cancer Institute's Cooperative Human Tissue Network (CHTN), и согласие пациентов получали согласно требованиям законодательства.
ОБЛАСТИ CPG
Аннотированные области CpG получали из программного средства для просмотра генома UCSC. Эти области предсказывали используя опубликованное определение Gardiner-Garden (Gardiner-Garden, M. and M. Frommer (1987). “CpG islands in vertebrate genomes.” J Mol Biol 196(2): 261-82), включающее следующие условия: длина>=200н.п., %GC>=50%, наблюдаемые/предполагаемые CpG>=0,6. В геноме существует ~26219 областей CpG в диапазоне от 200 н.п. до 2000 н.п. Эти области хорошо покрываются фрагментацией рестриктазой Msp I.
Матрицы выпускались фирмой Nimblegen Systems Inc, используя формат 390К для следующих технических данных. Для создания 50-мерной черепичной (tiling) матрицы использовали аннотацию областей CpG из генома человека build 33 (hg17). Для равномерного распределения области 50-меры переносили по обе стороны от координат последовательности области. Формат 390К обладает 367658 доступными элементами, которые не вместили бы всех областей при 50-мерном звене. Поэтому авторы изобретения остановились на областях, представленных на основе размера, анализируя лишь области CpG размера 200н.п.-2000н.п. Для представления фонового сигнала создавали контрольные зонды. Подготовка образца: описание было дано ранее (Lucito, R., J. Healy, et al. (2003). “Representational oligonucleotide microarray analysis: a high-resolution method to detect genome copy number variation” Genome Res 13(10): 2299-305), со следующими изменениями. Используемая первичная эндонуклеаза рестрикции представляет собой MspI. После расщепления лигировали следующие линкеры (MspI24-мер и MSPI12-мер). 12-Мер не фосфорилируется и не лигирует. После лигирования материал очищают с помощью фенола-хлороформа, осаждают, центрифугируют и ресуспендируют. Материал делят пополам, половину расщепляют эндонуклеазой McrBC, а для другой половины симулируют расщепление. По меньшей мере четыре пробирки объемом 250 мкл использовали для каждой пары образцов для увеличения копийности каждого с проведением реакции в объеме 100 мкл. Условия проведения цикла: 95°C в течение 1 мин, 72°C в течение 3 мин на протяжении 15 циклов с последующим удлинением в течение 10 мин при 72°C. При завершении содержимое пробирок для каждой пары объединяли. Копии очищали путем экстракции смесью фенол:хлороформ, осаждали, ресуспендировали и определяли концентрацию. ДНК метили, как описано, с незначительными изменениями (Lucito, R., J. Healy, et al. (2003). “Representational oligonucleotide microarray analysis: a high-resolution method to detect genome copy number variation” Genome Res 13(10): 2299-305). В кратком изложении 2 мкг ДНК-матрицы помещали (растворив в ТЕ-буфере при рН 8) в пробирки для проведения ПЦР объемом 0,2 мл. Добавляли 5 мкл случайных девятичленных полимеров (продукция фирмы Sigma Genosys), доводя с помощью dH2O до 25 мкл, и перемешивали. Пробирки помещали в Tetrad при 100°C в течение 5 мин, после чего на лед в течение 5 мин. К продукту добавляли 5 мкл буфера NEB, по 2,5 мкл каждого dNTP (0,6 нм dCTP, 1,2 нм dATP, dTTP, dGTP), 5 мкл метки (Cy3-dCTP или Cy5-dCTP), производства фирмы GE Healthcare, 2 мкл фрагмента Кленова NEB и 2 мкл dH2O. Способы гибридизации и отмывки соответствовали сообщенным ранее (Lucito, R., J. Healy, et al. (2003). “Representational oligonucleotide microarray analysis: a high-resolution method to detect genome copy number variation” Genome Res 13(10): 2291-305) за исключением того, что температуру печи для гибридизации повышали до 50°C. Матрицы сканировали с помощью набора для сканера Axon GenePix 4000B при размере пикселя 5 мкм. Для количественного определения интенсивности свечения матриц использовали программное обеспечение GenePix Pro 4.0. Данные, полученные с помощью матриц, вводили в S-PLUS для дополнительного анализа.
АНАЛИЗ ДАННЫХ
Изображения, полученные с помощью микроматриц, сканировали на сканере GenePix 4000B и получали данные используя программное обеспечение Nimblescan (продукция фирмы Nimblegen Systems Inc). Для каждого зонда среднее геометрическое коэффициентов (GeoMeanRatio) McrBc и контрольных обработанных образцов рассчитывали для каждого эксперимента и ассоциированной с ним смены красителя. Коэффициенты GeoMeanRatio всех образцов в совокупности данных затем нормализовали, используя способ квантильной нормализации (Bolstad,B.M., R.A. Irizarry, et al. (2003). “A comparison of normalization methods for high density oligonucleotide array data based on variance and bias” Bioinformatics 19(2): 185-93). Коэффициенты нормализации для каждого эксперимента затем сжимали до получения одной величины для всех зондов в каждом фрагменте, полученном после расщепления рестриктазой MspI, используя модель медианного сглаживания. Сжатые данные затем использовали для дополнительного анализа.
Для идентификации самых существенных областей использовали дисперсионный анализ. Для определения самых постоянно встречающихся изменений в метилировании между опухолевыми и нормальными образцами авторы изобретения использовали подход t-теста. Используя предельную величину р 0,001 после поправки на множественное тестирование (False Discovery Rate, Benjamini and Hotchberg (Benjamini 1995)), авторы получили список из 916 фрагментов MspI, где наблюдается различное метилирование этих 916 фрагментов исходя из ассоциации с генами.
Управляемое обучение: для идентификации количества элементов, требуемого для установления отличия опухолевых образцов от нормальных, авторы использовали классификатор с управляемым обучением. Для получения точности классификации использовали общедоступную библиотеку опорных векторов (SVM) (LibSVM Версия 2.8), используя способ с исключением объектов по одному (Lin, C.J. and Chang C.C. (2001). LIBSVM: a library for support vector machines). Элементы метилирования для классификации сначала выбирали, используя t-тест только среди данных режима обучения. SVM затем обучали на первых 10, 50 и 100 элементах, используя основной компонент радиальной базисной функции (RBF).
Для N образцов для идентификации фрагментов с существенными различиями в коэффициентах метилирования t-тесты осуществляли для (N-1) образцов. Для базы данных по молочной железе эту процедуру осуществляли 52 раза для всех 52 образцов молочной железы, так что в процессе расчетов t-теста каждый образец удаляется один раз. Коэффициенты метилирования элементов первых 10 фрагментов из (N-1) образцов затем использовали для обучения SVM, и коэффициенты от одного образца, не использованного для обучения SVM, использовали для тестирования. Основываясь только на 10 элементах, авторы могут достичь точности классификации 94% (суммарно правильные прогнозы/все прогнозы, 49/52). Чувствительность идентификации опухоли составила 92,5% (37/40), специфичность идентификации опухоли составила 100%). Увеличение количества элементов до 50 дает степень классификации 96% (50/52 классифицировано верно). Интересно, что два образца опухоли, которые классифицировали как нормальные в этом анализе, оказались также приближены к нормальным как в анализе экспрессии генов, так и анализе ROMA.
ДЕТЕКЦИЯ МЕТИЛИРОВАННЫХ САЙТОВ
В предпочтительном варианте осуществления способ включает следующие стадии: на первой стадии способа образец геномной ДНК должен быть выделен из источников, таких как клеточные линии, образцы ткани или крови. Экстракцию ДНК можно осуществить средствами, которые являются стандартными для специалиста в данной области. К ним относятся применение детергентных лизатов, обработка ультразвуком и интенсивное перемешивание со стеклянными бусинами. После того как нуклеиновые кислоты были экстрагированы, геномную двухцепочечную ДНК использовали в анализе.
В предпочтительном варианте осуществления ДНК может быть расщеплена перед следующей стадией способа, причем это можно осуществить любыми средствами, принятыми на существующем уровне техники, в частности, но ими не ограничиваясь, с помощью эндонуклеаз рестрикции.
На второй стадии способа образец геномной ДНК обрабатывают таким образом, чтобы цитозиновые основания, которые неметилированы в 5'-положении, преобразовать в урацил, тимин или другое основание, которое отличается от цитозина с точки зрения реакции гибридизации. Далее в настоящем описании это необходимо понимать как «предварительную обработку».
Описанную выше обработку геномной ДНК предпочтительно осуществляют с помощью бисульфита (сульфита, дисульфита) и последующего щелочного гидролиза, который приводит к преобразованию неметилированных цитозиновых нуклеиновых оснований в урацил или другое основание, которое отличается от цитозина с точки зрения реакции основания вайрин (vairine). При использовании для проведения реакции бисульфитного раствора добавление происходит по неметилирован