Способ прогнозирования исходов рака молочной железы

Иллюстрации

Показать все

Изобретение относится к медицине, а именно к персонифицированной медицине с использованием молекулярно-биологических и клинических данных в онкологии, и может быть использовано для предсказания риска прогрессирования и смерти больных раком молочной железы. Используют наивные байесовские сети, оптимизированные по числу узлов до получения максимальной величины площади под ROC-кривой. Определяют значимые параметры, влияющие на исход рака молочной железы. Каждый узел, кроме корневого, соответствует одному из параметров базы данных пациенток. Корневые узлы соответствуют конечным точкам, характеризующим прогрессирование заболевания или смерть пациентки на заданном временном интервале. Для прогноза прогрессирования заболевания значимыми параметрами являются возраст на момент операции, менструальный статус, категория N - лимфоузлы, экспрессия рецепторов прогестерона, экспрессия рецептора HER-2/neu, предоперационная лучевая терапия, неоадъювантная химиотерапия. Для прогноза смерти пациентки значимыми параметрами являются менструальный статус, категория Т - размер опухоли, категория N - лимфоузлы, молекулярно-биологический подтип, уровень экспрессии мРНК YB-1, предоперационная лучевая терапия, гормонотерапия. На основании данных, полученных при построении ROC-кривых, строят гистограммы риска исходов рака молочной железы, связывающие условную вероятность исходов с абсолютной вероятностью соответствующего исхода. Разбивают условную вероятность исхода на четыре интервала значений, соответствующих четырем группам риска. Проводят опрос обученной ранее БС, используя значимые параметры конкретной пациентки. На основании полученной при опросе БС условной вероятности соответствующего исхода данную пациентку относят к одной из групп риска. По полученной величине с помощью гистограмм риска абсолютной вероятности определяют прогноз соответствующего исхода - прогрессирование или смерть. Способ обеспечивает повышение точности прогнозирования исходов рака молочной железы в результате оптимизации байесовской сети (БС) за счет получения максимальной величины площади под ROC-кривой, облегчение задачи врача по принятию решения о тактике ведения пациентки за счет небольшого числа прогностических параметров, возможность использования вероятностных моделей с большим числом узлов. 5 ил., 2 пр.

Реферат

Изобретение относится к медицине, а именно к персонифицированной медицине с использованием молекулярно-биологических и клинических данных в онкологии, и может быть использовано для предсказания риска прогрессирования и смерти больных раком молочной железы.

Рак молочной железы является самых распространенным онкологическим заболеванием у женщин в Российской Федерации, при этом на протяжении последних лет отмечается рост заболеваемости по данной нозологии. Смертность при раке молочной железы связана с появлением метастазов в отдаленные органы. Поэтому поиск способа прогнозирования сроков безрецидивной выживаемости (т.е. времени до появления отдаленных метастазов) остается актуальной проблемой современной онкологии. Особенно важно выявить группы риска среди больных с прогностически благоприятными стадиями рака молочной железы - I и II стадии, так как это позволит применять к ним более агрессивные методы лечения и увеличить безрецидивную и общую выживаемость в этих группах. Одним из подходов к прогнозированию течения заболевание является создание различных математических моделей.

Вероятностные модели на основе байесовских сетей (БС) становятся все более популярными в медицине [1-5]. Аппарат БС представляет собой удачную комбинацию теории вероятности и теории графов, позволяющую объединять различные клинические стратегии в лечении больных и различные типы данных - как клинико-патоморфологические, так и огромные базы данных генетического анализа опухолей [3].

Модели на основе БС способны к самообучению и самосовершенствованию по мере накопления экспериментальной информации, они нечувствительны к возможным ошибочным или неполным данным. Преимуществом моделей БС является также и возможность интеграции разнородных данных, поскольку БС моделируют самые общие причинно-следственные зависимости между интересующими исследователя параметрами.

Список параметров, применяемых в онкологии, постоянно пополняется, происходит поиск новых молекулярно-биологических прогностических и предиктивных факторов. Сегодня стратегия и тактика лечения пациентов, прогноз для жизни больных раком осуществляется на основании так называемого молекулярного портрета опухоли. В качестве прогностического маркера большой интерес представляет белок YB-1, тесно связанный с опухолевой прогрессией [6, 7, 8].

Известен «Способ прогнозирования течения заболевания раком молочной железы» [9]. Авторы определяют процент опухолевых клеток, экспрессирующих рецепторы эстрогенов, и производят полуколичественную оценку окраски рецепторов, учитывая пропорции позитивных клеток и определения интенсивности реакции по формуле: Н=32×А+2×В+1×С, где A - процент интенсивно окрашенных ядер; В - процент умеренно окрашенных ядер; С - процент слабо позитивных ядер. Причем дополнительно они учитывают гомогенность или гетерогенность экспрессии рецепторов в опухолевом материале. Гомогенность окраски они считают благоприятным признаком, а гетерогенность - неблагоприятным. Недостатком рассматриваемого способа является то, что, как докладывают авторы, гетерогенность опухоли чаще встречается при более поздних стадиях и поражении аксиллярных лимфатических узлов, т.е. его результаты частично дублируют информацию, которая будет получена при стандартном обследовании больных.

Известен «Способ прогнозирования течения онкологических заболеваний» [10]. Авторы определяют в крови больных содержание половых гормонов - эстрадиола и прогестерона и рассчитывают коэффициент соотношения их концентраций. При значениях коэффициента в границах от 10 до 221 прогнозируют продолжительность безрецидивного периода от 5 до 13 лет, а при значениях коэффициента в границах 367-1295 прогнозируют безрецидивный период в течение 28-30 месяцев. Учитывая тот факт, что в стандарт лечения рака молочной железы входит антиэстрогенная гормональная терапия, то данные о содержании главного женского полового гормона - эстрадиола значительно разнятся в зависимости от индивидуальной гормональной чувствительности, предшествующей химиотерапии и возраста пациенток. Поэтому с достоверностью судить о коэффициенте соотношения эстрогена к прогестерону и степень надежности их сравнения представляется затруднительным. Также к недостаткам данного способа можно отнести, на наш взгляд, тот факт, что результаты получены на небольшой выборке пациентов - шесть случаев.

Известен способ [11], названный авторами EBMC_S, предсказания выживаемости пациентов на основе использования байесовских сетей (БС), и проведено тестирование этого метода на базе данных больных раком молочной железы METABRIC (the Molecular Taxonomy of Breast Cancer International Consortium dataset). Авторы работы предложили свой оригинальный частный способ выбора оптимальной БС с расширенной наивной топологией. Данное исследование взято за прототип.

Общим для метода EBMC_S и нашего метода является использование вероятностных моделей на основе байесовских сетей, и предмет применения - предсказания выживаемости больных раком молочной железы. При этом в каждой байесовской сети, представляющей собой ациклический направленный граф, каждый узел соответствует какому-нибудь известному параметру больного - предиктору, или переменной, значения которой принимаются в соответствие с тем или иным исходом заболевания - конечная точка (КТ). Еще одна общая черта обоих методов заключается в оптимизации байесовских сетей с целью улучшения их предсказательной способности.

Рассматривая проблему выживаемости пациентов во времени, авторы данного способа применяют его к каждому году в отдельности - и это они считают новой стратегией решения проблемы предсказания выживаемости.

Недостатком же данного метода является низкая предсказательная способность теста, т.к. площадь под ROC кривой, т.е. величина AUC, у данного метода составляет от 0.61 до 0.77. В нашем методе величина AUC=0.9073, что показывает существенное превосходство нашего метода.

Главное отличие предлагаемого способа от прототипа - другая целевая функция при оптимизации сети. В нашем случае происходит поиск такой БС, при которой достигается максимум площади под ROC-кривой, т.е. достигается максимум AUC. Второе отличие от прототипа - при нашей оптимизации мы остаемся в рамках наивной топологии БС.

Третье отличие нашего метода от метода прототипа - в нашем методе применяются оригинальные диаграммы риска, связывающие условную вероятность исхода с абсолютной вероятностью соответствующего исхода, т.е. с частотой данного исхода в соответствующей группе риска.

Четвертое отличие заключается в том, что эти же диаграммы риска и обученные оптимизированные БС используются для стратификации пациенток по группам риска, что позволяет делать индивидуальные предсказания исходов.

Пятое отличие нашего метода от метода прототипа является то, что в нашем методе не только предсказывается выживаемость пациенток, но и предсказывается прогрессирование заболевания.

Еще одним преимуществом нашего метода является сравнительно небольшое число параметров-предикторов - число узлов в оптимизированной БС, что облегчает для клинициста принятие решения о стратегии лечения.

Задачей изобретения является повышение точности прогнозирования исходов рака молочной железы.

Технический результат заключается в обеспечении высокого качества работы вероятностной модели на основе оптимизированной БС и максимальной надежности предсказания исхода для каждой конкретной пациентки по ее персональным данным; облегчении задачи врача по принятию решения о тактике ведения пациентки; возможность использования вероятностных моделей с очень большим числом узлов.

Это достигается за счет того, что используют наивные байесовские сети, оптимизированные по числу узлов до получения максимальной величины площади под ROC-кривой, определяя значимые параметры, влияющие на исход рака молочной железы, при этом каждый узел, кроме корневого, соответствует одному из параметров базы данных пациенток, а корневые узлы соответствуют конечным точкам, характеризующим прогрессирование заболевания или смерть пациентки на заданном временном интервале; причем для прогноза прогрессирования заболевания значимыми параметрами являются возраст на момент операции, менструальный статус, категория N - лимфоузлы, молекулярно-биологический подтип, уровень экспрессии мРНК YB-1, предоперационная лучевая терапия, гормонотерапия; после чего на основании данных, полученных при построении ROC-кривых, строят гистограммы риска исходов рака молочной железы, связывающие условную вероятность исходов с абсолютной вероятностью соответствующего исхода, разбивая условную вероятность исхода на четыре интервала значений, которые соответствуют четырем группам риска; проводят опрос обученной ранее БС, используя значимые параметры конкретной пациентки, на основании полученной при опросе БС условной вероятности соответствующего исхода данную пациентку относят к одной из групп риска и по полученной величине абсолютной вероятности определяют прогноз соответствующего исхода - прогрессирование или смерть.

После оптимизации БС достигается максимум площади под ROC-кривой, т.е. мы получаем максимум AUC, и это приводит к высокому качеству работы вероятностной модели на основе оптимизированной БС и максимальной надежности предсказания исхода для каждой конкретной пациентки по ее персональным данным.

Кроме того, в оптимизированную БС входит небольшое число прогностических параметров, что облегчает задачу врача по принятию решения о тактике ведения пациентки.

При этом применение наивных сетей позволяет использовать данное изобретение для вероятностных моделей с очень большим числом узлов (десятки и сотни тысяч узлов) и соответствующих им параметрам пациенток, в том числе генетическим и молекулярно-биологическим данным, и в дальнейшем выявлять новые прогностические параметры на основе новых оптимизированных БС, а корневые узлы соответствуют конечным точкам, характеризующим прогрессирование заболевания или смерть пациентки на заданном временном интервале.

На основании данных, полученных при построении ROC-кривых, строят гистограммы риска исходов рака молочной железы, связывающие условную вероятность исхода с абсолютной вероятностью (индивидуальным прогнозом); проводят опрос обученной ранее БС, используя значимые параметры конкретной пациентки, на основании полученной при опросе БС условной вероятности соответствующего исхода, данную пациентку относят к одной из групп риска, различающихся значением условной вероятности, и с помощью гистограммы риска определяют прогноз соответствующего исхода - прогрессирование или смерть. Гистограмма риска представлена двумя осями: по горизонтальной оси отложена условная вероятность наступления события, по вертикальной оси отложена абсолютная вероятность соответствующего исхода для каждой группы пациентов в процентах. Это позволит лечащему врачу объективно принять решение о стратегии лечения каждой конкретной пациентки.

Способ осуществляется следующим образом.

Базу данных пациенток (БДП) (рис. 1) с диагнозом рак молочной железы представляют в виде таблицы, каждая строка которой соответствует одной пациентке, а каждый столбец соответствует одному из параметров пациенток, включающих клинические, молекулярно-биологические данные и информацию о лечении пациенток. Для непрерывных параметров проводят их дискретизацию, для чего области значений таких параметров разбивают на несколько интервалов и каждый из этих интервалов обозначают целочисленным значением. Для параметров, значение которых неизвестно, ячейку оставляют пустой. Если у данной пациентки из БДП выявляют прогрессирование заболевания, то для нее первая конечная точка КТ1-П (прогрессирование заболевания) принимает значение 1, а если у пациентки не выявляют прогрессирование заболевания, то КТ1-П принимает значение 0. Если у данной пациентки из БДП определяют смерть, то для нее вторая конечная точка КТ2-С принимает значение 1, а если пациентка жива, то КТ2-С принимает значение 0. Далее строят наивную байесовскую сеть (БС), и эту сеть оптимизируют по числу узлов до максимальной величины AUC. Величину AUC вычисляют как площадь под ROC-кривой (рис. 2). На каждом шаге построения ROC-кривой из базы данных вычеркивают одну пациентку; на оставшихся пациентках проводят обучение БС и далее параметры вычеркнутой пациентки используют для опроса обученной БС и предсказания исхода. По окончании каждого шага формируют ROC-таблицу, содержащую в каждой строке реальный исход и условную вероятность наступления этого исхода. Далее эту таблицу сортируют по условной вероятности и на ее основе строят ROC-кривую и вычисляют значение AUC. Затем с помощью опроса обученной оптимальной БС для каждой пациентки вычисляют условную вероятность заданной конечной точки. По значению этой условной вероятности вычисляют абсолютную вероятность соответствующего исхода с помощью гистограммы риска (рис. 3). Для этого разбивают условную вероятность на 4 интервала значений: 0-0.25, 0.25-0.50, 0.50-0.75, 0.75-1.00, которые соответствуют четырем группам риска для КТ1-П и для КТ2-С. И по полученной величине абсолютной вероятности определяют прогноз соответствующего исхода: прогрессирование заболевания или смерти.

Пример №1

В БДП НУЗ ЦКБ №2 им. Н.А. Семашко ОАО «РЖД» для каждой пациентки есть 32 клинических и молекулярно-биологических параметра, полученных в результате обследования. Провели дискретизацию для непрерывных параметров; в данном случае такой параметр только один - возраст, который был разделен на интервалы: 0-29, 30-39, 40-49, 50-59, 60-69, 70-79, 80-89. В качестве конечной точки выбрали прогрессирование заболевания - КТ1-П. Построили наивную байесовскую сеть, в которой корневой узел соответствует КТ1-П, а узлы-листья соответствуют 32-м параметрам пациентов. Оптимизировали данную сеть по числу узлов, добиваясь максимального значения AUC. В результате получили оптимальную байесовскую сеть, содержащую 7 узлов-листьев и корневой узел, соответствующий КТ1-П (рис. 4), и имеющую значение AUC=0,833. Эти семь узлов соответствовали семи прогностическим параметрам для данного исхода. Для определения вероятности наступления прогрессирования построили гистограмму риска - (рис. 3А). Затем, используя оптимальную БС и построенную гистограмму риска, предсказали наступление исхода - прогрессирование заболевания для больной Н.

Больная Н., 65 лет. Диагноз: рак правой молочной железы T2N1M0, II Б стадия. Состояние после комбинированного лечения в 2006 г.

На первом этапе выполнено хирургическое лечение в объеме мастэктомии по Маддену справа. Гистологическое заключение №10914-26/06 - умеренно-дифференцированный инфильтрирующий рак. По результатам иммуногистохимического исследования - молекулярно-биологический подтип «Люминальный Б», Her-2/neu+. На втором этапе комбинированного лечения проведена послеоперационная лучевая терапия на зоны регионарного лимфооттока СОД 46 Гр. В дальнейшем проводилась гормонотерапия препаратом аримидекс.

Был проведен опрос оптимизированной обученной БС, представленной на рис. 4, по семи прогностическим параметрам данной пациентки: возраст на момент операции, менструальный статус, категория N, экспрессия рецепторов прогестерона, экспрессия рецептора HER-2/neu, предоперационная лучевая терапия, неоадъювантная химиотерапия. В результате опроса БС получили условную вероятность наступления прогрессирования заболевания - 0.79, и это значение позволило отнести пациентку к 4-й группе на гистограмме - группе самого высокого риска прогрессирования, что соответствует 53%-ной абсолютной вероятности прогрессирования заболевания.

По своим клинико-морфологическим характеристикам больная Н. относилась к группе благоприятного прогноза. Однако по результатам опроса оптимальной БС больная Н. была отнесена к 4-й группе - самого высокого риска прогрессирования заболевания. По анамнестическим данным прогрессирование заболевания у больной выявлено через короткий срок - 20 месяцев, что подтверждает правильность прогноза, полученного при использовании гистограммы риска.

Пример №2

В БДП НУЗ ЦКБ №2 им. Н.А. Семашко ОАО «РЖД» для каждой пациентки есть 32 клинических и молекулярно-биологических параметра, полученных в результате обследования. Проводили дискретизацию для непрерывных параметров; в данном случае такой параметр только один - возраст, который был разделен на интервалы: 0-29, 30-39, 40-49, 50-59, 60-69, 70-79, 80-89. В качестве конечной точки выбрали наступление смерти - КТ2-С. Построили наивную байесовскую сеть, в которой корневой узел соответствовал КТ2-С, а узлы-листья соответствовали 32-м параметрам пациентов. Оптимизировали данную сеть по числу узлов, добиваясь максимального значения AUC. В результате получили оптимальную байесовскую сеть, содержащую 7 узлов-листьев и корневой узел, соответствующий КТ2-С (рис. 5), и имеющую значение AUC=0,907. Эти семь узлов соответствовали семи прогностическим параметрам для данного исхода. Для определения вероятности наступления смерти построили гистограмму риска (рис. 3Б). Затем, используя оптимальную БС и построенную гистограмму риска, предсказали наступление исхода - смерть для больной П.

Пациентка П., 53 года. Диагноз: рак правой молочной железы T3N2M0, III Б стадия, состояние после комплексного лечения в 1998 г.

На первом этапе выполнен курс предоперационной лучевой терапии СОД 40-38-44 Гр. Второй этап включал хирургическое лечение в объеме мастэктомии по Пейти справа. Гистологическое заключение №199529-62: инфильтрирующий протоковый рак. На третьем этапе проведено 6 курсов химиотерапии.

Был проведен опрос оптимизированной обученной БС (рис. 5) по семи прогностическим параметрам данной пациентки: менструальный статус, категория Т, категория N, молекулярно-биологический подтип, уровень экспрессии мРНК YB-1, предоперационная лучевая терапия, гормонотерапия. В результате опроса БС получили условную вероятность наступления прогрессирования - 0,01 - это КТ2-С, и это значение позволило отнести пациентку к 1-й группе на гистограмме - группе самого низкого риска смерти, что соответствует 2% абсолютной вероятности смерти пациентки.

По своим клинико-морфологическим характеристикам больная П. относится к группе неблагоприятного прогноза с высоким риском наступления смерти. Однако по результатам опроса обученной оптимальной БС вероятность наступления смерти составила всего 2%, что и подтверждается данными анамнеза - больная П. жива по настоящее время, в течение 192 месяцев.

Список литературы

1. Heckerman D., Horvitz Е., Nathwani В. // Methods of Information in Medicine. 1992. V. 3. P. 90-105.

2. Lucas P.J., van der Gaag L.C., Abu-Hanna A. // Artificial Intelligence in Medicine. 2004. V. 30. №3. P. 201-14.

3. Gevaert O., De Smet F., Timmerman D., Moreau Y., De Moor B. // Bioinformatics. Oxford University Press. 2006. V. 22. №14. P. 184-190.

4. Sulimov A.V., Vtyurina D.N., Romanov A.N., Maslennikov E.D., Sulimov V.B., Kurochkin I.N., Uporov I.V., Zateyschikov D.A., Nosikov V.V., Varfolomeev S.D. Expert systems of personalized medicine: the use of Bayesian networks to predict the state of patients // monograph: Post-genomic research and technology (ed. Corr. RAS Varfolomeeva S.D.). Publishing House of Moscow University. 2011. P. 641-702.

5. Maslennikov E.M., Sulimov A.V., Evdokimov M.A., Zateyschikov D.A., Nosikov V.V., Sulimov V.B. // Russian National Cardiology Congress. 2012. P.291-292.

6. Eliseeva I.A., Kim E.R., Guryanov S.G., Ovchinnikov L. P., Lyabin D. N. // Uspekhi Biologicheskoi Khimii. 2011. V. 51. P. 65-163.

7. Gessner C, Woischwill C, Schumacher A., Liebers U., Kuhn H., Stiehl P., Jurchott K., Royer H.D., Witt C, Wolff G. // European Respiratory Journal. 2004. V. 23. № 1. P. 14-19.

8. Stavrovsaya A.A., Stromskaya T.P., Rybalkina E.Y., Moiseeva N.I., Vaiman A.V., Guryanov S.G., Ovchinnikov L.P., Guens G.P. // Current signal transduction therapy. 2012. V. 07. №03. P. 237-246.

9. Патент №2300111, опубл. 15.06.2005.

10. Патент №2413231, опубл. 06.04.2009.

11. Xia Jiang, Diyang Xue, Adam Brufsky, Seema Khan and Richard Neapolitan, A New Method for Predicting Patient Survivorship Using Efficient Bayesian Network Learning // Cancer Informatics, 2014. 13. P.47-57.

Способ прогнозирования исходов рака молочной железы путем использования байесовских сетей, построенных на основе базы данных пациенток с верифицированным диагнозом рака молочной железы, отличающийся тем, что используют наивные байесовские сети, оптимизированные по числу узлов до получения максимальной величины площади под ROC-кривой, определяя значимые параметры, влияющие на исход рака молочной железы, при этом каждый узел, кроме корневого, соответствует одному из параметров базы данных пациенток, а корневые узлы соответствуют конечным точкам, характеризующим прогрессирование заболевания или смерть пациентки на заданном временном интервале, причем для прогноза прогрессирования заболевания значимыми параметрами являются возраст на момент операции, менструальный статус, категория N - лимфоузлы, экспрессия рецепторов прогестерона, экспрессия рецептора HER-2/neu, предоперационная лучевая терапия, неоадъювантная химиотерапия; для прогноза смерти пациентки значимыми параметрами являются менструальный статус, категория Т - размер опухоли, категория N - лимфоузлы, молекулярно-биологический подтип, уровень экспрессии мРНК YB-1, предоперационная лучевая терапия, гормонотерапия; после чего на основании данных, полученных при построении ROC-кривых, строят гистограммы риска исходов рака молочной железы, связывающие условную вероятность исходов с абсолютной вероятностью соответствующего исхода, разбивая условную вероятность исхода на четыре интервала значений, которые соответствуют четырем группам риска; проводят опрос обученной ранее БС, используя значимые параметры конкретной пациентки, на основании полученной при опросе БС условной вероятности соответствующего исхода данную пациентку относят к одной из групп риска и по полученной величине с помощью гистограмм риска абсолютной вероятности определяют прогноз соответствующего исхода - прогрессирование или смерть.