Способы моделирования межмолекулярного взаимодействия и основанный на них способ прогнозирования связывания молекулы-лиганда с молекулой-мишенью

Иллюстрации

Показать все

Изобретение относится к разработке новых соединений для медицины, биотехнологии, физики конденсированных сред и различных областей материаловедения, в которых существенны межмолекулярные взаимодействия. Техническим результатом является обеспечение требуемой точности создаваемых потенциалов взаимодействия и упрощение обработки с использованием аналитических выражений для потенциалов взаимодействия, обеспечивающих возможность быстрой численной обработки при молекулярно-динамическом моделировании. Предложенные способы моделирования процесса связывания молекулы-лиганда с молекулой-мишенью опираются на подгонку некоторого числа параметров под результаты экспериментального измерения величин, характеризующих процесс связывания. Молекулярно-динамический способ моделирования основан на подгонке меньшего числа параметров под эксперимент, но требует значительных затрат компьютерного времени, так как необходимо найти траектории движения всех входящих в молекулу-мишень и молекулу-лиганд атомов при учете их теплового движения. Молекулярно-механический способ включает в себя большее число параметров, определяемых из эксперимента, но требует провести лишь оптимизацию полной энергии системы взаимодействующих друг с другом молекулы-мишени и молекулы-лиганда. Оба способа моделирования учитывают влияние растворителя, в котором может происходить процесс связывания, причем растворитель моделируется либо явным образом путем введения в систему молекул растворителя, либо неявным образом, когда растворитель заменяется на непрерывную среду с заданными характеристиками, такими как диэлектрическая проницаемость и проводимость. Оба способа моделирования основаны на определении классических потенциалов взаимодействия между атомами молекулы-мишени и молекулы-лиганда с помощью высокоточных неэмпирических квантово-механических расчетов. 4 н. и 24 з.п. ф-лы, 11 ил., 3 табл.

Реферат

Изобретение относится к разработке новых соединений для медицины, биотехнологии, физики конденсированных сред и различных областей материаловедения, в которых существенны межмолекулярные взаимодействия.

Изобретение может быть использовано при разработке новых лекарственных препаратов методами in silico, то есть путем численного моделирования комплекса лекарственного вещества с рецептором или целевым белком методами молекулярной динамики или молекулярной механики. В ходе такого моделирования могут быть получены численные значения параметров, характеризующие взаимодействие белка и лекарственного вещества и позволяющие сделать вывод об устойчивости комплекса лекарственного вещества с рецептором или целевым белком и, следовательно, об эффективности лекарственного соединения.

В настоящее время для решения вышеуказанных задач широко используются модели силового поля как эмпирические, так и ab-initio. Наиболее популярные из них - эмпирические модели семейства MMn, различные модификации моделей AMBER, последняя из которых - AMBER2002, OPLS-AA, CHARMM, ab-initio силовое поле MMFF, а также множество других моделей для параметризации взаимодействия конкретных молекул - например ab-initio параметризованная модель SAPT-5s для молекулы воды.

В аспекте настоящего изобретения интерес представляет возможность параметризации силового поля при помощи ab-initio методов квантовой химии, т.е. методов, основанных на базовых положениях квантовой теории. Эти методы часто называют неэмпирическими в отличие от полуэмпирических и других, в которых в теоретические расчеты вводится большое количество эмпирических параметров, измеренных экспериментально.

Так, в цикле работ Халгрена [1] разработана модель MMFF (Merck Molecular Force Field), предназначенная в основном для изучения взаимодействия протеин-лиганд, где в качестве лиганда могут выступать соединения, принадлежащие к различным группам органических соединений. Это является отличительной чертой силового поля MMFF, так как большинство других силовых полей, применяемых в биологии и медицинской химии, были оптимизированы для узкого класса соединений (вода, пептиды, молекулы ДНК и РНК). Таким образом, силовое поле MMFF принадлежит к новому поколению моделей (силовое поле класса II).

Силовое поле MMFF создано для возможно более точного воспроизведения энергии конформеров молекул и межмолекулярного взаимодействия, так как эти параметры важны для определения характеристик, описывающих образования комплексов белок-лиганд. В то же время воспроизведение частот колебаний молекул, а также теплоты образования молекул не являлось целью построения этого силового поля. Так как точные экспериментальные данные об энергии межмолекулярного взаимодействия и энергии конформеров для широкого класса молекул отсутствуют, то естественным является использование для параметризации данных, полученных из квантово-химических расчетов.

Электростатическое взаимодействие в силовом поле MMFF представлено смещенным кулоновским потенциалом точечных зарядов. Величины точечных зарядов определяются правилами расстановки, которые основаны на величинах относительной электроотрицательности соседних атомов. Эти параметры подбираются таким образом, чтобы результирующее распределение зарядов наилучшим образом описывало электростатический потенциал, рассчитанный по методу Хартри-Фока в базисе 6-31G*. Детали правил расстановки опубликованы в работах Халгрена [1].

Ван-дер-Ваальсово взаимодействие атомов представлено в MMFF смещенным потенциалом 14-7.

Часть силового поля MMFF, описывающая растяжение ковалентных связей, определена до слагаемых, содержащих межатомное расстояние в четвертой степени, для изгиба связей соответствующий вклад определен до члена, кубичного по углу. Кроме того, силовое поле MMFF содержит выражения для смешанной энергии растяжения-изгиба и внеплоскостного изгиба (out-of-plane bending). Энергия поляризации явным образом не описывается силовым полем MMFF, однако заряды, определяющие электростатическое взаимодействие, определены с учетом поляризации средой с диэлектрической проницаемостью, близкой к 80 (неявный учет поляризации). Эти заряды отражают увеличение дипольных моментов молекул, находящихся в водном окружении, по сравнению с величинами в вакууме. Аналогичный подход используется и в других современных моделях силового поля (AMBER, CHARMM, OPLS-AA).

Известна также модель силового поля для молекулы воды [2], параметризация которой опирается на разложение энергии взаимодействия димера воды по методу Симметризованной Теории Возмущения (SAPT - Symmetry Adapted Perturbation Theory [3]). Модель силового поля имеет спектроскопическое качество (т.е. способна воспроизвести детали колебательно-вращательного спектра димера воды). Последняя модификация модели представляет собой сумму парных потенциалов взаимодействия между силовыми центрами. В качестве силовых центров выступают атомы в составе молекулы воды, а также дополнительные центры. Общее количество центров для молекулы воды составляет 8. В результате параметризации с использованием достаточно сложной функциональной формы удалось достичь точности до 0.1 ккал/моль в широком диапазоне энергий взаимодействия молекул в димере воды. Для моделирования олигомеров воды, а также для моделирования свойств жидкой воды парные взаимодействия дополнялись неаддитивной трехчастичной компонентой. Описанный подход хорошо соответствует задачам моделирования олигомеров воды, однако отдельные энергетические компоненты в модели поля не имеют определенного физического смысла, так как достигается согласование только с полной энергией взаимодействия. Следствием этого является то, что параметры силового поля, определенные, в частности, для воды, с трудом могут применяться для других классов соединений.

В патенте США 6,460,014 описан способ моделирования взаимодействий путем создания электростатической части силового поля, описывающей взаимодействие молекул как взаимодействие локальных атомных мультипольных моментов - как постоянных, так и наведенных электростатическим полем. Наведенные мультипольные моменты определяются при помощи анизотропного тензора дипольной поляризуемости. Электростатическое поле может иметь как внешнюю природу, так и создаваться соседними атомами и молекулами в рассматриваемой системе. Таким образом, индивидуальными атомными параметрами в схеме параметризации, представленной в патенте США 6,460,014, являются атомные мультипольные моменты и атомные тензоры дипольной поляризуемости. Эти параметры присваиваются атомам на основании подгонки с целью получить значения мультипольных моментов всей молекулы близкими к результатам неэмпирических расчетов методами квантовой химии. Такой подход позволяет авторам вычислять энергию электростатического взаимодействия точнее, чем при использовании только атомных монополей (атомных зарядов). Кроме того, учитывается поляризация молекулы как внешним электростатическим полем, так и полем, наводимым другими атомами в составе молекулы.

Однако известно, что реальное электростатическое взаимодействие между молекулами не может быть описано как взаимодействие точечных мультиполей, так как имеет место пространственное распределение электронного заряда в молекуле, что ведет к эффектам перекрывания электронных плотностей. В результате этого точечные параметры не описывают адекватно взаимодействие молекул, особенно на коротких расстояниях. К тому же вычисление электростатической энергии взаимодействия произвольно расположенных мультиполей требует большого компьютерного времени, что нежелательно для применения модели силовых полей в молекулярно-динамических расчетах. Кроме того, при вычислении поляризационной энергии с помощью параметров тензора дипольной поляризуемости, присваиваемых отдельным атомам, возникает так называемая поляризационная катастрофа, которая состоит в том, что при определенных расстояниях между двумя точечными поляризационными центрами, описываемыми тензорами дипольной поляризуемости, и определенной величине электростатического поля результирующий наведенный дипольный момент всей системы обращается в бесконечность. Причина появления поляризационной катастрофы также заключается в пренебрежении пространственным распределением электронной плотности в реальных молекулах. Использование мультипольных разложений требует много компьютерного времени и существенно ограничивает применение предложенной методики для молекулярно-динамического моделирования.

К недостаткам данного известного способа, раскрытого в патенте США 6,460,014, можно отнести то, что в нем обеспечивается моделирование только одного типа взаимодействий, а именно только электростатических взаимодействий, которые составляют только часть междуатомных и межмолекулярных взаимодействий. При этом для неэлектростатических взаимодействий предлагается использовать какие-либо известные выражения, полученные в других работах на основе разных методик. Это приводит к несбалансированности вкладов различных типов взаимодействий и сравнительно невысокой точности вычислений. Вследствие того что в известном способе электростатические взаимодействия описываются как взаимодействие локальных атомных мультипольных моментов, это приводит не только к значительным ошибкам при моделировании взаимодействия на малых межмолекулярных расстояниях, но может при определенных конфигурациях молекул приводить также к сингулярностям (так называемая поляризационная катастрофа), делающим невозможным вычисление энергии взаимодействия. Последний недостаток особенно существен при применении силового поля в молекулярно-динамических расчетах, когда рассматривается большое количество различных конфигураций. Кроме того, предлагаемое в известном способе мультипольное разложение требует сравнительно большого компьютерного времени, что существенно ограничивает использование предложенного в этом патенте силового поля в молекулярно-динамическом моделировании.

Таким образом, задачей настоящего изобретения является создание способа моделирования межмолекулярного взаимодействия, обеспечивающего создание силового поля, в котором с помощью единой методологии учитываются все типы межмолекулярных взаимодействий, а его электростатическая составляющая формируется с учетом того, что реальные заряды в молекулах распределены в пространстве непрерывным образом. Техническим результатом является достижение точности создаваемых потенциалов взаимодействия, определяемой уровнем точности данных, по которым проводится определение потенциалов взаимодействия, а также упрощение обработки с использованием полученных аналитических выражений для потенциалов взаимодействия, обеспечивающих возможность осуществления сравнительно быстрой численной обработки при молекулярно-динамическом моделировании.

Рассматриваемое изобретение включает в себя способы моделирования межмолекулярного взаимодействия и основанный на них способ прогнозирования молекул-лигандов, связывающихся с заданной молекулой-мишенью. Способы моделирования основываются на вводе данных о трехмерной структуре молекул и потенциалов межмолекулярного взаимодействия в компьютер. Трехмерные структуры и состав молекулы-мишени и молекулы-лиганда получают с помощью измерений, например, методами рентгеноструктурного анализа, или рассеяния нейтронов, или ядерного магнитного резонанса, или считыванием предварительно сохраненных данных с соответствующих носителей информации.

Предложены два способа моделирования процесса связывания молекулы-лиганда с молекулой-мишенью: молекулярно-динамический и молекулярно-механический. В обоих способах моделирования используются параметры моделирования, которые подбираются так, чтобы полученные при моделировании числовые данные, характеризующие интенсивность связывания молекулы-лиганда с молекулой-мишенью, совпадали с заданной точностью с экспериментально измеренными величинами, характеризующими интенсивность связывания упомянутых молекул друг с другом. К рассчитываемым и измеряемым величинам, характеризующим интенсивность связывания молекулы-лиганда и молекулы-мишени, относится свободная энергия связывания или другие величины, такие как константа связывания, константа диссоциации, константа ассоциации, константа ингибирования, концентрация половинного ингибирования, энтальпия связывания, энтропия связывания и их комбинации. После того, как параметры моделирования будут подобраны для воспроизведения экспериментально измеренных числовых данных, характеризующих интенсивность связывания для определенного множества молекул-мишеней и молекул-лигандов, эти параметры и соответствующую методику моделирования предлагается использовать для прогнозирования молекул-лигандов, наиболее сильно связываемых с заданной молекулой-мишенью.

При молекулярно-динамическом и молекулярно-механическом моделировании координаты молекулы-мишени и координаты молекулы-лиганда считываются в компьютер и над ними производятся вычисления так, что расстояния от атомов молекулы-лиганда до заданных атомов молекулы-мишени попадают в заданный диапазон, т.е. молекула-лиганда оказывается расположенной достаточно близко к заданному месту в молекуле-мишени. После этого в обоих способах моделирования производятся вычислительные операции, включающие в модель растворитель, в котором происходит процесс связывания молекулы-лиганда с молекулой-мишенью.

После этого в молекулярно-динамическом моделировании определяются траектории движения всех взаимодействующих друг с другом атомов молекулы-мишени и молекулы-лиганда с учетом наличия растворителя путем решения уравнений Ньютона или Лагранжа при учете теплового движения атомов и с помощью этих траекторий вычисляются величины, характеризующие интенсивность связывания молекулы-лиганда с молекулой-мишенью, и эти величины записываются на носитель информации.

При молекулярно-механическом моделировании после считывания в компьютер координат атомов молекулы-мишени и молекулы-лиганда, их преобразования так, чтобы расстояния от атомов молекулы-лиганда до заданных атомов молекулы-мишени попали в заданный диапазон значений, и проведения вычислительных операций, включающих растворитель, вычисляют полную энергию системы взаимодействующих молекулы-мишени, лиганда и растворителя как функцию координат атомов молекулы-мишени, атомов лиганда и параметров, характеризующих растворитель, определяют минимальное значение этой полной энергии системы при варьировании положений атомов молекулы-мишени, молекулы-лиганда и параметров растворителя и записывают на носитель информации координаты атомов и параметры, характеризующие растворитель, при которых достигается минимум полной энергии системы взаимодействующих молекулы-мишени, лиганда и растворителя. Для полученных так координат атомов и параметров, характеризующих растворитель, вычисляют внутреннюю энергию молекулы-лиганда и энергию взаимодействия молекулы-лиганда с молекулой-мишенью и растворителем как сумму вкладов от парных потенциалов взаимодействия, где в каждой паре атомов один принадлежит молекуле-лиганду, а второй - молекуле-мишени, либо растворителю, причем в соответствии с различными типами потенциалов взаимодействия энергию взаимодействия вычисляют как сумму по меньшей мере двух отдельных компонент - электростатической и Ван-дер-Ваальсовой.

Затем с помощью координат атомов молекулы-лиганда, параметров, характеризующих растворитель, и потенциалов их взаимодействия вычисляют полную энергию системы взаимодействующих лиганда и растворителя без молекулы-мишени и находят ее минимальное значение при варьировании положений атомов молекулы-лиганда и параметров, характеризующих растворитель. Для найденных так координат атомов молекулы-лиганда и параметров, характеризующих растворитель, вычисляют внутреннюю энергию молекулы-лиганда и энергию взаимодействия молекулы-лиганда с растворителем как сумму по меньшей мере трех отдельных компонент - электростатической, Ван-дер-Ваальсовой и кавитационной.

Наконец, вычисляют разности между значениями соответствующих компонент энергии взаимодействия молекулы-лиганда с молекулой-мишенью и растворителем, а также значениями внутренней энергии лиганда в случае, когда молекула-лиганд связана с молекулой-мишенью, и в случае, когда молекула-лиганд находится в растворителе без молекулы-мишени. Полученные разности энергий используются для составления из этих величин оценочного значения свободной энергии связывания молекулы-мишени и лиганда в виде линейной или нелинейной комбинации этих величин с весовыми коэффициентами и записывают полученное оценочное значение свободной энергии связывания молекулы-мишени и лиганда на носитель информации.

При молекулярно-динамическом и при молекулярно-механическом моделировании используются два типа модели растворителя. Один из них с явным учетом растворителя, когда молекулы растворителя с их координатами и соответствующими потенциалами взаимодействия добавляются в компьютере к массиву координат и потенциалов взаимодействия молекулы-мишени и молекулы-лиганда. Во втором типе модели растворителя с использованием координат атомов молекулы-мишени и молекулы-лиганда вычисляются координаты точек, находящихся на поверхности, доступной растворителю, которая охватывает молекулу-мишень, молекулу-лиганд и их комплекс, и с помощью этих точек строится математическая модель неявного учета растворителя. Используется одна из трех разновидностей математической модели неявного учета растворителя. В первой из них используется совокупность программных средств, реализующих решение уравнения Пуассона и описывающих взаимодействие молекулы-мишени и молекулы-лиганда с непрерывной средой, заполняющей все пространство вне поверхности, доступной растворителю и имеющей диэлектрическую проницаемость, равную диэлектрической проницаемости растворителя; во второй разновидности математической модели неявного учета растворителя используют совокупность программных средств, реализующих решение уравнений, описывающих взаимодействие молекулы-мишени и молекулы-лиганда с непрерывным проводником, заполняющим все пространство вне поверхности доступной растворителю; в третьей разновидности математической модели неявного учета растворителя используется совокупность программных средств, реализующих решение уравнения Пуассона-Больцмана и описывающих взаимодействие молекулы-мишени и молекулы-лиганда с непрерывной средой, имеющей отличную от нуля диэлектрическую проницаемость и отличную от нуля проводимость и заполняющей все пространство вне поверхности, доступной растворителю.

В случае модели неявного учета растворителя вычисляют также значения свободной энергии сольватации молекулы-лиганда, молекулы-мишени и их комплекса как сумму по меньшей мере трех компонент: электростатической, Ван-дер-Ваальсовой и кавитационной, и при определении оценочного значения свободной энергии связывания молекулы-лиганда с молекулой-мишенью используют также разности между соответствующими компонентами свободной энергии сольватации комплекса молекулы-мишени и молекулы-лиганда с одной стороны, и суммой соответствующих компонент свободной энергии сольватации молекулы-мишени и компонент свободной энергии сольватации молекулы-лиганда, с другой стороны.

Рассматриваемое изобретение включает в себя также реализуемый компьютером способ определения потенциалов межмолекулярного взаимодействия. Этот способ основан на вычислении энергии межмолекулярного взаимодействия с помощью высокоточных неэмпирических квантовых расчетов. Определение потенциалов взаимодействия происходит следующим образом. Выбираются пары молекул таким образом, чтобы их атомы соответствовали типам атомов, встречающихся в молекулах-мишенях и молекулах-лигандах, причем тип атома определяется положением в таблице Менделеева соответствующего элемента, характеризующегося атомным номером и атомным весом, и соседними атомами в молекуле-мишени или молекуле-лиганде. Для выбранной пары молекул считывают геометрические параметры каждой молекулы в память компьютера в соответствующем формате и с помощью соответствующей компьютерной программы вычисляют набор координат атомов этих молекул, соответствующих различным взаимным расположениям этих молекул, и записывают полученные данные на носитель информации в виде множества точек в пространстве межмолекулярного комплекса. Далее из множества всех точек в пространстве межмолекулярного комплекса формируют два его подмножества: обучающее подмножество для подгонки параметров взаимодействия и тестовое подмножество для проверки качества полученных потенциалов. Для каждой точки этих множеств вычисляют полную энергию взаимодействия рассматриваемых молекул друг с другом и ее различных компонент с помощью квантовых расчетов, основанных на решении уравнения Шредингера, описывающих поведение электронов в заданном поле атомных ядер молекул. Компоненты взаимодействия группируют в четыре основных типа энергии взаимодействия, включающих энергию электростатического взаимодействия, обменную, индукционную и дисперсионную энергию, и записывают полученные числовые данные, сгруппированные по указанным четырем компонентам, на носитель информации. Эту процедуру проделывают для всех точек обучающего и тестового множеств из пространства межмолекулярного комплекса. Таким образом, на носителе информации оказываются записанными для каждой точки обучающего и тестового множеств по четыре компоненты энергии межмолекулярного взаимодействия, рассчитанные с помощью точных неэмпирических квантовых расчетов.

После этого для каждой точки обучающего и тестового множеств из пространства межмолекулярного комплекса вычисляют энергию взаимодействия рассматриваемых молекул друг с другом как сумму взаимодействий между входящими в состав молекул парами атомов с помощью содержащих параметры взаимодействия классических потенциалов, представляющих собой энергию взаимодействия двух частиц, характеризуемых массой и положением в пространстве, причем энергия взаимодействия заданной пары атомов вычисляется как сумма классических потенциалов, соответствующих различным компонентам взаимодействия.

Функциональная зависимость классического потенциала, соответствующего заданной компоненте энергии взаимодействия, содержит параметры взаимодействия, и эти параметры определяются следующим образом. Целевая функция для заданной компоненты межмолекулярного взаимодействия вычисляется как сумма квадратов разностей соответствующих величин для всех точек обучающего подмножества, полученных с помощью квантовых расчетов, с одной стороны, и полученных с помощью классических потенциалов, с другой стороны. Эта целевая функция минимизируется при варьировании параметров взаимодействия, входящих в упомянутую функциональную зависимость, выбранную для заданной компоненты энергии межмолекулярного взаимодействия, и записывают на носитель информации значения параметров, при которых целевая функция достигает своего минимума. Для этих значений параметров взаимодействия вычисляют такую же целевую функцию для точек из тестового множества пространства межмолекулярного комплекса, и если она не превышает заданную величину, соответствующую точности квантовых расчетов, то определение параметров взаимодействия для заданной компоненты межмолекулярного взаимодействия считается законченным, и использованные параметры взаимодействия присваиваются соответствующим атомам, входящим в рассматриваемую пару молекул. Если же целевая функция, вычисленная на точках из тестового множества, превышает заданную точность, соответствующую точности квантовых расчетов, то обучающее множество пространства межмолекулярного комплекса расширяют или изменяют функциональную зависимость потенциала рассматриваемого взаимодействия, и повторяют подгонку параметров взаимодействия до тех пор, пока целевая функция не уменьшится до требуемой величины.

Функциональная зависимость классического потенциала, соответствующего заданной компоненте энергии взаимодействия, выбирается таким образом, что весь набор параметров взаимодействия для заданной пары молекул разбивается однозначным образом на подмножества параметров взаимодействия, соотнесенных с каждым отдельным типом атомов или пар атомов, и обеспечивается возможность формирования потенциалов взаимодействия между любой заданной парой молекул как суммы соответствующих классических потенциалов для всех пар атомов, один из которых принадлежит первой молекуле, а второй атом - второй молекуле.

Приведенная выше процедура определения параметров взаимодействия повторяется для всех четырех компонент энергии межмолекулярного взаимодействия, и окончательные значения параметров взаимодействия записываются на носитель информации для их последующего использования при молекулярно-динамическом или молекулярно-механическом моделировании.

Изобретение поясняется на примерах осуществления, иллюстрируемых чертежами, на которых представлено следующее:

Фиг.1 - блок-схема алгоритма способа прогнозирования связывания молекулы-лиганда с молекулой-мишенью, соответствующего изобретению.

Фиг.2 - блок-схема алгоритма способа молекулярно-динамического моделирования, который может быть использован на этапе 3 в способе по фиг.1.

Фиг.3 - блок-схема алгоритма способа молекулярно-механического моделирования, который может быть использован на этапе 3 в способе по фиг.1.

Фиг.4 - блок-схема алгоритма определения параметров, описывающих потенциалы межмолекулярного взаимодействия, который может быть использован в способе по фиг.1.

Фиг.5 - Распределения заряда в атомах, где c - общий заряд на центре, d - диффузный заряд на центре.

Фиг.6 - Геометрия и параметры модели силового поля для молекулы воды.

Фиг.7 - Результаты параметризации модели электростатического взаимодействия для димера воды (RMS=0,115 ккал/моль).

Фиг.8 - Результаты параметризации модели обменного взаимодействия для димера воды (RMS=0,306 ккал/моль).

Фиг.9 - Результаты параметризации модели индукционного взаимодействия для димера воды (RMS=0,144 ккал/моль).

Фиг.10 - Результаты параметризации модели дисперсионного взаимодействия для димера воды (RMS=0,188 ккал/моль).

Фиг.11 - Результаты параметризации полной энергии взаимодействия для димера воды (RMS=0,229 ккал/моль).

Заявленные способы моделирования межмолекулярного взаимодействия и основанный на них способ прогнозирования связывания молекулы-лиганда с молекулой-мишенью описаны ниже на фиг.1-4. На фиг.1 изображен способ прогнозирования связывания молекулы-лиганда с молекулой-мишенью. Из множества молекул-мишеней и множества молекул-лигандов на этапе 1 выбирается заданная пара молекулы-мишени и молекулы-лиганда, и информация об их структуре и составе, а также координаты атомов этих молекул записываются на носитель информации в соответствующем формате. Структуру и состав молекулы-мишени и молекулы-лиганда получают с помощью измерений, например, методами рентгено-структурного анализа или рассеяния нейтронов или ядерного магнитного резонанса, или считыванием предварительно сохраненных данных с соответствующих носителей информации. Например, данные о структуре белков, которые могут быть использованы в качестве молекулы-мишени, обычно получаются из соответствующей базы данных (Protein Data Bank) [4], доступ к которой может быть получен через Интернет.

Далее на этапе 2 выбирают параметры моделирования, к которым могут относиться как параметры, описывающие потенциалы взаимодействия между атомами, входящими в состав молекулы-мишени и молекулы-лиганда, так и другие параметры, необходимые для построения модели, описывающей связывание молекулы-лиганда с молекулой-мишенью, например параметры, описывающие модель термостата при молекулярно-динамическом моделировании, или параметры, определяющие влияние растворителя. После этого на этапе 3 проводят моделирование процесса связывания заданной молекулы-лиганда с заданной молекулой-мишенью с использованием информации о структуре молекулы-мишени и молекулы-лиганда и других параметрах моделирования. В результате проведения моделирования получают числовые данные, характеризующие интенсивность связывания молекулы-лиганда с молекулой-мишенью, и записывают полученные числовые данные на носитель информации. В качестве величин, характеризующих интенсивность связывания молекулы-лиганда и молекулы-мишени между собой, вычисляются величины, выбранные из группы, включающей свободную энергию связывания, константу связывания, константу диссоциации, константу ассоциации, константу ингибирования, концентрацию половинного ингибирования, энтальпию связывания, энтропию связывания и их комбинации.

На этапе 4 проводятся эксперименты, в результате которых измеряются величины, характеризующие интенсивность связывания заданной молекулы-лиганда с заданной молекулой-мишенью. На следующем этапе 5 осуществляют сравнение рассчитанных при моделировании на этапе 3 величин, характеризующих интенсивность связывания заданной молекулы-лиганда с заданной молекулой-мишенью, и аналогичных величин, полученных в результате измерений на этапе 4. В случае расхождения между рассчитанными и измеренными величинами, характеризующими интенсивность связывания между молекулой-мишенью и молекулой-лигандом, превышающего заданную величину, на этапе 6 корректируют параметры моделирования, используемые программой, моделирующей взаимодействие между молекулой-мишенью и молекулой-лигандом (возврат на этап 2 выбора параметров), повторно проводят моделирование на этапе 3 и рассчитывают величины, характеризующими интенсивность связывания между молекулой-мишенью и молекулой-лигандом. Этот процесс подгонки параметров моделирования продолжается до тех пор, пока расхождение между рассчитанными и измеренными величинами, характеризующими связывание молекул между собой, не станет меньше заданной величины. После этого процесс подгонки параметров моделирования для заданной пары молекулы-мишени и молекулы-лиганда считается законченным.

Далее выбирается другая пара молекулы-лиганда и молекулы-мишени, и для нее описанные выше этапы моделирования 3, измерения 4, сравнения 5 результатов моделирования и измерений и корректировка 6 параметров моделирования повторяются, причем в качестве начальных используются значения параметров моделирования, полученные для предыдущей пары молекулы-мишени и молекулы-лиганда. Затем выбирается следующая пара молекулы-мишени и молекулы-лиганда и т.д.

В результате такой процедуры определяются значения параметров моделирования, которые в результате моделирования позволяют получать значения величин, характеризующих интенсивность связывания молекулы-лиганда с молекулой-мишенью, например, свободную энергию связывания, с заданной точностью для определенного множества пар молекул-мишеней и молекул-лигандов. Этот процесс расширения множества пар молекул-мишеней и молекул-лигандов и самосогласованной подгонки параметров моделирования продолжается до тех пор, пока для очередной взятой вновь пары молекулы-мишени и молекулы-лиганда характеризующие интенсивность связывания величины, вычисленные с использованием параметров моделирования, полученных для других пар молекул, не будут совпадать с заданной точностью с измеренными для данной пары молекул величинами, характеризующими интенсивность связывания. После этого окончательные значения параметров моделирования записываются на этапе 7 (фиг.1) на носитель информации, и в дальнейшем они используются для прогнозирования.

Прогнозирование на этапе 8 молекул-лигандов, которые достаточно сильно связываются с заданной молекулой-мишенью, заключается в следующем. Для заданной молекулы-мишени выбирается молекула-лиганд из определенного набора молекул, и для нее проводится моделирование процесса связывания с использованием окончательных значений параметров моделирования, полученных и записанных на носитель информации на этапе 7. В результате такого моделирования получаются величины, характеризующие интенсивность связывания этой молекулы-лиганда с заданной молекулой-мишенью, например величина свободной энергии связывания. Далее берется другая молекула-лиганд и для нее тоже в результате моделирования вычисляется свободная энергия связывания при использовании тех же самых параметров моделирования. Так перебираются все молекулы из определенного множества молекул-лигандов и из них выбираются лучшие, имеющие наибольшее значение свободной энергии связывания или других величин, характеризующих интенсивность связывания. Например, считается, что молекула-лиганд связывается достаточно интенсивно в водном растворе с заданным протеином, если ее свободная энергия связывания с заданным протеином находится в диапазоне (5-15) ккал/моль. Множество молекул-лигандов, из которого выбираются кандидаты для прогнозирования, может быть получено разными путями. Это могут быть базы данных, содержащие информацию о структуре молекул, полученную в различных экспериментах, или базы данных, содержащих координаты атомов молекул, построенных с помощью различных компьютерных программ. Количество молекул в таких базах данных может быть огромным (миллионы и даже миллиарды соединений), и каждая из этих молекул существует в реальности или может быть синтезирована. Важно, чтобы для молекул этого множества имелась информация об их трехмерной структуре, составе и координатах всех атомов. Те молекулы-лиганды, для которых прогнозируется хорошее связывание, могут быть использованы в реальных химических экспериментах по связыванию с заданной молекулой-мишенью. Таким образом, предлагаемое в настоящем изобретении прогнозирование молекул-лигандов, которые связываются наилучшим образом с заданной молекулой-мишенью, позволяет избежать огромных материальных и временных затрат на синтез новых веществ и проведение экспериментов по измерению величин, характеризующих интенсивность связывания молекул друг с другом.

В соответствии с настоящим изобретением на фиг.2 и 3 представлены блок-схемы, иллюстрирующие два варианта этапа 3 на фиг.1 способа моделирования величин, характеризующих интенсивность связывания молекулы-лиганда с молекулой-мишенью.

На фиг.2 приведен молекулярно-динамический способ моделирования, который заключается в следующем. На этапе 9 считывают данные о структуре молекулы-мишени и молекулы-лиганда с носителя информации в память компьютера и выполняют преобразование координат атомов этих молекул таким образом, чтобы наименьшее расстояние между каждым из атомов лиганда и заданными атомами молекулы-мишени находилось в заданном диапазоне, например в диапазоне 1-5 ангстрем, и записывают новые координаты атомов молекулы-мишени и молекулы-лиганда в память компьютера. Такая процедура стыковки или, как чаще принято называть, докинга необходима для совмещения в пространстве двух молекул, так как обычно координаты их атомов получаются из различных источников информации.

Процесс связывания молекулы-лиганда с молекулой-мишенью часто происходит в растворителе, например в воде. Поэтому при моделировании процесса связывания надо учесть наличие растворителя и его взаимодействие с другими молекулами. В изобретении предусматриваются две модели учета растворителя: явного учета (этап 10) и неявного учета (этап 11).

При использовании модели явного учета растворителя на этапе 10 к координатам атомов молекулы-мишени и молекулы-лиганда добавляются координаты атомов молекул растворителя (например, воды) так, чтобы средняя плотность расположения в пространстве молекул растворителя соответствовала экспериментально наблюдаемой плотности растворителя, и молекулы растворителя заполняли собой без взаимопересечений и пересечений с атомами молекулы-мишени и молекулы-лиганда пространство как между молекулой-мишенью и м