Биологически активное соединение, содержащее кодирующий олигонуклеотид (варианты), способ его синтеза, библиотека соединений (варианты), способ ее синтеза и способ поиска соединения, связывающегося с биологической мишенью (варианты)

Иллюстрации

Показать все

Изобретение относится к области биологической химии и может быть использовано для определения соединений, связывающихся с биологической мишенью. Синтезируют соединение, содержащее функциональный компонент и кодирующий олигонуклеотид. Способ синтеза предусматривает присоединение к исходному функциональному компоненту дополнительного структурного фрагмента и ферментативное лигирование исходного олигонуклеотида с дополнительным олигонуклеотидом. Олигонуклеотид является двухцепочечным, связан с функциональным компонентом каждой своей цепью и определяет его структуру. Данный способ синтеза используют в способе получения библиотеки соединений, в которых структура функционального компонента определяется кодирующим олигонуклеотидом. Библиотеку соединений используют в способе поиска соединений, связывающихся с биологической мишенью. Изобретение позволяет расширить спектр химических реакций, используемых для конструирования молекул в присутствии химически немодифицированной олигонуклеотидной метки, с высокой точностью вводить олигонуклеотидные метки в химические структуры и получать библиотеки, содержащие множество копий каждого члена. 8 н. и 110 з.п. ф-лы, 13 ил., 7 табл., 10 пр.

Реферат

Область техники, к которой относится изобретение

Данное изобретение относится к области биологической химии, а именно к новому способу синтеза библиотек молекул, содержащих олигонуклеотидную метку. Данные библиотеки могут быть использованы для определения соединений, связывающихся с определенной биологической мишенью.

Уровень техники

Поиск более эффективных способов идентификации соединений, характеризующихся ценными биологическими свойствами, привел к развитию методов скриннинга огромного числа различных соединений, собранных в коллекциях, которые называются комбинаторными библиотеками. Такие библиотеки включают 105 или более различных соединений. Существует множество способов создания комбинаторных библиотек, а также описан комбинаторный синтез пептидов, пептидомиметиков и низкомолекулярных органических молекул.

Две основные проблемы при использовании комбинаторного подхода в создании лекарственных средств заключаются в синтезе библиотек достаточной сложности и в идентификации молекул, обладающих активностью, определенной различными методами анализа. Общеизвестно, что чем выше степень сложности библиотеки, т.е. число различных структур, включенных в библиотеку, тем выше вероятность наличия в библиотеке молекул, обладающих требуемой активностью. Следовательно, методы химического синтеза для создания библиотеки должны обеспечивать получение огромного числа соединений в пределах разумного промежутка времени. Однако с учетом данной "формальной" или общей концентрации, при увеличении числа различных членов в библиотеке снижается концентрация конкретного члена в библиотеке, что осложняет идентификацию активных молекул в библиотеках высокой сложности.

Один из подходов к преодолению таких недостатков заключается в создании кодированных библиотек, и, прежде всего, библиотек, в которых каждое соединение включает амплифицируемую метку. Такие библиотеки включают ДНК-кодированные библиотеки, в которых меченый фрагмент ДНК, идентифицирующий член библиотеки, можно амплифицировать с использованием методов молекулярной биологии, таких как полимеразная цепная реакция. Однако использование таких способов для получения библиотек, включающих огромное множество соединений, еще находится на стадии разработки и очевидно, что для реализации такого подхода при создании лекарственных средств существует необходимость в развитии усовершенствованных методов создания таких библиотек.

Раскрытие изобретения

В настоящем изобретении предлагается способ синтеза библиотек молекул, которые содержат кодирующую олигонуклеотидную метку. В данном способе используется стратегия "разделения и объединения", которая заключается в том, что раствор, содержащий инициатор, первый структурный фрагмент, связанный с кодирующим олигонуклеотидом, разделяют на множество фракций ("разделение"). В каждой фракции инициатор взаимодействует со вторым, уникальным, структурным фрагментом и вторым уникальным олигонуклеотидом, который идентифицирует второй структурный фрагмент. Эти реакции проводят одновременно или последовательно, и в случае последовательных реакций каждая реакция предшествует другой реакции. Димерные молекулы, образующиеся в каждой фракции, объединяют ("объединение") и затем снова разделяют на множество фракций. Каждая из таких фракций взаимодействует с третьим уникальным (специфичным для данной фракции) структурным фрагментом и третьим уникальным олигонуклеотидом, который кодирует фрагмент. Число специфичных молекул, присутствующих в полученной библиотеке, зависит (1) от числа различных фрагментов, использованных на каждой стадии синтеза, и (2) от числа стадий разделения и объединения фракций.

В одном варианте воплощения настоящего изобретения предлагается способ синтеза молекулы, содержащей или представляющей собой функциональный компонент, эффективно связанный с кодирующим олигонуклеотидом. Такой способ включает следующие стадии: (1) выбор соединения-инициатора, состоящего из функционального компонента, содержащего n структурных фрагментов (где n равно целому числу 1 или более), причем функциональный компонент содержит по меньшей мере одну реакционноспособную группу, и эффективно связана с исходным олигонуклеотидом; (2) взаимодействие соединения-инициатора со структурным фрагментом, содержащим по меньшей мере одну комплементарную реакционноспособную группу, которая является комплементарной в отношении реакционноспособной группы, описанной на стадии (1), в условиях, пригодных для взаимодействия реакционноспособной группы и комплементарной реакционноспособной группы с образованием ковалентной связи; (3) взаимодействие исходного олигонуклеотида с новым олигонуклеотидом, который идентифицирует структурный фрагмент, описанном на стадии (b) в присутствии фермента, который катализирует лигирование исходного олигонуклеотида и нового олигонуклеотида в условиях, пригодных для лигирования исходного олигонуклеотида и нового олигонуклеотида, с образованием молекулы, содержащей или представляющей собой функциональный компонент, включающий n+1 структурных фрагментов, которые эффективно связаны с кодирующим олигонуклеотидом. Если функциональная группа, описанная на стадии (3), содержит реакционноспособную группу, то стадии 1-3 при необходимости повторяют один или более раз, при этом проводят циклы 1-i (где i равно целому числу 2 или более) с использованием продукта, полученного на стадии (3) цикла s (где s равно целому числу 1 или менее), выполняющего функции соединения-инициатора в цикле s+1.

В одном варианте воплощения настоящего изобретения предлагается способ синтеза библиотеки соединений, в которой соединения содержат функциональный компонент, содержащий 2 или более структурных фрагментов, эффективно связанных с олигонуклеотидом, который идентифицирует структуру функционального компонента. Способ включает следующие стадии: (1) обеспечение раствора, включающего m соединений-инициаторов (где m равно целому числу 1 или более), причем соединения-инициаторы состоят из функционального компонента, содержащего n структурных фрагментов (где n равно целому числу 1 или более), которые эффективно связаны с исходным олигонуклеотидом, идентифицирующим n структурных фрагментов; (2) разделение раствора, полученного на стадии (2), на r фракций (где r равно целому числу 2 или более); (3) взаимодействие соединений-инициаторов в составе каждой фракции с одним из r структурных фрагментов с образованием r фракций, содержащих соединения, состоящие из функционального компонента, содержащего n+1 структурных фрагментов, который эффективно связан с исходным олигонуклеотидом; (4) взаимодействие исходного олигонуклеотида в составе каждой фракции с одним из набора r различных новых олигонуклеотидов в присутствии фермента, который катализирует лигирование нового и исходного олигонуклеотидов в условиях, пригодных для ферментативного лигирования нового и исходного олигонуклеотидов, с получением r аликвотных фракций, состоящих из функционального компонента, содержащего n+1 структурных фрагментов, эффективно связанной с удлиненным олигонуклеотидом, который кодирует n+1 структурных фрагментов. Способ необязательно включает стадию (5) рекомбинирования r фракций, полученных на стадии (4), с получением раствора, содержащего соединения, состоящие из функциональной группы, содержащей n+1 структурных фрагментов, и эффективно связанной с удлиненным олигонуклеотидом. Стадии (1)-(5) при необходимости повторяют один или более раз, при этом проводят циклы 1-i (где i равно целому числу 2 или более). В цикле s+1 (где s равно целому числу i-1 или менее), раствор, включающий m соединений-инициаторов, описанных на стадии (1), является раствором, описанным на стадии (5) цикла s. Аналогичным образом, соединения-инициаторы, описанные на стадии (1) цикла s+1, являются соединениями-инициаторами, описанными на стадии (5) цикла s.

В предпочтительном варианте, для конденсации структурных фрагментов на каждой стадии используют стандартные химические реакции. Фрагменты конденсируют с образованием линейных или разветвленных полимеров или олигомеров, таких как пептиды, пептидомиметики или пептоиды, или неолигомерные молекулы, такие как молекулы, включающие структуру-каркас, к которой присоединяют один или более дополнительных химических компонентов. Например, если структурные фрагменты представляют собой аминокислотные остатки, то их конденсируют с использованием стандартных методов пептидного синтеза, таких как синтез в растворе или твердофазный синтез, с использованием известных пригодных способов введения/удаления защитных групп. Предпочтительным способом для конденсирования структурных фрагментов является синтез в растворе. В качестве кодирующих олигонуклеотидов используют одноцепочечные или двухцепочечные олигонуклеотиды, предпочтительно двухцепочечные олигонуклеотиды. Кодирующие олигонуклеотиды предпочтительно включают от 4 до 12 оснований или пар оснований на один структурный фрагмент; кодирующие олигонуклеотиды конденсируют с использованием стандартных методов синтеза олигонуклеотидов в растворе или твердофазного синтеза, но предпочтительно конденсируют с использованием ферментативного синтеза в растворе. Например, олигонуклеотиды конденсируют с использованием топоизомеразы, лигазы или ДНК-полимеразы, если последовательность кодирующих олигонуклеотидов включает инициирующую последовательность для лигирования с одним из таких ферментов. Ферментативная конденсация кодирующих олигонуклеотидов характеризуется следующими преимуществами: (1) высокая точность присоединения по сравнению со стандартной (неферментативной) конденсацией и (2) использование более простого способа введения/удаления защитных групп.

В другом варианте в настоящем изобретении предлагаются соединения формулы I:

где Х означает функциональный компонент, содержащий один или более структурных фрагментов; Z означает олигонуклеотид, присоединенный через 3'-концевой участок к В; Y означает олигонуклеотид, который присоединен через 5'-концевой участок к С; А означает функциональную группу, ковалентно связанную с X; В означает функциональную группу, связанную с 3'-концевым участком фрагмента Z; С означает функциональную группу, связанную с 5'-концевым участком фрагмента Y; D, F и Е каждый независимо означает бифункциональную связующую группу, a S означает атом или молекулярный каркас. Такие соединения могут быть в синтезированы в том числе с использованием способов по настоящему изобретению.

Настоящее изобретение относится также к библиотеке соединений, содержащей соединения, содержащие функциональный компонент, содержащий два или более структурных фрагментов, и эффективно связанную с олигонуклеотидом, кодирующим структуру функционального компонента. Такие библиотеки включают от приблизительно 102 до приблизительно 1012 или более различных членов, например 102, 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012 или более различных членов, т.е. различных молекулярных структур. В одном варианте воплощения настоящего изобретения библиотека соединений содержит соединения, каждое из которых независимо означает соединение формулы I:

где Х означает функциональный компонент, содержащий один или более структурных фрагментов; Z означает олигонуклеотид, присоединенный через 3'-концевой участок к В; Y означает олигонуклеотид, присоединенный через 5'-концевой участок С; А означает функциональную группу, ковалентно связанную с X; В означает функциональную группу, связанную с 3'-концевым участком фрагмента Z; С означает функциональную группу, связанную с 5'-концевым участком фрагмента Y; D, F и Е каждый независимо означает бифункциональную связующую группу, a S означает атом или молекулярный каркас.Такие библиотеки могут быть синтезированы в том числе с использованием способов по настоящему изобретению.

В другом аспекте настоящего изобретения предлагается способ поиска (идентификации) соединения, которое связывается с биологической мишенью, при этом указанный способ включает следующие стадии: (1) контактирование биологической мишени с библиотекой соединений по настоящему изобретению, включающей соединения, которые содержат функциональный компонент, содержащий два или более фрагмента, и эффективно связанную с олигонуклеотидом, кодирующим структуру функционального компонента. Данную стадию проводят в условиях, пригодных для связывания по крайней мере одного члена библиотеки соединений с мишенью; (2) удаление членов библиотеки, которые не связаны с мишенью; (3) амплификация кодирующих олигонуклеотидов по меньшей мере одного члена библиотеки соединений, который связывается с мишенью; (4) секвенирование кодирующих олигонуклеотидов, описанных на стадии (3), и использование последовательностей, определенных на стадии (4), для определения структуры функциональных компонентов членов библиотеки соединений, которые связываются с биологической мишенью.

Настоящее изобретение демонстрирует несколько преимуществ идентификации молекул, обладающих требуемыми свойствами. Например, способы по настоящему изобретению обеспечивают использование ряда химических реакций для конструирования молекул в присутствии олигонуклеотидной метки. Способы по настоящему изобретению позволяют вводить с высокой точностью олигонуклеотидные метки в образующиеся таким образом химические структуры. Более того, указанные способы позволяют проводить синтез библиотек, содержащих множество копий каждого члена, что в свою очередь позволяет проводить множество циклов селекции в отношении биологической мишени и при этом остается достаточное число молекул, которые подвергаются конечному циклу амплификации и секвенирования олигонуклеотидной метки.

Краткое описание чертежей

На фиг.1 показана схема лигирования двухцепочечных нуклеотидов, причем исходный нуклеотид содержит выступающий участок, комплементарный выступающему участку нового олигонуклеотида. Исходная цепочка изображена в виде свободной, конъюгированной с аминогексильным линкером или конъюгированной с остатком фенилаланина через аминогексильный линкер.

На фиг.2 показана схема лигирования олигонкулеотидов с использованием фиксирующей цепочки. В данном варианте фиксирующей цепочкой является 12-членный олигонуклеотид с последовательностями, комплементарными одноцепочечному исходному олигонуклеотиду и одноцепочечному новому олигонуклеотиду.

На фиг.3 показана схема лигирования исходного и нового олигонуклеотидов, причем исходный олигонуклеотид содержит две ковалентно связанные цепочки, а новый олигонуклеотид является двухцепочечным.

На фиг.4 показана схема наращивания олигонуклеотидной цепочки с использованием полимеразы. Исходная цепочка изображена в виде свободной, конъюгированной с аминогексильным линкером или конъюгированной с остатком фенилаланина через аминогексильный линкер.

На фиг.5 показана схема синтетического цикла по одному из вариантов воплощения настоящего изобретения.

На фиг.6 показана схема многостадийного процесса идентификации с использованием библиотек по настоящему изобретению.

На фиг.7 показан результат гелевого электрофореза продуктов, полученных в каждом из циклов 1-5, описанных в примере 1, и последующего лигирования замыкающего праймера. Олигонуклеотиды со стандартной молекулярной массой указаны на дорожке 1, и указанные параметры гиперлэддера для определения количества ДНК показаны на дорожках 9-12.

На фиг.8 показана схема конденсации структурных фрагментов с использованием азид-алкин-циклоприсоединения.

На фиг.9 и 10 показана конденсация структурных фрагментов с использованием нуклеофильного ароматического замещения хлорированного триазина.

На фиг.11 показаны хлорированные гетероароматические структуры, пригодные для синтеза функциональных компонентов.

На фиг.12 показана циклизация линейного пептида с использованием реакции азид-алкин-циклоприсоединения.

На фиг.13а показана хроматограмма библиотеки, полученной, как описано в примере 2, в результате цикла 4.

На фиг.13б показан масс-спектр библиотеки, полученной, как описано в примере 2, в результате цикла 4.

Осуществление изобретения

Настоящее изобретение относится к способам получения соединений комбинаторных библиотек соединений, к соединениям и библиотекам, которые получают с использованием способов по настоящему изобретению, и к способам использования библиотек для идентификации соединений, обладающих требуемыми свойствами, такими как требуемая биологическая активность. Настоящее изобретение относится также к соединениям, которые идентифицируют с использованием таких способов.

Для получения и анализа комбинаторных химических библиотек используют множество подходов. Примеры включают способы, в которых отдельные члены библиотеки физически отделены друг от друга, например, если синтез отдельного соединения проводят в одном из множества отдельных сосудов. Однако обычно в таких библиотеках анализируют единовременно только одно соединение или в лучшем случае несколько соединений, и, следовательно, такой способ не является наиболее эффективным методом скриннинга. Согласно другим способам, соединения синтезируют на твердой фазе. Такие твердые носители включают чипы, в которых специфичные соединения занимают особые участки чипа или мембраны ("адресуемое положение"). Согласно другим способам, соединения синтезируют на гранулах, при этом каждая гранула несет отдельную химическую структуру.

При анализе больших библиотек возникают две проблемы: (1) множество отдельных соединений, которые подвергаются анализу, и (2) идентификация соединений, проявляющих активность при данном при данном методе анализа. Согласно одному способу, соединения, проявляющие активность при данном методе анализа, идентифицируют разделением исходной библиотеки на меньшие фракции и подфракции, в каждом случае отбирая фракцию или подфракцию, содержащую активные соединения, и затем снова разделяют на фракции до получения активной подфракции, которая содержит набор соединений, который достаточно мал, чтобы все его компоненты можно было синтезировать каждый в отдельности и получить соединения с требуемой активностью. Такой способ является слишком трудоемким и длительным процессом.

Другой способ обратного анализа комбинаторной библиотеки заключается в использовании библиотек, в которых члены библиотеки содержат индивидуальные метки, т.е. каждая метка, присутствующая в библиотеке, связана с конкретной структурой соединения, присутствующего в библиотеке, таким образом, что идентификация метки определяет структуру меченой молекулы. Один из подходов получения меченых библиотек заключается в использовании олигонуклеотидных меток, как описано, например, в патентах США №№5573905, 5708153, 5723598, 6060596, в опубликованных заявках на выдачу патентов РСТ WO 93/06121, WO 93/20242, WO 94/13623, WO 00/23458, WO 02/074929 и WO 02/103008, а также в работах Brenner and Lenner (Proc. Natl. Acad. Sci. USA, 89, 5381-5383 (1992); Nielsen and Janda (Methods: A Companion to Methods in Enzymology, 6, 361-371 (1994) и Nielesen, Brenner and Janda (J. Amer. Chem. Soc., 115, 9812-9813 (1993)), каждая из которых полностью включена в настоящее описание в качестве ссылки. Такие метки амплифицируют с использованием, например, полимеразной цепной реакции для получения большого числа копий меченого фрагмента и идентификации его при секвенировании. Секвенирование меченого фрагмента позволяет идентифицировать структуру связывающей молекулы, которая может быть синтезирована в чистой форме и протестирована. К настоящему времени данные по использованию методологии, описанной в статье Lerner et al., для получения больших библиотек отсутствуют. В настоящем изобретении предлагается усовершенствование способов получения ДНК-кодированных библиотек, а также первые примеры больших (105 членов и более) библиотек ДНК-кодированных молекул, в которых функциональный фрагмент получают с использованием синтеза в растворе. В настоящем изобретении предлагаются способы простого синтеза комбинаторных библиотек, кодированных олигонуклеотидами, причем указанные способы позволяют с высокой точностью вводить олигонуклеотидную метку в каждый член многочисленного набора молекул.

Способы по настоящему изобретению включают способы синтеза бифункциональных молекул, которые включают первый компонент ("функциональный компонент"), которая состоит из структурных фрагментов, и второй компонент, эффективно связанный с первым компонентом, содержащим олигонуклеотидную метку, которая определяет структуру первого компонента, т.е. олигонуклеотидная метка указывает, какие структурные фрагменты были использованы при конструировании первого компонента и в каком порядке они связаны. В основном, информации, содержащейся в олигонуклеодидной метке, оказывается достаточно для определения структурных фрагментов, использованных для конструирования активного компонента. В определенных вариантах последовательность олигонуклеотидной метки является достаточной для определения расположения структурных фрагментов в функциональном компоненте, например для пептидных групп достаточно аминокислотной последовательности.

Термин "функциональный компонент", использованный в данном контексте, означает химический компонент, содержащий один или более структурных фрагментов. Предпочтительно, структурные фрагменты в функциональных компонентах не означают нуклеиновые кислоты. Функциональным компонентом является линейный, разветвленный или циклический полимер, или олигомер, или низкомолекулярная органическая молекула.

Термин "структурный фрагмент", использованный в данном контексте, означает химическое структурное звено, которое соединено с другими химическими структурными звеньями или присоединено к другим таким звеньям. Если функциональный компонент является полимерным или олигомерным, то фрагменты являются мономерными звеньями полимера или олигомера. Структурные фрагменты включают также структуру-каркас ("каркасный структурный фрагмент"), к которому присоединена или может быть присоединена одна или более дополнительных структур ("периферические структурные фрагменты").

Следует понимать, что термин "структурный фрагмент", использованный в данном контексте, означает химическое структурное звено, которое входит в состав функционального компонента, а также находится в реакционноспособной форме, используемой для синтеза функционального компонента. Структурный фрагмент полностью включен в состав функционального компонента, и ни одна из частей структурного фрагмента не высвобождается при синтезе функционального компонента. Например, если в реакциях, идущих с образованием связи, высвобождается небольшая молекула (см. ниже), то в состав функционального компонента входит "остаток структурного фрагмента", т.е. остаток, который образуется в процессе синтеза при высвобождении из структурного фрагмента атомов, которые присоединяются к высвобожденной молекуле.

В качестве структурных фрагментов используют любые химические соединения, которые являются комплементарными, т.е. эти структурные фрагменты способны взаимодействовать друг с другом с образованием структуры, содержащей два или более таких фрагментов. Обычно все используемые фрагменты содержат по крайней мере 2 реакционноспособные группы, хотя некоторые фрагменты (например, последний структурный фрагмент олигомерного функционального компонента) могут содержать только по одной реакционноспособной группе. Реакционноспособные группы двух различных фрагментов должны быть комплементарными, т.е. способны взаимодействовать друг с другом с образованием ковалентной связи, необязательно с сопутствующим высвобождением небольшой молекулы, такой как вода, HCl, HF и т.п.

Согласно настоящему изобретению, две реакционноспособные группы являются комплементарными, если они способны взаимодействовать с образованием ковалентной связи. В предпочтительном варианте реакции с образованием связи протекают быстро в условиях окружающей среды в основном без образования побочных продуктов. Предпочтительно, одна реакционноспособная группа взаимодействует с другой комплементарной реакционноспособной группой только один раз. В одном варианте комплементарные реакционносособные группы двух структурных фрагментов взаимодействуют, например, по механизму нуклеофильного замещения с образованием ковалентной связи. В другом варианте один член пары комплементарных реакционноспособных групп является электрофильной группой, а другой член пары - нуклеофильной группой.

Комплементарные электрофильные и нуклеофильные группы включают любые две группы, которые взаимодействуют по механизму нуклеофильного замещения в пригодных условиях с образованием ковалентной связи. В данной области техники известно множество образующих связь реакций. См., например, March, Advanced Organic Chemistry, 4th ed., New York: John Wiley and Sons (1992), гл. 10-16; Carey and Sundberg, Advanced Organic Chemistry, Part B, Plenum (1990), гл. 1-11; Collman et al., Principles and Applications of Organotransition Metal Chemistry, University Science Books, Mill Valley, Calif. (1987), гл. 13-20, каждая из которых полностью включена в настоящее описание в виде ссылки. Примеры пригодных электрофильных групп включают реакционноспособные карбонильные группы, такие как хлорангидридные группы, сложноэфирные группы, включая карбонилпентафторфенильные эфирные группы и сукцинимидные эфирные группы, кето- и альдегидные группы, реакционноспособные сульфонильные группы, такие как сульфонилхлоридные группы и реакционноспособные фосфонильные группы. Другие электрофильные группы включают концевые эпоксидные группы, изоцианатные группы и галогеналкил группы. Пригодные нуклеофильные группы включают первичные и вторичные аминогруппы, гидроксильные группы и карбоксильные группы.

Пригодные комплементарные реакционноспособные группы перечислены ниже. Специалистам в данной области техники известны другие пары реакционноспособных групп, которые можно использовать в настоящем изобретении, а приведенные ниже примеры не ограничивают объем настоящего изобретения.

В первом варианте комплементарные реакционноспособные группы включают активированные карбоксильные группы, реакционоспособные сульфонильные группы или реакционноспособные фосфонильные группы, или комбинацию указанных выше групп, и первичные или вторичные аминогруппы. В данном варианте комплементарные реакционоспособные группы взаимодействуют в пригодных условиях с образованием амидной, сульфонамидной или фосфонамидатной связи.

Во втором варианте воплощения настоящего изобретения комплементарные реакционноспособные группы включают эпоксидные группы и первичные или вторичные аминогруппы. Эпоксидсодержащий структурный фрагмент взаимодействует с аминосодержащим фрагментом в пригодных условиях с образованием связи углерод-азот, т.е. с образованием β-аминоспирта.

В другом варианте комплементарные реакционноспособные группы включают азиридиновые группы и первичные или вторичные аминогруппы. В пригодных условиях азиридинсодержащий структурный фрагмент взаимодействует с аминосодержащим фрагментом с образованием связи углерод-азот, т.е. с образованием 1,2-диамина. В третьем варианте комплементарные реакционноспособные группы включают изоцианатные группы и первичные или вторичные аминогруппы. Изоцианатсодержащий структурный фрагмент взаимодействует с аминосодержащим фрагментом в пригодных условиях с образованием связи углерод-азот, т.е. с образованием остатка мочевины.

В четвертом варианте комплементарные реакционноспособные группы включают изоцианатные группы и гидроксильные группы. Изоцианатсодержащий структурный фрагмент взаимодействует с гидроксилсодержащим фрагментом в пригодных условиях с образованием связи углерод-кислород, т.е. с образованием карбаматной группы.

В пятом варианте комплементарные реакционноспособные группы включают аминогруппы и карбонилсодержащие группы, такие, как альдегиды или кето-группы. Амины взаимодействуют с такими группами по реакции восстановительного аминирования с образованием новой связи углерод-азот.

В шестом варианте комплементарные реакционноспособные группы включают фосфорилидные группы и альдегиды или кетогруппы. Фосфорилидсодержащий структурный фрагмент взаимодействует с альдегид- или кетосодержащим фрагментом в пригодных условиях с образованием углерод-углеродной двойной связи, т.е. с образованием алкена.

В седьмом варианте комплементарные реакционноспособные группы взаимодействуют по механизму циклоприсоединения с образованием циклической структуры. Один пример таких комплементарных реакционноспособных групп включает алкины и органические азиды, которые в пригодных условиях взаимодействуют с образованием триазольной кольцевой структуры. Пример использования такой реакции для связывания двух фрагментов показан на фиг.8. Пригодные условия для проведения таких реакций известны в данной области техники и включают условия, описанные в заявке WO 03/101972, содержание которой полностью включено в настоящее описание в качестве ссылки.

В восьмом варианте комплементарные реакционноспособные группы включают алкилгалогениды и нуклеофилы, такие как аминогруппа, гидроксигруппа или карбоксильная группа. Такие группы взаимодействуют в пригодных условиях с образованием связи углерод-азот (акилгалогенид + амин) или связи углерод-кислородной (алкилгалогенид + гидроксильная или карбоксильная группа).

В девятом варианте комплементарные реакционноспособные группы включают галогенированную гетероароматическую группу и нуклеофил, и фрагменты связываются в пригодных условиях по реакции ароматического нуклеофильного замещения. Пригодные галогенированные гетероароматические группы включают хлорированные пиримидины, триазины и пурины, которые взаимодействуют с нуклеофилами, такими как амины, в мягких условиях в водном растворе. Примеры реакции олигонуклеотидов, содержащих трихлортриазиновые группы с аминами, показаны на фиг.9 и 10. Примеры пригодных хлорированных гетероароматических групп показаны на фиг.11.

Следует понимать, что синтез функционального фрагмента можно проводить с использованием одного конкретного типа реакций конденсации, таких как, без ограничения перечисленным, одна из описанных выше реакций, или с использованием комбинации двух или более реакций конденсации, например двух или более описанных выше реакций. Например, в одном варианте структурные фрагменты соединяют путем сочетания образования амидной связи (комплементарные амино- и карбоксильные группы) и восстановительного аминирования (комплементарные амино- и альдегидные или кетогруппы). Можно использовать любые реакции конденсации при условии, что они совместимы с присутствием олигонуклеотида. Двухцепочечные (дуплексные) олигонуклеотидные метки, использованные в определенных вариантах воплощения настоящего изобретения, являются химически более стабильными по сравнению с одноцепочечными метками, и, следовательно, устойчивы в более широком интервале условий реакции и участвуют в реакциях с образованием связи, что невозможно с использованием одноцепочечных меток.

Структурный фрагмент кроме реакционноспособной группы или групп, образующих функциональный компонент, может включать одну или более функциональных групп. Одну или более из таких дополнительных функциональных групп защищают для предотвращения их вступления в нежелательные реакции. Пригодные защитные группы известны в данной области техники для множества функциональных групп (см. книгу Greene and Wuts, Protective Groups in Organic Synthesys, second edition, New York: John Wiley and Sons (1991), включенную в данный контекст в качестве ссылки). Прежде всего используемые защитные группы включают трет-бутиловые простые и сложные эфиры, ацетали, тритильные эфиры и амины, ацетиловые эфиры, триметилсилиловые эфиры, трихлорэтиловые простые и сложные эфиры и карбаматы.

В одном варианте каждый структурный фрагмент включает две реакционноспособные группы, которые могут быть одинаковыми или отличаться друг от друга. Например, каждый структурный фрагмент, добавляемый в цикле s, может включать две одинаковые реакционноспособные группы, но при этом обе группы являются комплементарными с реакционноспособными группами структурных фрагментов, добавляемых на стадиях s-1 и s+1. В другом варианте каждый структурный фрагмент включает две реакционноспособные группы, которые комплементарны друг с другом. Например, библиотеку, содержащую полиамидные молекулы, получают по реакциям между структурными фрагментами, содержащими две первичные аминогруппы, и фрагментами, содержащими две активированные карбоксильные группы. В полученных соединениях отсутствуют N- или С-концевые фрагменты, т.к. альтернативные амидные группы имеют противоположное направление. В другом варианте полиамидную библиотеку получают с использованием структурных фрагментов, каждый из которых включает аминогруппу и активированную карбоксильную группу. В таком варианте структурные фрагменты, добавляемые на стадии n-го цикла, содержат свободную реакционноспособную группу, которая комплементарна с доступной реакционноспособной группой в составе фрагмента n-1, в то время как, предпочтительно, другая реакционноспособная группа в составе структурного фрагмента n защищена. Например, если члены библиотеки синтезируют в направлении от С-концевого участка к N-концевому участку, то добавляемые структурные фрагменты содержат активированную карбоксильную группу и защищенную аминогруппу.

Функциональные компоненты являются полимерными или олигомерными компонентами, такими как пептиды, пептидомиметики, пептидонуклеиновые кислоты или пептоиды, или они являются низкомолекулярными соединениями, например молекулами со структурой, включающей центральный каркас, и структурами, расположенными по периферии каркаса. Линейные полимерные или олигомерные библиотеки получают с использованием структурных фрагментов с двумя реакционноспособными группами, в то время как разветвленные полимерные или олигомерные библиотеки получают с использованием структурных фрагментов с тремя или более реакционноспособными группами, необязательно в комбинации с фрагментами, содержащими только две реакционноспособные группы. Такие молекулы можно представить общей формулой Х1Х2…Хn, где каждый Х означает мономерное звено полимера, включающего n мономерных звеньев, где n равно целому числу более 1. В случае олигомерных или полимерных соединений нет необходимости в наличии двух функциональных групп на концевых фрагментах. Например, в случае полиамидной библиотеки С-концевой фрагмент содержит аминогруппу, а присутствие карбоксильной группы необязательно. Аналогичным образом, N-концевой фрагмент содержит карбоксильную группу, но не содержит аминогруппу.

Разветвленные олигомерные или полимерные соединения синтезируют также при условии, что по крайней мере один структурный фрагмент включает три функциональные группы, которые взаимодействуют с другими структурными фрагментами. Библиотека по настоящему изобретению включает линейные молекулы, разветвленные молекулы или их комбинацию.

Библиотеки получают также с использованием, например, каркасных фрагментов с одной или двумя реакционноспособными группами, в комбинации с другими структурными фрагментами, содержащими только одну доступную реакционноспособную группу, например, в которых любые другие реакционноспособные группы защищены или нереакционноспособны в отношении других реакционноспособных групп в составе каркасного фрагмента. В одном варианте, например, полученные молекулы могут быть представлены общей формулой X(Y)n, где Х означает каркасный структурный фрагмент, каждый Y означает структурный фрагмент, связанный с X, а n равно целому числу, равному по крайней мере 2, и предпочтительно от 2 до приблизительно 6. В одном предпочтительном варианте исходный фрагмент в цик