Адаптированная рекомбиназа для рекомбинации асимметричных участков-мишеней во множестве штаммов ретровирусов

Иллюстрации

Показать все

Изобретения касаются способа приготовления экспрессионного вектора, кодирующего адаптированную рекомбиназу, которая способна к рекомбинации асимметричных последовательностей-мишеней в пределах длинного концевого повтора (LTR) провирусной ДНК множества штаммов ВИЧ-1, встроенных в геном клетки-хозяина, а также к полученному экспрессионному вектору, клетке, трансфецированной этим вектором, экспрессированной рекомбиназе и фармацевтической композиции, включающей экспрессионный вектор, клетку и/или рекомбиназу. Представленные изобретения могут быть использованы при лечении или профилактике инфекции ВИЧ-1 у субъекта. 6 н и 22 з.п.ф-лы, 5 ил., 2 пр.

Реферат

Настоящее изобретение относится к способу приготовления экспрессионного вектора, кодирующего адаптированную рекомбиназу, которая способна к рекомбинации асимметричных последовательностей-мишеней внутри длинного концевого повтора (LTR) провирусной ДНК множества штаммов ретровирусов, которая может быть встроена в геном клетки-хозяина, а также к полученному экспрессионному вектору, клеткам, трансфицированным этим, экспрессированной рекомбиназе и фармацевтическим композициям, включающим в экспрессионный вектор, клетки и/или рекомбиназу. Фармацевтические композиции полезны, например, при лечении и/или профилактике ретровирусной инфекции. В частности, раскрыты асимметричные последовательности-мишени, присутствующие во множестве штаммов ВИЧ-1, а также адаптированные рекомбиназы, способные комбинировать эти последовательности (Tre 3.0 и 4.0), и кодирующие их экспрессионные векторы.

ТЕХНИЧЕСКИЕ ПРЕДПОСЫЛКИ

Ретровирусные инфекции, такие как, например, инфекции вирусом иммунодефицита человека (ВИЧ), по-прежнему являются одними из важнейших и наиболее распространенных заболеваний человека.

Один из подходов к лечению ретровируса, например, ВИЧ, является нацеливание на провирус, встроенный в геном клетки-хозяина. Эксцизия провирусной ДНК из генома хозяина, например, могла бы предотвратить дальнейшую репликацию ВИЧ, и отличается от общепринятых методик тем, что она позволяет искоренить даже неактивные вирусы, присутствующие в геноме хозяина.

Один класс белков, который рассматривался для использования в этом альтернативном подходе, представляют собой сайт-специфические рекомбиназы (Flowers et al, 1997). Сайт-специфические рекомбиназы опосредуют множество функций в природе, от перестановки генов до геномной сегрегации, таких как, например, эксцизия, инверсия или интеграция определенных элементов ДНК (обзор в STARK et al, 1992).

Одной из самых простых и наиболее изученных рекомбиназ является рекомбиназа Cre бактериофага P1, которая разделяет геномные димеры до мономеров путем рекомбинации между двумя идентичными участками двухцепочечной ДНК определенной последовательности (Hoess & Abremski, 1985). Рекомбиназа Cre нашла широкое применение в генетике мыши (Nagy, 2000). Cre представляет собой белок размером 38 кДа, который был назван по его функции, поскольку он вызывает рекомбинацию (Sternberg & Hamilton, 1981). Предпосылкой для этой рекомбинации является выравнивание двух участков рекомбинации, распознаваемых Cre в антипараллельной ориентации, которые затем связываются четырьмя идентичными субъединицами Cre, соединяющимися с образованием кольца, в котором каждая субъединица контактирует с двумя соседними субъединицами и одной половиной участка одного участка рекомбинации (Hoess & Abremski, 1985). Участок рекомбинации, узнаваемый Cre, представляет собой последовательность двухцепочечной ДНК длиной 34 п.н., известную как loxP (от locus of crossing over (x), P1; Sternberg & Hamilton, 1981), которая является палиндромной, за исключением восьми его самых внутренних пар оснований (называемых спейсером), которые придают направление на участок.

Некоторые системы сайт-специфической рекомбинации, в том числе система Cre/loxP, функционируют без вспомогательных белков или кофакторов и функционируют в широком диапазоне состояний клетки. Однако, поскольку сайт-специфические рекомбиназы функционируют с помощью специфических взаимодействий субъединиц реконбиназного фермента с узнаваемыми ими последовательностями ДНК-мишенями, использование этих ферментов ограничено требованием, что области ДНК-мишени должны содержать соответствующим образом расположенные участки-мишени (Lewandoski, 2001). До настоящего времени, не выявлена рекомбиназа дикого типа, которая узнает нативные ретровирусные последовательности как их последовательности ДНК-мишени.

В последние годы были проведены обширные мутационные и структурные анализы сайт-специфических рекомбиназ, чтобы изменить их свойства и добиться лучшего понимания сложных механизмов этих ферментов (в качестве обзора см. van Duyne, 2001; и Coates et al., 2005). Много исследований было сфокусировано на рекомбиназе Cre, чтобы изучить ее способность к развитию. Несколько исследований показало, что специфичность Cre к мишени может изменяться в случае, когда были изменены несколько нуклеотидов в ее участке узнавания loxP (Buchholz & Stewart, 2001; Santoro & Schultz, 2002; Rufer & Sauer, 2002). Дальнейшие исследования направлены на конструирование мутантных участков-мишеней loxP, содержащих последовательности из LTR ВИЧ-1 для разработки возможных участков-мишеней для использования Cre в качестве противовирусной стратегии (Lee & Park, 1998; Lee et al, 2000).

Способ направленной эволюции является мощным способом отбора ферментов с модифицированными специфичностями (обобщено в Yuan et al., 2005; и Johannes & Zhao, 2006). Вначале этот способ был использован для изоляции улучшенных ферментов на основе РНК путем отбора молекул РНК с модифицированными субстратными участками. Применение способов на основе ПЦР позволяет проводить скрининг очень больших библиотек и отбирать удачные кодирующие области из числа кандидатов. В направленной эволюции белков, напротив, проведение скрининга и отбор улучшенных мутантов, которые идентифицируются путем изменений в свойствах белка, требует способа определения последовательности нуклеиновых кислот, кодирующей белок. Связь между белком и его кодирующей последовательностью часто поддерживалась компартментализацией. Соответственно, скрининг библиотек при направленной белковой эволюции был ограничен «последовательными» подходами, которые сохраняют компартменты, и преимущества, связанные со скринингом пулов кандидатов, не были достигнуты.

Это ограничение удалось преодолеть путем разработки способов, которые позволяют сшивать белки с соответствующими им матричными РНК (мРНК) с помощью слияний мРНК-белок и рибосомного дисплея. Поэтому функциональные скрининги для улучшения белковых свойств были связаны с прямым поиском соответствующих кодирующих молекул, и большой пул был скринирован in vitro (см., например, Buchholz et al, 1998). Дальнейшее улучшение направленной белковой эволюции было достигнуто при помощи так называемой субстрат-связанной белковой эволюции (SLiPE; Buchholz & Stewart, 2001), где субстрат рекомбиназы помещали на ту же молекулу ДНК, что и кодирующую белок область. Таким образом, когда рекомбиназу экспрессировали в компартменте, его действие изменяло ДНК-субстрат, следующий за его собственной кодирующей областью. Следовательно, библиотеку можно скринировать в качестве пула с помощью ПЦР, чтобы амплифицировать только кандидатные кодирующие области, которые находились рядом с модифицированным субстратом. Это позволяет удобно скринировать большие библиотеки для быстрого поиска удачных кодирующих областей. Этот способ был применен для изменения ДНК-специфичности рекомбиназы Cre и ее адаптации к новому узнаваемому участку-мишени (Buchholz & Stewart, 2001).

Принимая во внимание потенциал сайт-специфических рекомбиназ и необходимость поиска терапии против СПИДа, позволяющей искоренять провирус ВИЧ-1 из генома клетки-хозяина, WO 2008/083931 раскрыл образование адаптированной рекомбиназы (TRE), которая способна к рекомбинации асимметричных участков-мишеней внутри LTR провирусной ДНК ретровируса, встроенного в геном клетки-хозяина, тем самым удаляя провирус из генома клетки-хозяина. Сконструированная рекомбиназа Tre, раскрытая в примерах, узнает специфический loxP-подобный участок, присутствующий в определенном штамме ВИЧ-1. WO 2008/083931 принимает во внимание, что в связи с высокой вариабельностью последовательности ретровирусов, в частности ВИЧ, для лечения пациента с отличным штаммом ВИЧ, возможно, должна быть адаптирована отличная адаптированная рекомбиназа или коллекция подготовленных рекомбиназ, содержащих адаптированные рекомбиназы, специфические для множества последовательностей-мишеней.

В свете этого, авторы изобретения сейчас рассматривают проблему предоставления адаптированной рекомбиназы, способной удалять множество ретровирусов, например, штаммы ВИЧ. Соответственно, созданная рекомбиназа может быть использована для множества ВИЧ-инфекций, без образования новых рекомбиназ для каждого штамма. Эта проблема решена настоящим изобретением.

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Авторы настоящего изобретения впервые предоставляют способ создания экспрессионного вектора, кодирующего рекомбиназу, способную к рекомбинации асимметричных последовательностей-мишеней внутри LTR провирусной ДНК множества ретровирусных штаммов одного вида, встроенных в геном клетки-хозяина. Рекомбиназы были адаптированы, чтобы узнавать асимметричные участки-мишени, отличающиеся от их нативных симметричных участков-мишеней, путем разбиения субстрата на ряд новых подгрупп с меньшими отличиями от первоначальной мишени, и постепенной адаптации рекомбиназ для узнавания этих подгрупп (WO 2008/083931). Комбинаторный подход позволяет отбирать функциональные молекулы, узнающие асимметричный участок-мишень внутри заданной последовательности. Таким образом, используя подход прохождения через субстратные интермедиаты во время направленной молекулярной эволюции, можно продуцировать ферменты с отличными новыми специфичностями к асимметричным мишеням. В настоящем изобретении такой подход используется в вопросе предоставления адаптированных рекомбиназ, способных к рекомбинации множества ретровирусных штаммов, предпочтительно, штаммов одного вида. Авторы обнаружили, что, несмотря на высокую вариабельность последовательностей ретровирусов, можно идентифицировать асимметричные последовательности-мишени, присутствующие в большей части вирусов определенного подтипа.

Изобретение предоставляет способ приготовления экспрессионного вектора, кодирующего адаптированную рекомбиназу, которая способна к рекомбинации асимметричных последовательностей-мишеней внутри LTR провирусных ДНК множества ретровирусных штаммов, которые могут быть встроены в геном клетки-хозяина, включающий стадии идентификации в последовательности LTR провирусной ДНК множества последовательностей ретровирусных штаммов с гомологий, по крайней мере, 30% к последовательности левой половины участка и последовательности правой половины участка, по крайней мере, одного известного рекомбиназного участка-мишени, где гомологичные последовательности разделены спейсером в 5-12 нуклеотидов, и где асимметричная последовательность-мишень обнаруживается во множестве ретровирусных штаммов; и генерация, путем повторяющихся стадий:

i) молекулярной направленной эволюции, по крайней мере, на одной рекомбиназе, узнающей известный гомологичный участок-мишень, с использованием в качестве субстрата модифицированных последовательностей-мишеней, основанных на последовательности асимметричной последовательности-мишени, но модифицированных так, чтобы содержать лишь ограниченное число вариаций известной последовательности-мишени, где, в каждом раунде, последовательность-мишень может отличаться от последовательности-мишени, на которую, как известно, действует рекомбиназа, на один, два или три нуклеотида; и

ii) перетасовки библиотек рекомбиназ для получения рекомбиназных библиотек, способных к рекомбинации последовательностей-мишеней, более гомологичных асимметричной последовательности-мишени;

до тех пор, пока не получится, по крайней мере, одна рекомбиназа, которая действует на асимметричную последовательность-мишень внутри LTR ретровирусной ДНК; выделение нуклеиновой кислоты, в меньшей мере, одной полученной рекомбиназы, и клонирование нуклеиновой кислоты, кодирующей рекомбиназу, в подходящем экспрессионном векторе.

Способ создания адаптированной рекомбиназы, раскрытый в WO 2008/083931, можно применять для создания адаптированной рекомбиназы, способной к рекомбинации асимметричной последовательности-мишени.

Изобретение также предоставляет способ приготовления экспрессионного вектора, кодирующего адаптированную рекомбиназу, которая способна к рекомбинации асимметричных последовательностей-мишеней внутри LTR провирусной ДНК множества ретровирусных штаммов, которые могут быть встроены в геном клетки-хозяина, включающий стадии

a) идентификация в последовательности LTR провирусной ДНК множества ретровирусных штаммов последовательностей с гомологий, по крайней мере, 30% к последовательности левой половины участка и последовательности правой половины участка, по крайней мере, одного известного рекомбиназного участка-мишени, где гомологичные последовательности разделены спейсером в 5-12 нуклеотидов, и где асимметричная последовательность-мишень обнаруживается в множестве ретровирусных штаммов;

(b) идентификация двух последовательностей, где первая последовательность соответствует последовательности асимметричной последовательности-мишени со стадии (а), гомологичной левой половине участка указанного известного участка-мишени, и называется «последовательность половины участка 1», и где вторая последовательность соответствует последовательности асимметричной последовательности-мишени со стадии (а), гомологичной правой половине участка, и называется «последовательность половины участка 2»;

(c) определение нуклеотидов внутри последовательности со стадии (b), отклоняющихся от соответствующих гомологичных последовательностей левой половины участка и правой половины участка известного гомологичного участка-мишени со стадии (a);

(d) создание первой подгруппы двух нуклеиновых кислот-мишеней, содержащих последовательности-мишени, где первая последовательность-мишень обозначена подгруппой 1 и включает в себя, рядом друг с другом и в направлении от 5’ к 3’, последовательность половины участка 1 со стадии (b), спейсерную последовательность асимметричной последовательности-мишени и инвертированный повтор последовательности половины участка 1, и где вторая последовательность-мишень обозначена подгруппой 2 и включает в себя, рядом друг с другом и в направлении от 5’ к 3’, последовательность половины участка 2, спейсерную последовательность асимметричной последовательности-мишени и последовательность половины участка 2 со стадии (b);

(е) создание второй подгруппы нуклеиновых кислот-мишеней, содержащих модифицированные последовательности-мишени на основе последовательностей-мишеней в первой подгруппе со стадии (d),

где, в последовательностях на основе подучастка 1, в последовательности левой половины участка, часть нуклеотидов, отклоняющихся от соответствующей гомологичной последовательности половины участка, по крайней мере, одного известного участка-мишени со стадии (а) заменяли нативными нуклеотидами, встречавшимися в указанном известном участке-мишени, до тех пор, пока указанная последовательность половины участка содержит один, два или три нуклеотида, отклоняющихся от указанного известного участка-мишени, где правая половина участка указанной модифицированной последовательности мишени формируется при помощи инвертированного повтора указанной модифицированной последовательности левой половины участка, которая отделена от указанной модифицированной последовательности левой половины участка при помощи спейсерной последовательности асимметричной последовательности-мишени, и

где, в последовательностях на основе подучастка 2, в последовательности правой половины участка, часть нуклеотидов, отклоняющихся от соответствующей гомологичной последовательности половины участка, по крайней мере, одного известного участка-мишени со стадии (а) заменяют нативными нуклеотидами, встречавшимися в указанном известном участке-мишени, до тех пор указанная последовательность половины участка содержит один, два или три нуклеотида, отклоняющихся от указанного известного участка-мишени, где левая половина участка указанной модифицированной последовательности-мишени формируется при помощи инвертированного повтора указанной модифицированной последовательности правой половины участка, которая отделена от указанной модифицированной последовательности правой половины участка при помощи спейсерной последовательности асимметричной последовательности-мишени,

так что во всех модифицированных последовательностях половин участка, происходящих из одной последовательности-мишени первой подгруппы со стадии (d), вместе взятых, можно обнаружить все отклоняющиеся нуклеотиды, принимая во внимание, что ни одна из указанных модифицированных последовательностей половин участка на всем протяжении не содержит все отклоняющиеся нуклеотиды,

(f) отдельно применение молекулярной направленной эволюции, по крайней мере, на одной рекомбиназе, узнающей известный гомологичный участок-мишень в соответствии со стадией (а), с использованием каждой нуклеиновой кислоты второй подгруппы, полученной на стадии (e), в качестве субстрата;

(g) перетасовывание рекомбиназных библиотек, образованных на стадии (f), где все рекомбиназные библиотеки, образованные на последовательностях на основе подучастка 1, объединяют и перетасовывают, и где все рекомбиназные библиотеки, образованные на последовательностях на основе подучастка 2, объединяют и перетасовывают;

(h) применение молекулярной направленной эволюции на перетасованных библиотеках, полученных на стадии (g), с использованием каждой нуклеиновой кислоты подгруппы в соответствии со стадией (d) в качестве субстрата;

(i) перетасовка рекомбиназных библиотек, образованных на стадии (h);

(j) применение молекулярной направленной эволюции на перетасованных библиотеках, полученных на стадии (g), с использованием нуклеиновой кислоты, содержащей асимметричную последовательность-мишень со стадии (а), в качестве субстрата, пока не получится, по крайней мере, одна рекомбиназа, которая действует на асимметричную последовательность-мишени внутри LTR ретровирусной ДНК со стадии (a);

(k) выделение нуклеиновой кислоты, в меньшей мере, одной рекомбиназы, полученной на стадии (j) из библиотеки; и

(l) клонирование нуклеиновой кислоты, полученной на стадии (k), в подходящем экспрессионном векторе.

На стадии (a) способа по настоящему изобретению последовательность LTR провирусной ДНК можно определить, например, путем секвенирования ДНК с использованием концевых ингибиторов (Sanger et al., 1977). Однако в случае, если последовательность LTR ретровирусной ДНК, встроенной в геном хозяина, уже была определена, последовательность может быть определена путем обращения к базе данных. На основе информации о последовательности выполняется компьютерный анализ информации о последовательности, чтобы определить в ней последовательности с гомологией, по крайней мере, 30% к последовательностям левой половины участка и правой половины участка известных участков-мишеней, соответственно, известных рекомбиназ, которые разделены подходящим спейсером из 5-12 нуклеотидов, где асимметричная последовательность-мишень обнаруживается во множестве ретровирусных штаммов. Предпочтительно, гомология с последовательностями левой половины участка и правой половины участка известных участков-мишеней составляет не менее 40% или, по крайней мере, 50%. Предпочтительно, чтобы эти ретровирусные штаммы относились к одному виду или одному подтипу этого. Предпочтительно, множество штаммов составляет более 10 штаммов, более предпочтительно, более 100 штаммов, более 130 штаммов, более 200 штаммов или более чем 300 штаммов, например, штаммов ВИЧ. Штаммы могут относиться к одному подтипу вируса, например, ВИЧ-1, ВИЧ-1 подтипа A и B или ВИЧ-1 подтипа В. Таким образом, полученная рекомбиназа или кодирующий ее экспрессионный вектор могут быть использованы для лечения инфекции множеством штаммов, например, более, чем 50%, более чем 70%, более чем 80%, более чем 90% или всеми известными штаммами ретровируса или подтипом этого.

Термин «рекомбиназа», используемый в настоящем документе, относится к белку, участвующему в рекомбинации. Как таковые, рекомбиназы распознают и связывают две специфические последовательности ДНК, называемые «участки рекомбинации» или «участки-мишени», и опосредуют рекомбинацию между этими двумя участками-мишенями. Соответственно, термин «рекомбиназа» относится к любому белковому компоненту любой системы рекомбинации, который опосредует перестройки ДНК в специфическом ДНК-локусе. Существующие в природе рекомбиназы узнают симметричные участки-мишени, состоящие из двух идентичных последовательностей, называемых «половина участка», размером примерно в 9-20 п.н., образующих инвертированный повтор, где последовательности половин участка разделены спейсерной последовательностью в 5-12 п.н. Рекомбиназы из семейства тирозиновых интеграз характеризуются наличием тирозина в качестве нуклеофила активного участка, который используется для расщепления ДНК, тогда как рекомбиназы из семейства сериновых интеграз используют серин вместо тирозина.

В одном варианте осуществления настоящего изобретения, по крайней мере, одна известная рекомбиназа, чья последовательность-мишень используется на стадии (a) и в отношении которой применяется молекулярная направленная эволюция на стадиях (h) и (j), принадлежит к семейству сериновых интеграз. Предпочтительные рекомбиназы, принадлежащие семейству сериновых интеграз, выбирают из группы, состоящей из интегразы phiC31 (COMBES et al., 2002), любого компонента систем рекомбинации Gin или Hin, Tn3-резолвазы (Krasnow & Cozzarelli, 1983) или любого другого члена больших сериновых рекомбиназ, Rag1 Rag2 или любого другого компонента системы рекомбинации VDJ или вариантов этого.

В другом варианте осуществления, указанная рекомбиназа принадлежит к семейству тирозиновых интеграз. Предпочтительные рекомбиназы, принадлежащие семейству тирозиновых интеграз, выбирают из группы, состоящей из Cre фага P1 (Abremski et al., 1983, 1984), рекомбиназы FLP дрожжей (Volkert & Broach, 1986), Dre фага D6 (Sauer & McDermott, 2004), рекомбиназы R плазмиды pSR1 Zygosaccharomyces rouxii, рекомбиназы А плазмиды pKD1 Kluveromyces drosophilarium, рекомбиназы плазмиды pKW1 Kluveromyces waltii, Tnp1 транспозона Tn4430 Bacillus, любого компонента системы рекомбинации λ Int или вариантов этого. Предпочтительно, указанная рекомбиназа представляет собой рекомбиназу Cre или вариант этого. Например, можно использовать адаптированную рекомбиназу, раскрытую в WO 2008/083931 (Tre).

Термин «вариант» в данном контексте относится к белкам, которые образованы из вышеуказанных белков путем удаления, замены и/или добавления аминокислот и которые сохраняют некоторые или все функции, присущие белку, из которого они образованы.

В предпочтительном варианте осуществления, известная рекомбиназа представляет собой химерную рекомбиназу, полученную, например, «перетасовкой семейства», как описано в Crameri et al. (1998). Предпосылкой применения перетасовки семейства является значительная гомология между рекомбиназами, использованными для образования химерных рекомбиназ. Пример химерной рекомбиназы, который можно использовать в настоящем изобретении, представляет собой химерную рекомбиназу, состоящую из последовательностей рекомбиназы Cre и рекомбиназы Dre, соответственно.

В более предпочтительном варианте осуществления рекомбиназа представляет собой рекомбиназу Cre, узнающую симметричный участок-мишень в 34 п.н., известный как loxP (SEQ ID NO:3). Участок loxP (а также другие участки рекомбинации рекомбиназ дикого типа) представляет собой палиндром с двумя повторами по 13 п.н., разделенных при помощи восьми расположенных внутри пар оснований, которые представляют так называемый спейсер, который придает направленность участку. Рекомбинация происходит путем расщепления внутри спейсерной последовательности. В зависимости от относительного расположения и ориентации двух участвующих loxP-участков, Cre катализирует интеграцию, эксцизию или перестройку ДНК (Hoess & Abremski, 1985).

Одной из полезных рекомбиназ является Zre (SEQ ID NO:26), выделенная из Salmonella enterica, или варианты, фрагменты и гомологи этого, например, имеющие гомологию, по крайней мере, около 70%, по крайней мере, около 80%, по крайней мере, около 90% или, по крайней мере, около 95% с последовательностью дикого типа, и обладающие рекомбиназной функцией. Рекомбиназы Zre обеспечивают рекомбинацию ДНК по участкам zox (Фиг. 1). Они могут быть использованы на начальной стадии способа по изобретению, либо сами по себе, либо в контексте библиотеки.

В одном варианте осуществления, рекомбиназная библиотека используется в качестве отправной точки для молекулярной эволюции, например, рекомбиназная библиотека, включающая различные рекомбиназы дикого типа и/или адаптированные/перетасованные рекомбиназы, например, как описано ниже, или в Примере 2. Такая библиотека используется преимущественно в качестве отправной точки при создания адаптированных рекомбиназ, способных узнавать SEQ ID NO:1 и SEQ ID NO:2.

Адаптированная рекомбиназа способна к рекомбинации асимметричных последовательностей-мишеней внутри LTR провирусной ДНК множества ретровирусных штаммов. Провирусная ДНК, направляемая рекомбиназой, может быть встроена в геном клетки-хозяина. Альтернативно, адаптированная рекомбиназа по изобретению может обеспечивать рекомбинацию асимметричных последовательностей-мишеней внутри LTR провирусной ДНК множества ретровирусных штаммов, которые (пока) не интегрированы в геном клетки-хозяина, то есть которые присутствуют в качестве неинтегрированного преинтеграционного комплекса (PIC). Таким образом, ВИЧ, который еще не интегрирован в геном клетки-хозяина, а также ВИЧ, который уже интегрирован, могут быть инактивированы при помощи адаптированных рекомбиназ по изобретению.

Следует отметить, что в настоящем изобретении, а также в рассматриваемой области термины «последовательность-мишень», «участок-мишень» и «участок рекомбинации» используются как взаимозаменяемые.

В отличие от существующих в природе рекомбиназ, узнающих симметричный участок-мишень, способ по настоящему изобретению предоставляет адаптированные рекомбиназы, узнающие участки-мишени, которые не состоят из палиндромных последовательностей, разделенных спейсером. Вместо этого, в асимметричных участках-мишенях последовательности не образуют симметричный инвертированный повтор. Соответственно, адаптированная рекомбиназа, способная узнавать асимметричный участок-мишень, должна распознавать и обеспечивать рекомбинацию участков-мишеней, состоящих из половин участков варьирующей последовательности.

В асимметричном участке-мишени последовательности, называемые как «левая половина участка» и «правая половина участка», соответственно, определяются по их гомологии с левой и правой половиной участка известного участка-мишени. Последовательность, расположенная между последовательностями, гомологичными левой и правой половинам участка известного участка-мишени, называется спейсером.

При этом, если внутри LTR обнаруживаются последовательности, которые обладают гомологией лишь с последовательностью либо левой, либо правой половины участка известного участка-мишени, эти последовательности, тем не менее, могут использоваться в практике по настоящему изобретению. Размер участка-мишени, относящийся к рекомбиназе, чья нативная последовательность-мишень демонстрирует гомологию с последовательностями внутри LTR, известен специалистам в рассматриваемой области. Например, если гомология обнаруживается в последовательности LTR на последовательности-мишени, узнаваемой рекомбиназой Cre, асимметричный участок-мишень, чтобы узнаваться рекомбиназой Cre, должен состоять из 34 нуклеотидов с двумя последовательностями половин участков в 13 нуклеотидов, разделенных спейсером из 8 нуклеотидов. Соответственно, гомологичная последовательность внутри LTR определяется как-либо левой, либо правой половиной участка или спейсером асимметричного участка-мишени, в зависимости от гомологии с последовательностью известного участка-мишени. Таким образом, последовательности с гомологией к левой половине участка известной последовательности-мишени определяются как левая половина участка, последовательности с гомологией к правой половине участка известной последовательности-мишени определяются как правая половина участка. Исходя из этого определения, другие части асимметричных участков-мишеней определяются с учетом структуры известного участка-мишени. Таким образом, определив, например, последовательность правой половины участка внутри LTR по гомологии с участком loxP (узнаваемым рекомбиназой Cre), можно легко определить другие последовательности, соответствующие спейсеру и левой половине участка асимметричной последовательности-мишени. Спейсерная последовательность, например, определяется путем отсчета 8 нуклеотидов вверх по течению от 5’-конца последовательности, определенной как последовательность правой половины участка, тогда как последовательность левой половины участка определяется аналогичным образом путем отсчета 13 нуклеотидов вверх по течению от 5’-конца ранее определенной спейсерной последовательности.

Гомология в этом контексте, а также во всей заявке означает идентичность последовательностей. Предпочтительным сравнением в целях выявления гомологии является сравнение, по крайней мере, двух последовательностей с использованием стандартных способов, известных в рассматриваемой области, включая, в качестве неограничивающих примеров, алгоритм локальных гомологий Smith & Waterman (1981), алгоритм выравнивания гомологий Needleman & Wunsch (1970) или способ поиска сходства Pearson & Lipman (1988). Для целей настоящего приложения, гомологию последовательностей предпочтительно определять, используя компьютерные программы ClustalW, доступные из Европейского института биоинформатики (EBI), если не указано иное.

В связи с необходимостью наличия двух идентичных участков-мишеней, которые должны присутствовать в геноме провируса, чтобы дать возможность рекомбиназе удалить последовательность между этими двумя участками-мишенями, последовательности провирусной ДНК, которые присутствуют в геноме, по крайней мере, дважды, проверяют на стадии (a) способа по настоящему изобретению. Такие последовательности представляют собой, например, последовательности LTR провирусной ДНК. Соответственно, последовательность LTR сканируют предпочтительно, поскольку 5’-LTR и 3’-LTR провирусной ДНК являются идентичными. Асимметричный участок-мишень, присутствующий в 5’-LTR, также присутствует и в 3’-LTR и, таким образом, дает возможность эксцизии провирусной ДНК, расположенные между LTR.

Из последовательностей, идентифицированных в последовательности LTR, имеющих достаточную гомологию с известными участками-мишенями, предпочтительно выбирают последовательности, которые имеют наибольшую степень гомологии с последовательностью участка-мишени известных рекомбиназ. Однако можно также выбирать последовательности, отличные от тех, которые имеют наибольшую степень гомологии, например, такие, которые присутствуют в наибольшем числе штаммов ретровирусов, или в представляющих интерес штаммах ретровирусов, например, в случае, если пациент инфицирован конкретным штаммом.

Следует отметить, что потенциал способа по настоящему изобретению даже позволяет адаптировать рекомбиназы, которые узнают асимметричные участки-мишени с менее чем 30%-ой гомологией с известными участками-мишенями, например, по крайней мере, с 11%-ой или, по крайней мере, с 20%-ой гомологией. При этом, для уверенности в наличии рекомбинационной активности остатков для соответствующего асимметричного участка-мишени, предпочтительно проверяют последовательности, имеющие гомологию, по крайней мере, 30% с последовательностями левой половины участка и правой половины участка известных участков-мишеней известных рекомбиназ. В дополнительных предпочтительных вариантах осуществления выбраны асимметричные последовательности-мишени, имеющие гомологии, по крайней мере, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71 , 72, 73, 74, 75, 76, 77, 78, 79, 80%, более предпочтительно 85%, особенно предпочтительно 90% и наиболее предпочтительно 95% с последовательностями левой половины участка и правой половины участка известных участков-мишеней известных рекомбиназ.

В одном варианте осуществления по настоящему изобретению последовательность, выбранная внутри LTR, имеет гомологию с симметричными участками-мишенями loxP, узнаваемыми сайт-специфической рекомбиназой Cre.

В одном варианте осуществления, рекомбиназная библиотека используется в качестве отправной точки для молекулярной эволюции, например, рекомбиназная библиотека, содержащая различные рекомбиназы дикого типа и/или адаптированные/«перетасованные» рекомбиназы, такая как библиотека, описанная в Примере 2. Типичная библиотека состоит из рекомбиназы Cre и рекомбиназ, полученных на основе этого. Она может содержать Tre, Dre, рекомбиназы из Salmonella и Shewanella и/или рекомбиназы, полученные на основе этого. Библиотека может включать, например, Cre, Dre, Dre «Cre-ed» (SEQ ID NO: 24), рекомбиназу Shewanella (Shew), Shew «Cre-ed» (SEQ ID NO:25) и/или Zre (SEQ ID NO:26). Одна библиотека описана на Фиг. 3A. Tre представляет собой адаптированную рекомбиназу, как раскрыто в WO 2008/083931, которая в дальнейшем также называется Tre 1.0.

В одном варианте осуществления, все рекомбиназы в библиотеке узнают последовательность-мишень с такой же длиной спейсера. Общая длина последовательностей полуучастков 1 и 2, включая спейсер, предпочтительно составляет 34 нуклеотида.

В случае если, по крайней мере, одна рекомбиназа представляет собой рекомбиназную библиотеку, гомология представляет собой гомологию с пулом известных рекомбиназных участков-мишеней (т.е. гомология в заданной позиции, по крайней мере, с одной из последовательностей-мишеней определяется как гомология). Следовательно, на стадии (c), только те нуклеотиды, которые не соответствуют нуклеотиду, по крайней мере, в одной из известных последовательностей-мишеней, определяются как отклоняющиеся нуклеотиды. В случае рекомбиназной библиотеки «нативный нуклеотид» на стадии (e) может представлять собой нуклеотид, присутствующий в этом положении в любой из известных последовательностей-мишеней, предпочтительно, он является нуклеотидом, присутствующим в этом положении в нескольких или большинстве из известных последовательностей-мишеней.

Для идентификации последовательностей-мишеней, присутствующих во множестве ретровирусных штаммов, известные участки узнавания рекомбиназами, которые были описаны в литературе, могут быть использованы в качестве запроса для поиска консервативных асимметричных последовательностей-мишеней в отношении геномного фрагмента. При этом, учитывая повторяющийся характер областей, исключается использование стандартных инструментов поиска сходства последовательностей. В работе Sarkar et al., 2007, для нахождения Lox-подобного участка связывания среди штаммов ВИЧ используется BLAST (Altschul et al., 1997). Поиск BLAST для Lox-подобного участка при проведении среди последовательностей LTR ВИЧ-1 привел к открытию только одного участка, присутствующего в единственном штамме. Однако в случае, если рекомбиназы предполагается использовать в качестве терапевтических средств в отношении ретровирусных геномов, очень важно конструировать рекомбиназы для распознавания участков-мишеней, присутствующих у максимально большого количества штаммов ретровирусов.

Поскольку BLAST не выполняется хорошо с такими короткими избыточными последовательностями, было решено использовать HMMER (Eddy et al, 1998), RepeatMasker или программу палиндромов из набора пакетов Emboss. HMMER была разработана для нахождения отдаленных гомологий на основе вероятностной модели искомой структуры последовательности, которая не является содержанием поиска, предназначенного для проведения. HMMER может пытаться решить этот поисковый вопрос, но количество данных и параметров до и после обработки могут сделать его крайне ошибочным и неэффективным. RepeatMasker только проводит поиск повторов и областей с низкой сложностью, которые уже хорошо охарактеризованы, что опять-таки не является содержанием этого поиска. Программа палиндромов Emboss подходит ближе к решению проблемы поиска, но не дает возможность поиску быть определенным, а, скорее, дает в результате перечень возможных Lox-подобных участков. Затем они могут быть сопоставлены с представляющим интерес свойством