Экспрессионная система для повышения уровня экспрессии гена, молекула нуклеиновой кислоты, клетка, трансгенное животное и набор

Иллюстрации

Показать все

Изобретение относится к области молекулярной биологии. Предложены экспрессионная система для экспрессии высокого уровня гена, включающая промотор и по меньшей мере одну последовательность MAR; изолированная и очищенная молекула нуклеиновой кислоты, представляющая собой последовательность MAR; клетка; трансгенное животное; набор для экспрессии высокого уровня, а также применение указанной экспрессионной системы для повышенного продуцирования белка. Изобретение может быть использовано для получения широкого круга белков, включая антитела и интерфероны, посредством трансгенных животных и клеточных культур. 7 н.п. ф-лы, 15 ил., 5 табл., 1 пр.

Реферат

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ

В данной заявке заявлен приоритет на основании временных заявок США №№60/823319, поданной 23 августа 2006, и 60/953910, поданной 3 августа 2007, которые включены сюда путем ссылки в полном объеме.

ОБЛАСТЬ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к нуклеиновым кислотам, содержащим нуклеотидные последовательности, соответствующие изолированным и очищенным последовательностям MAR, имеющим происхождение от человека и животных, отличных от человека, или основанные на них. Эти нуклеиновые кислоты в целом обладают активностями усиления транскрипции и/или продуцирования белка. Изобретение также относится к способам идентификации таких последовательностей и к системам, в которых они использованы, например, для высокого выхода при продуцировании белков.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Публикации и другие материалы, включая патенты, используемые здесь для иллюстрации изобретения и, в частности, для приведения аналогичных деталей, касающихся практики, включены здесь путем ссылки. Для удобства публикации, если они не указаны полностью в тексте, перечислены в алфавитном порядке в прилагаемой библиографии. EMBL номер по каталогу АС102666 и последовательности, фланкирующие EMBL, номер по каталогу ВН101870 и ВН101901, а также EMBL номера по каталогу (синонимы) 126658, 23119391, 22981746 также включены здесь путем ссылки в полном объеме.

В настоящее время модель организации эукариотических хромосом в домены хроматиновых петель примерно от 50 до 100 кб широко признана [Bodnar JW, Breyene Р, Van Montagu M and Gheyseu G, Razin SV]. Считают, что наружные концы этих петель соответствуют специфичным последовательностям ДНК, которые присоединены к ядерному матриксу, белковой сети, состоящей из РНП (рибонуклеопротеинов) и других негистоновых белков [Bode J, Benham С, Knopp А и Mielke С]. Хромосомные последовательности ДНК, которые присоединены к ядерному матриксу, называют SAR или MAR, соответственно, для каркасных (во время метафазы) или матриксных (интерфаза) областей присоединения (SAR от scaffold attachment region, и MAR от matrix attachment region). S/MAR, элементы MAR или последовательности MAR, или, для краткости, MAR представляют собой полиморфные области типичной длины 300-3000 п.о. Установлено, что в ядре млекопитающих находится примерно 100000 MAR [Bode J, Stengert-lber M, Kay V, Schlake Т и Dietz-Pfeilstetter A].

Считают, что посредством структурной и функциональной сегрегации хроматина в петлевые домены элементы MAR играют критическую роль в репликации и регуляции экспрессии генов, так чтобы облегчить структурную сборку и разборку центров транскрипции в ядре млекопитающих. Множество косвенных данных собрано в подтверждение этого мнения; например, в различных эукариотических геномах точки начала репликации ДНК были картированы внутри элементов MAR [Amati В и Gasser SM (1988), Amati В и Gasser SM (1990)]. MAR также почти всегда обнаруживают в некодирующих межгенных областях, внутри интронов [Girod PA, Zahn-Zabal M и Mermod N] или на границах транскрипционных единиц [Gasser SM и Laemmli UK; National Center for Biotechnology Information], где они могут связывать универсальные и/или тканеспецифические факторы транскрипции. В целом в трансгенных экспериментах на растениях и на линиях животных клеток элементы MAR успешно использованы для повышения экспрессии и стабильности трансгена [Allen GC, Spiker S, Thompson WF, Bode J, Schlake T, Rios-Ramirez M, Mielke C, Stengart M, Kay V и Klehr-Wirth D, Girod PA, Zahn-Zabal M и Mermod N]. Например, MAR использованы для повышения продуцирования различных рекомбинантных белков в клетках, релевантных для биотехнологии и терапевтических применений, таких как клетки СНО (яичника китайского хомячка) [Girod PA, Zahn-Zabal M и Mermod N, Kim JM, Kim JS, Park DH, Kang HS, Yoon J, Baek К и Yoon Y, Zahn-Zabal M, Kobr M, Girod PA, Imhof M, Chatellard P, de Jesus M, Wurm F и Mermod N] (Mermod et al., "Development of stable cell lines for production or regulated expression using matrix attachment regions," WO 02074969, а также публикация патента США 20030087342).

Функциональная активность MAR вероятнее связана с их структурными свойствами, чем с их первичной последовательностью ДНК. Действительно, MAR имеют высокое содержание А и Т [Boulikas Т (1993)], и наблюдаются некоторые конкретные конформационные и физико-химические свойства, такие как природная кривизна молекулы, узкая малая бороздка, высокий потенциал раскручивания/неспаривания или склонность к денатурации [Bode J, Schlake T, Rios-Ramirez М, Mielke С, Stengart М, Кау V и Klehr-Wirth D, Boulikas Т (1993), Boulikas T (1995)]. В действительности именно эти свойства использованы для идентификации MAR способом, называемым SMAR Scan. Кроме того, активность MAR может быть также опосредована ДНК-связывающими белками, такими как ферменты ремоделирования хроматина и/или факторы транскрипции, которые могут распознавать специфичные структурные признаки элементов MAR, такие как однонитевая и/или изогнутая ДНК [Bode J, Stengert-Iber М, Кау V, Schlake Т и Dietz-Pfeilstetter A]. He обнаружено отчетливого сайта связывания белка или консенсусной последовательности MAR [Boulikas T (1993)], что затрудняет предсказание MAR на основании геномных последовательностей.

Хотя некоторые функциональные и структурные свойства MAR описаны, их идентификация затруднительна, поскольку они имеют мало общего в отношении первичной структуры. Хотя элементы MAR могут быть функционально консервативными в эукариотических геномах, где это предположение подтверждается тем фактом, что MAR животных могут связываться с растительными ядерными каркасами и наоборот [Breyne P, Van Montagu М, Depicker А и Gheysen G, Mielke С, Kohwi Y, Kohwi-Shigematsu Т и Bode J], мало можно сказать о том, какой признак делает последовательность MAR последовательностью эффективного продуцирования белка. Также могут быть получены варьирующие результаты в зависимости от используемого анализа [Razin SV, Boulikas Т (1995), Кау V и Bode J]. С учетом огромного числа ожидаемых MAR в эукариотическом организме и количества последовательностей, опубликованных геномными проектами, были разработаны инструменты/программы для обнаружения структурных признаков последовательностей ДНК MAR (SMAR Scan I) или функциональных последовательностей, таких как сайты связывания для специфичных белков, которые действуют в качестве регуляторных белков или факторов транскрипции (SMAR Scan II) [временная патентная заявка США 60/953910, поданная 3 августа 2007, публикация патента США 20070178469 авторов Mermod et al.]. Такие программы были разработаны для идентификации новых потенциальных последовательностей MAR путем обнаружения кластеров признаков последовательностей ДНК, соответствующих изгибу ДНК, потенциалам глубины большой бороздки и ширины малой бороздки, а также сайтам связывания специфичных регуляторных белков транскрипции. Эти программы использованы для сканирования человеческого генома для идентификации предполагаемых последовательностей ДНК MAR, для некоторых из которых показано повышение экспрессии трансгена при встраивании в экспрессионную плазмиду, которая была трансфицирована в клетки СНО (Girod et al., "Identification of S/MAR from genomic sequences with bioinformatics and use to increase protein production in industrial and therapeutic processes," публикация патента США 20070178469 авторов Mermod et al.]. Это показало, что программы SMAR Scan могут эффективно идентифицировать человеческие генетические элементы, которые, в свою очередь, можно использовать для повышения синтеза белка. Хотя проведенные до сих пор функциональные скрининги были ограничены человеческим геномом, при широкомасштабной продукции интересующий белок часто экспрессируют в клетках млекопитающих, отличных от человека.

В человеческом геноме идентифицировано около шестнадцати сотен MAR с помощью SMAR Scan, и для шести из восьми было продемонстрировано, что они запускают усиленную экспрессию генов (таких как ген зеленого флуоресцентного белка (GFP), антитела и рецепторы) в клетках СНО при помещении их выше энхансера/промотора. Длина ДНК, которая, как показано, обладает эктопической активностью MAR, находится в интервале от 2,5 кб до 6 кб. Однако отсутствие структурной характеристики MAR до сих пор ограничивало получение "дизайна" MAR. Таким образом, существует необходимость в характеристике MAR, в частности функциональных и/или структурных областей MAR, чтобы дать возможность конструирования и дизайна MAR.

Проведенные до сих пор функциональные скрининги были ограничены человеческим геномом. Поскольку при широкомасштабной продукции интересующий белок часто экспрессируют в клетках млекопитающих, также существует необходимость в идентификации более эффективных встречающихся в природе MAR, которые усиливают транскрипцию и/или экспрессию генов и/или эффективных клеток-продуцентов белков в человеческих клетках и/или в клетках млекопитающих, отличных от человека.

В целом существует необходимость идентификации и/или получения MAR, обладающих преимущественными свойствами, например, путем идентификации дополнительных встречающихся в природе MAR, путем конструирования идентифицированных MAR и/или путем получения синтетических MAR. Преимущественные свойства проявляются, но не ограничены ими, в свойствах усиленной транскрипции и/или продуцирования белка/экспрессии гена; уменьшенной длины относительно встречающихся в природе MAR, что, таким образом, дает возможность более многостороннего применения в генной инженерии; специфичность к тканям, клеткам или органам и/или способность к индукции при добавлении внешнего стимулятора, такого как лекарство.

Для адресации одной или более чем одной из этих потребностей и других потребностей, которые станут очевидными на основании последующего описания, использовали несколько подходов, включая широкомасштабный биоинформационный анализ генома мыши для идентификации предполагаемых последовательностей ДНК MAR. Геном мыши анализировали, используя программное обеспечение для предсказания MAR SMAR Scan I. Вновь идентифицированные последовательности грызунов оценивали на их способность опосредовать улучшенное продуцирование рекомбинантных белков, представляющих фармацевтический интерес, из культивируемых клеток. Наконец, транскрипционную активность вновь идентифицированных MAR оценивали в трансфекционных анализах трансгена.

Кроме того, были исследованы MAR, такие как человеческая 1_68 MAR и мышиная MAR S4. Были идентифицированы блоки, в частности блоки, содержащие некоторые специфичные по структуре/последовательности MAR, и эти блоки использовали для конструирования MAR, обладающих преимущественными свойствами, путем, например, перегруппировки, делеции и/или дупликации последовательностей. Эти блоки также объединяли с другими элементами, например с синтетическими нуклеотидными последовательностями, содержащими некоторые сайты связывания, в частности сайты связывания факторов транскрипции (TFBS).

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

На фиг.1 показан эффект различных MAR на продуцирование рекомбинантного зеленого флуоресцентного белка (GFP).

На фиг.2 показан эффект различных человеческих и мышиных MAR элементов на процент очень высоких продуцентов (% МЗ) в клетках СНО рекомбинантного зеленого флуоресцентного белка (GFP).

На фиг.3 показан эффект различных человеческих 1_68 и мышиных S4 MAR элементов на экспрессию рекомбинантного зеленого флуоресцентного белка (GFP).

На фиг.4 показан эффект мышиных элементов MAR на продуцирование рекомбинантных моноклональных антител.

На фиг.5 показано, что стабильные поликлональные популяции могут быть получены из популяции клеток СНО, трансфицированных векторами, направляющими экспрессию тяжелой и легкой цепи IgG без MAR (нет MAR) или с MAR S4, присоединенной в цис положении.

На фиг.6 (А) и (Б) показано, что стабильные индивидуальные клоны могут быть получены путем ограничения разведения популяции клеток СНО, трансфицированных векторами, направляющими экспрессию тяжелой и легкой цепи IgG без MAR (нет MAR) в (Б) или с MAR S4 и MAR 1_68, присоединенными в цис положении.

На фиг.7 (А) и (Б) показана экспрессия гена (GFP) без MAR (А) и с MAR (Б) со временем (2 недели и 26 недель).

На фиг.8 (А) и (Б) изображены признаки изгиба (А) и последовательности (Б) человеческой 1_68 MAR.

Фиг.9 (А)-(В): На (А) показаны различные конструкции MAR, полученные путем группировки идентифицированных областей и достигнутый прирост транскрипции; на (Б) показан паттерн изгиба конструкции MAR 6; на (В) приведены детали структурных параметров, таких как сайты связывания конструкции MAR 6.

На фиг.10 показан эффект различных конструкций MAR S4 на экспрессию рекомбинантного зеленого флуоресцентного белка (GFP), которая выявлена с помощью средней флуоресценции всей популяции (Avg Gmean М0).

На фиг.11 показаны различные конструкции MAR S4, выведенные на основании экспрессии рекомбинантного зеленого флуоресцентного белка (GFP), которая выявлена путем анализа средней флуоресценции всей популяции (Avg Gmean М0).

На фиг.12 показана карта потенциальных сайтов связывания факторов транскрипции человеческой 1_68 MAR, которые предсказаны программным обеспечением MATInspector.

Фиг.13 представляет собой карту плазмиды, использованной для тестирования на активность синтетических MAR, сконструированных в результате сборки АТ-богатой внутренней последовательности (MAR 1429-2880) и синтезированных химическим путем сайтов связывания ДНК для факторов транскрипции, помещенных выше промотора, и зеленого флуоресцентного белка (GFP).

Фиг.14 представляет собой иллюстрацию усиления транскрипции синтетическими MAR, сконструированными, как описано на фиг.13.

Фиг.15 представляет собой иллюстрацию усиления транскрипции синтетическими MAR, содержащими сайты связывания ДНК, подробно описанные в таблице 5.

КРАТКОЕ ИЗЛОЖЕНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Настоящее изобретение в одном воплощении направлено на экспрессионную систему для экспрессии на высоком уровне по меньшей мере одного гена, включающую:

промотор для оперативного сцепления с нуклеотидной последовательностью, кодирующей интересующий ген, и

по меньшей мере одну нуклеотидную последовательность MAR млекопитающего, отличного от человека, для усиления экспрессии указанного гена в клетке, трансформированной указанной экспрессионной системой,

где указанная нуклеотидная последовательность MAR млекопитающего, отличного от человека, повышает экспрессию указанного гена примерно в 2, примерно в 3, примерно в 4, примерно в 5, примерно в 6, примерно в 7, примерно в 8, примерно в 9, примерно в 10 раз или более после трансформации указанной клетки указанной конструкцией.

Указанная нуклеотидная последовательность MAR млекопитающего, отличного от человека, может включать, по существу состоять или состоять из:

(i) SEQ ID No. 3, SEQ ID No. 10 или ее функционального фрагмента; или

(ii) нуклеотидной последовательности, имеющей примерно 80%, примерно 90%, примерно 95% или примерно 98% идентичности последовательности с любой из последовательностей (i).

Изобретение также направлено на изолированную и очищенную молекулу нуклеиновой кислоты, содержащую, по существу состоящую или состоящую из:

(а) нуклеотидной последовательности SEQ ID No. 3 или SEQ ID No. 10 или ее функционального фрагмента; или

(б) нуклеотидной последовательности, имеющей примерно 80%, примерно 90%, примерно 95% или примерно 98% идентичности последовательности с последовательностью (а) и обладающей активностью MAR.

Изобретение, кроме того, направлено на способ идентификации последовательностей MAR млекопитающего, отличного от человека, при котором:

- получают по меньшей мере одну молекулу нуклеиновой кислоты млекопитающего, отличного от человека, предпочтительно геном млекопитающего, отличного от человека, или его часть,

- подвергают указанную молекулу нуклеиновой кислоты методике сканирования на MAR последовательности, включающей:

- установление размера окна для молекул нуклеиновой кислоты, подлежащих оценке,

- выбор по меньшей мере 1 или по меньшей мере 2, предпочтительно 3, более предпочтительно 4 или более признаков, связанных с MAR,

- установление пороговых значений для последовательностей, проявляющих этот признак/эти признаки и

- выбор нуклеотидных последовательностей-кандидатов MAR, для которых превышены эти пороговые значения,

- подтверждение того, что указанная нуклеотидная последовательность MAR млекопитающего, отличного от человека, повышает экспрессию гена примерно в 2, примерно в 3, примерно в 4, примерно в 5, примерно в 6, примерно в 7, примерно в 8, примерно в 9, примерно в 10 или более раз после трансформации человеческой клетки и/или клетки млекопитающего, отличного от человека, экспрессионной системой, содержащей указанные нуклеотидные последовательности MAR млекопитающего, отличного от человека.

Признак может здесь представлять собой значение угла изгиба ДНК, которое умножают на значение окна с получением величины умножения между примерно 320 и 1320, как, например, примерно 420 и примерно 1220, примерно 520 и примерно 1120, примерно 620 и примерно 1020, примерно 720 и примерно 920; признак может здесь представлять собой значение глубины большой бороздки, которое умножают на значение окна с получением величины умножения между примерно 900 и примерно 4000, как, например, примерно 1200 и 3700, примерно 1500 и примерно 3400, примерно 1800 и примерно 3100, примерно 2100 и примерно 2800 и/или признак может здесь представлять собой значение ширины малой бороздки, которое умножают на значение окна с получением величины умножения между примерно 500 и примерно 2500, как, например, примерно 750 и примерно 2250, примерно 1000 и примерно 2000, примерно 1250 и 1750.

Изобретение также направлено на конструкции MAR, содержащие:

(а) (i) изолированную нуклеотидную последовательность, содержащую по меньшей мере часть концевого участка идентифицированной MAR, и

(ii) дополнительную изолированную нуклеотидную последовательность, содержащую примерно 10%, примерно 15%, примерно 20%, примерно 25%, примерно 30% или более указанной идентифицированной MAR или другой идентифицированной MAR; или

(б) (i) нуклеотидную последовательность, имеющую примерно 90%, примерно 95%, примерно 96%, примерно 97% примерно 98%, примерно 99% идентичности последовательности с нуклеотидной последовательностью (а) (i), и

(ii) нуклеотидную последовательность, имеющую примерно 90%, примерно 95%, примерно 96%, примерно 97%, примерно 98%, примерно 99% идентичности последовательности с нуклеотидной последовательностью (б) (i).

Другие конструкции MAR согласно изобретению включают:

области идентифицированной последовательности MAR или ее части в последовательном расположении, где порядок и/или ориентация отличается от таковой идентифицированной последовательности MAR.

Еще одни другие конструкции MAR согласно изобретению включают:

(а) внутреннюю нуклеотидную последовательность, содержащую

(i) по меньшей мере одну изолированную или синтетическую АТ-богатую область идентифицированной последовательности MAR или

(ii) по меньшей мере одну АТ-богатую область, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% идентичности последовательности с АТ-богатой областью (а) (i),

(б) нуклеотидную последовательность, содержащую

по меньшей мере один сайт связывания ДНК-белок, прилежащий к указанной нуклеотидной последовательности (а), где указанный сайт связывания представляет собой

(i) сайт связывания ДНК-белок дополнительной идентифицированной последовательности MAR,

(ii) сайт связывания ДНК-белок идентифицированной последовательности MAR (а), где указанный сайт связывания ДНК-белок в идентифицированной последовательности MAR расположен снаружи от внутренней нуклеотидной последовательности (а), либо

(iii) первый сайт связывания ДНК-белок присутствует во внутренней последовательности (а), но прилежит по меньшей мере к одному дополнительному сайту связывания ДНК-белок, где первый и по меньшей мере один из указанных дополнительных сайтов связывания ДНК-белок не прилежат к внутренней последовательности (а), либо

(iv) сайты связывания ДНК-белок последовательности, представляющей собой не MAR.

Изобретение также направлено на экспрессионные системы, содержащие любую из указанных конструкций MAR, набор, содержащий любую из указанных экспрессионных систем, и применение любой из конструкций MAR, экспрессионных систем, клеток, трансгенных животных, отличных от человека, наборов и/или способов, относящихся к изобретению, (1) для продуцирования белков, таких как антитела, распознающие патогенные белки человека или белки клеточной поверхности человека, и таких белков, как эритропоэтин, интерфероны или другие терапевтические или диагностические белки и/или (2) in vitro, in vivo генотерапии, клеточной терапии или регенерационной терапии тканей.

ПОДРОБНОЕ ОПИСАНИЕ РАЗЛИЧНЫХ И ПРЕДПОЧТИТЕЛЬНЫХ ВОПЛОЩЕНИЙ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к изолированным и очищенным последовательностям MAR из животных, отличных от человека, к способу идентификации этих последовательностей и к системе, в которой использованы такие последовательности для высокого выхода при продуцировании белков как в человеческих клетках, так и в не человеческих клетках, таких как клетки грызунов.

Изобретение также направлено на конструкции MAR, в частности усиленные конструкции MAR, на экспрессионные системы и наборы, в которых используют эти конструкции MAR, и на их применение при продуцировании, в частности при широкомасштабной продукции белков, а также в терапии.

Кроме того, изобретение направлено на способы продуцирования с высоким выходом белков, как в человеческих клетках, так и в клетках млекопитающих, отличных от человека, посредством MAR/конструкций MAR.

Если они не определены иначе, все технические и научные термины, используемые здесь, имеют такое же значение, как общепринято понимают специалисты в области техники, к которой принадлежит данное изобретение. Хотя методы и материалы, отличающиеся от описанных здесь, можно использовать в практике настоящего изобретения, примерные пригодные методы и материалы описаны ниже.

Экспрессионная кассета согласно настоящему изобретению представляет собой нуклеиновую кислоту, содержащую по меньшей мере один ген, а также элементы, необходимые для транскрипции этого гена.

Промотор согласно настоящему изобретению представляет собой регуляторную область ДНК, которая при локализации выше гена способствует транскрипции этого гена.

Экспрессия в клетке, например экспрессия в клетке млекопитающего, отличного от человека, относится в контексте настоящего изобретения к экспрессии in vitro и in vivo. Экспрессия in vitro включает, например, экспрессию в клеточной линии, такой как клеточная линия HeLa или клеточная линия СНО, и в клетках, используемых для генотерапии in vitro. Экспрессия in vivo включает экспрессию в трансгенном животном, отличном от человека, и экспрессию в человеческих клетках, используемых для генотерапии in vivo или для генотерапии in vitro после возвращения клеток в организм человека-реципиента генотерапии.

Клетка млекопитающего, такая как клетка млекопитающего, отличного от человека, согласно настоящему изобретению способна поддерживаться в условиях клеточной культуры. Не ограничивающим примером такого типа клеток являются клетки яичника китайского хомячка (СНО).

Конструкция MAR, элемент MAR, последовательность MAR, S/MAR или просто MAR согласно настоящему изобретению представляет собой нуклеотидную последовательность, имеющую одну или более чем одну (как, например, две, три или четыре) общую характеристику с встречающимися в природе "SAR" или "MAR" и обладающую по меньшей мере одним свойством, которое способствует экспрессии белка любого гена, на который влияет такая MAR. Конструкция MAR также обладает признаком изолированной и/или очищенной нуклеиновой кислоты с активностью MAR, в частности с активностью модулирования транскрипции, предпочтительно с энхансерной активностью, но также, например, с активностью стабилизации экспрессии и/или с другими активностями, которые также описаны под термином "усиленные конструкции MAR." Конструкции MAR могут быть определены на основе идентифицированных MAR, на которых они первично основаны: конструкция MAR S4, соответственно, представляет собой конструкцию MAR, большинство нуклеотидов которой (50% и более) основаны на MAR S4. Встречающиеся в природе SAR или MAR согласно широко признанной модели опосредуют заякоривание специфичных последовательностей ДНК в ядерном матриксе, образуя домены хроматиновых петель, которые распространяются вовне из гетерохроматиновых сердцевин. Хотя SAR или MAR не содержат какой-либо очевидной консенсусной или распознаваемой последовательности, их наиболее единообразным признаком оказывается общее высокое содержание А и Т и преобладание оснований С на одной нити. MAR в целом обладают склонностью к образованию изогнутых вторичных структур, которые могут быть склонны к разделению нитей. Несколько простых мотивов последовательности с высоким содержанием А и Т часто обнаруживают внутри SAR и/или MAR, но для большей части их функциональная значимость и потенциальный способ действия не выяснены. Они включают А-бокс, Т-бокс, мотивы раскручивания спирали ДНК, сайты связывания SATB1 (Н-бокс, А/T/С25) и консенсусные сайты топоизомеразы II для позвоночных или Drosophila.

Кандидат MAR или последовательность-кандидат MAR согласно настоящему изобретению представляет собой последовательность, имеющую одну или более чем одну общую характеристику, как, например, две, три или четыре общие характеристики, с природными SAR или MAR.

Идентифицированная MAR или идентифицированная последовательность MAR согласно настоящему изобретению представляет собой изолированную нуклеотидную последовательность и соответствует встречающейся в природе последовательности MAR в том, что она содержит все области ("блоки" или "элементы"), которые дают возможность полного усиления экспрессии белка/гена, соответствующие ее природному прототипу.

Блоки (также называемые здесь "области", "область ДНК', "участки", "домены") идентифицированной MAR все необходимы для возможности усиления экспрессии белка/гена, соответствующего способности встречающейся в природе MAR. Ни один из этих блоков сам по себе обычно не способен к достижению полной активности MAR. Некоторые из этих областей специфичны по последовательности, такие как обогащенные АТ-динуклеотидами области изгиба и области сайтов связывания факторов транскрипции (TFBS), описанные ниже. Другие "области" характеризуются их локализацией, например 5' и 3' концевые области идентифицированной последовательности MAR.

Обогащенная АТ/ТА-динуклеотидами область изгиба ДНК (здесь называемая "АТ-богатой областью") представляет собой область изгиба ДНК, содержащую высокое число А и Т, в форме динуклеотидов AT и ТА. В предпочтительном воплощении она содержит по меньшей мере 10% динуклеотида ТА и/или по меньшей мере 12% динуклеотида AT на отрезке из 100 непрерывных пар оснований, предпочтительно по меньшей мере 33% динуклеотида ТА и/или по меньшей мере 33% динуклеотида AT на отрезке из 100 непрерывных пар оснований (или на соответствующем более коротком отрезке, когда АТ-богатая область имеет более короткую длину), в то же время имея изогнутую вторичную структуру. Однако "АТ-богатые области" могут быть настолько короткими, как примерно 30 нуклеотидов или менее, но предпочтительно имеют длину примерно 50 нуклеотидов, примерно 75 нуклеотидов, примерно 100 нуклеотидов, примерно 150, примерно 200, примерно 250, примерно 300, примерно 350 или примерно 400 нуклеотидов или длиннее.

Как обсуждено ниже, АТ-богатую область можно отличить от соседней области, такой как область сайта связывания, с помощью, например, ее относительно высокого угла изгиба.

Некоторые сайты связывания также часто имеют относительно высокое содержание А и Т, как, например, сайт связывания SATB1 (Н-бокс, А/Т/С25) и консенсусные сайты топоизомеразы II для позвоночных или Drosophila. Однако область сайта связывания (блок), в частности область TFBS, которая содержит кластер сайтов связывания, можно легко отличить от областей, обогащенных динуклеотидами AT и ТА ("АТ-богатых областей"), от сайтов связывания с высоким содержанием А и Т путем сравнения паттерна изгиба этих областей. Например, для человеческой MAR 1_68 последний может иметь среднюю степень кривизны, превышающую примерно 3,8 или примерно 4,0, тогда как область TFBS может иметь среднюю степень кривизны ниже примерно 3,5 или примерно 3,3. Области идентифицированных MAR могут быть также подтверждены альтернативными способами, такими как, но не ограниченными ими, относительные температуры плавления, как описано здесь в другом месте. Однако такие значения видоспецифичны и, таким образом, могут варьироваться от вида к виду, и могут, например, быть более низкими. Следовательно, соответствующие области, обогащенные динуклеотидами AT и ТА, могут иметь более низкие степени кривизны, такие как от примерно 3,2 до примерно 3,4, или от примерно 3,4, до примерно 3,6, или от примерно 3,6 до примерно 3,8, и области TFBS могут иметь пропорционально более низкие степени кривизны, как, например, примерно 2,7, ниже примерно 2,9, ниже примерно 3,1, ниже примерно 3,3. В программе SMAR Scan II специалистом в данной области техники должны быть выбраны относительно более низкие размеры окна.

Концевая область идентифицированной MAR/последовательности MAR согласно настоящему изобретению включает по меньшей мере примерно 5%, примерно 6%, примерно 7%, примерно 8%, примерно 9% или примерно 10% идентифицированной MAR.

Сайт связывания или сайт связывания ДНК-белок представляет собой любую нуклеотидную последовательность, которая может связывать ДНК-связывающий белок. Сайты связывания для ДНК-связывающих белков типично представляют собой TFBS. TFBS представляет собой любую последовательность, которая может связывать фактор транскрипции. TFBS может иметь любое происхождение, как, например, но не ограниченное ими, от человека или мыши. TFBS могут быть также созданы генно-инженерным или синтетическим путем. Однако в некоторых воплощениях TFBS имеют прототип в последовательности MAR, такой как последовательность MAR того же организма, того же вида или того же рода. Однако TFBS могут принадлежать к последовательности MAR другого вида или другого рода. TFBS, которые не имеют известного в настоящее время прототипа в последовательности MAR, также находятся в пределах объема настоящего изобретения. Такие TFBS могут включать, но не ограничены ими, сайты связывания для USF1 (левый стимулирующий фактор 1) или белок с "цинковыми пальцами" CTCF. TFBS могут быть модифицированы путем 1, 2, 3, 4, 5 или большего количества замен, добавлений и/или делеций и могут быть полностью или частично синтезированы. Оптимизированные TFBS, которые представляют собой TFBS с оптимизированным сродством связывания для соответствующего ДНК-связывающего белка и которые часто не имеют известного природного прототипа, также находятся в пределах объема настоящего изобретения. Эти оптимизированные TFBS также могут быть созданы путем вышеописанных модификаций встречающихся в природе TFBS или синтетическим путем, в частности путем химического синтеза. В некоторых воплощениях изобретения сайт(ы) связывания или TFBS придают тканеспецифичность MAR посредством, например, связывания тканеспецифичными природными, полученными генно-инженерным путем или синтетическими регуляторными белками или другими природными, полученными генно-инженерным путем или синтетическими белками, которые, например, могут реагировать на специфичные лекарства и молекулы. Генная и/или клеточная терапия являются типичными случаями, в которых полезна тканеспецифичность, а также она полезна для способности MAR специфично реагировать на определенное лекарство, то есть способность к индукции этим лекарством. В первом случае, например, интересующий ген должен экспрессироваться только в специфичных органах или тканях, в последнем случае экспрессию можно запускать, например, только в ответ на определенное лекарство. Другими не ограничивающими примерами факторов транскрипции, для которых могут быть включены TFBS, являются, например, SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, ТАТА, Bright, MSX, AP1, С/ЕВР, CREBP1, FOX, Freac7, HFH1, HNF3alpha, Nkx25, POU3F2, Pit1, TTF1, XFD1, AR, С/ЕВР гамма, Cdc5, FOXD3, HFH3, HNF3 бета, MRF2, Oct1, POU6F1, SRF, V$MTATA_B, XFD2, Bach2, CDP CR3, Cdx2, FOXJ2, HFL, HP1, Мус, PBX, Pax3, TEF, VBP, XFD3, Brn2, COMF1, Evil, FOXP3, GATA4, HFN1, Lhx3, NKX3A, POU1F1, Рах6 и/или TFIIA.

Сайт связывания, такой как TFBS, указан как прилежащий к внутренней нуклеотидной последовательности, если внутренняя нуклеотидная последовательность и сайт связывания разделены не более чем примерно 200, предпочтительно не более чем примерно 100 нуклеотидами, даже более предпочтительно не более чем примерно 50 нуклеотидами, даже более предпочтительно не более чем примерно 25, не более чем примерно 15, не более чем примерно 5 или не разделены нуклеотидами. В предпочтительном воплощении сайты связывания, в частности TFBS, сами содержат короткие линкеры или адаптеры вплоть до 25 нуклеотидов с каждой стороны TFBS. В еще более предпочтительном воплощении TFBS составляют часть олигомера вплоть до примерно 50 нуклеотидов, вплоть до примерно 40 нуклеотидов или вплоть до примерно 30 нуклеотидов. Серия сайтов связывания, таких как TFBS, в соответствии с настоящим изобретением представляет собой ряд TFBS, расположенных в последовательности друг за другом. Серия TFBS указана как прилежащая к внутренней нуклеотидной последовательности, если TFBS из этой серии, который является ближайшим к внутренней последовательности, находится на расстоянии, указанном выше. Сайт связывания указан как фланкирующий "АТ-богатую область", если этот сайт связывания представляет собой сайт связывания, который является частью внутренней нуклеотидной последовательности и имеет прототип в идентичной локализации в природной MAR.

Сайт связывания может быть модифицирован путем 1, 2, 3, 4, 5 или большего количества замен, добавлений и/или делеций. Предпочтительно эти замены, добавления и/или делеции включают таким образом, чтобы сайт связывания совпадал с консенсусной последовательностью соответствующего сайта связывания.

Разнообразные усиленные конструкции MAR составляют часть настоящего изобретения и обладают свойствами, которые состоят в усилении по сравнению с природными и/или идентифицированными MAR, на которых может быть основана конструкция MAR согласно настоящему изобретению, в частности с природными MAR, на которых основана внутренняя нуклеиново-кислотная последовательность. Такие свойства включают, но не ограничены ими, уменьшенную длину относительно полноразмерной природной и/или идентифицированной MAR, усиление экспрессии/транскрипции гена, усиление стабильности экспрессии, тканеспецифичность, способность к индукции или их комбинации. Соответственно, конструкция MAR, которая является усиленной, может, например, содержать менее чем примерно 90%, предпочтительно менее чем примерно 80%, даже более предпочтительно менее чем примерно 70%, менее чем примерно 60% или менее чем примерно 50% от числа нуклеотидов идентифицированной последовательности MAR. Конструкция MAR может усиливать экспрессию гена и/или транскрипцию гена после трансформации соответствующей клетки указанной конструкцией. Если в контексте настоящего изобретения ссылаются на конструкции МАР/(нуклеотидные) последовательности MAR, которые "усиливают экспрессию", обладают "активностью усиления экспрессии гена", "усиливают экспрессию белка" или тому подобное, это "усиление" представляет собой усиление относительно экспрессии, например, гена, экспрессируемого в эквивалентных условиях во всем остальном, но в отсутствие такой последовательности. Усиление может, например, быть примерно 2, примерно 3, примерно 4, примерно 5, примерно 6, примерно 7, примерно 8, примерно 9, примерно 10-кратным или примерно 15-кратным, примерно 20-кратным или примерно 25-кратным или выше.

Конструкция MAR может также увеличивать средний процент очень высокопродуцирующих клеток примерно в 5 раз, примерно в 10 раз, примерно в 15 раз или более. Таким образом, помимо более высокой средней экспрессии гена, повышение процента очень высокоэкспрессирующих клеток, а также встречаемости стабильных ("устойчивых") колоний (примерно 100%, примерно 200%, примерно 300% или примерно 400% или большее повышение и/или более низкая вариабельность экспрессии (снижение cv (коэффициента вариации) примерно на 30%, примерно на 40%, примерно на 50% или более)) находится в пределах объема настоящего изобретения.

Конструкция MAR или подобная конструкция может "усиливать стабильность экспрессии". Это "усиление" является относительным к экспрессии, например, гена, экспрессируемого в эквивалентных условиях во всем остальном, но в отсутствие такой конструкции MAR/последовательности MAR. Усиление стабильности может, например, поддерживать 100% усиление вплоть до примерно 5, 10, 20, 25, 30, 35, 40, 45 или 50 недель. Конструкция MAR може