Сульфонилмочевина-реактивные репрессорные белки
Иллюстрации
Показать всеИзобретение относится к биохимии и представляет собой выделенный полипептид, содержащий сульфонилмочевина-реактивный репрессор, который специфично связывается с полинуклеотидом, содержащим операторную последовательность, где связывание регулируется соединением сульфонилмочевины и где указанный полипептид содержит аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности SEQ ID NO:1233. Изобретение также относится к полинуклеотиду, кодирующему полипептид, а также к клетке, трансформированной полинуклеотидом. Также предложен способ регуляции транскрипции целевого полинуклеотида в клетке с использованием заявленного полинуклеотида. 4 н. и 27 з.п. ф-лы, 29 табл., 7 пр., 11 ил.
Реферат
Область техники, к которой относится изобретение
Изобретение относится к области молекулярной биологии, более конкретно к регуляции экспрессии генов.
Уровень техники
Тетрациклиновая оперонная система, включающая репрессорные и операторные элементы, первоначально была выделена из бактерий. Оперонная система строго регулируется присутствием тетрациклина, и самостоятельно регулирует уровень экспрессии генов tetA и tetR. Продукт tetA удаляет тетрациклин из клетки. Продукт tetR представляет собой репрессорный белок, который связывается с операторными элементами с Kd приблизительно 10 пМ в отсутствие тетрациклина, блокируя, таким образом, экспрессию tetA и tetR.
Данная система была модифицирована с целью регуляции экспрессии других целевых полинуклеотидов и/или применения в других организмах, главным образом, для применения в животных системах. Системы на основе Tet оперона находили ограниченное применение в растениях по меньшей мере частично из-за проблем с индукторами, которые обычно являются антибиотическими соединениями и чувствительны к свету.
Существует потребность в регуляции экспрессии целевых последовательностей в организмах, предложены композиции и способы для строгой регуляции экспрессии под действием соединений сульфонилмочевины.
Сущность изобретения
Предложены композиции и способы, относящиеся к применению сульфонилмочевина-реактивных репрессоров. Композиции включают полипептиды, которые специфично связываются с оператором, где специфичное связывание регулируется соединением сульфонилмочевины. Композиции также включают полинуклеотиды, кодирующие полипептиды, а также конструкции, векторы, прокариотические и эукариотические клетки и эукариотические организмы, включая растения и семена, включающие полинуклеотид и/или полученные с применением способов. Также предложены способы введения сульфонилмочевина-реактивных репрессоров в клетку или организм и регуляции экспрессии целевого полинуклеотида в клетке или организме, включая клетку растения или растение.
Краткое описание фигур
Фигура 1. Связывание тетрациклин-Mg++ и соединения сульфонилмочевины Harmony® (тифенсульфурон-метил; Ts) в связывающем кармане TetR класса D на основании кристаллической структуры 1 DU7 из Protein Databank (PDB).
Фигура 2. Схема примерного вектора экспрессии tetR на основе E. coli, pVER7314. Репликон основан на репликоне из pBR322. Кодирующая последовательность лиганд-связывающего домена TetR (LBD) фланкирована сайтами SacI и AscI. KMsp172 и KMsp173 представляют собой участки связывания праймеров, используемых для секвенирования ДНК встроенных генов tetR. rrnB T1 T2 является сильным терминатором транскрипции, ингибирующим круговую транскрипцию и нерегулируемую экспрессию tetR.
Фигура 3. Ответ хитов в библиотеке 1 при обработке 20 мкг/мл тифенсульфурон-метила (Ts). Клетки E. coli KM3, несущие предполагаемые хиты tetR L1-1 - L1-20, или tetR дикого типа, сеяли на чашки со средой для анализа M9 +/-20 мкг/мл Ts с последующим инкубированием при 30°C до появления синих/белых колоний. В указанный момент делали снимок колоний и определяли относительную β-галактозидазную активность по степени синего цвета колонии.
Фигура 4. Относительная β-галактозидазная активность 45 предполагаемых хитов библиотеки L4 при 0, 0,2 и 1,0 м.д. этаметсульфурона (Es). Индуцированную активность измеряли при использовании 5 мкл смеси перфорированных цельных клеток, а фоновую активность измеряли при использовании 25 мкл смеси перфорированных цельных клеток, чтобы регистрируемую активность можно было измерять в одной временной рамке для всех обработок. Фоновые значения активности умножали на 10 для приведения их в соответствие с диапазоном графика. Правая сторона графика содержит контрольные образцы - TetR дикого типа и хит 1-го раунда L1-9.
Фигура 5. Индукция β-галактозидазы этаметсульфуроном в хитах L7. Лучшие варианты из библиотеки L7 перегруппировывали и тестировали в формате культуры в 96-луночном планшете для сравнения относительной индукции при использовании 0,02 мкг/мл и 0,2 мкг/мл индуктора (Es), и для сравнения фоновой активности в отсутствие индуктора. Индуцированную активность оценивали при использовании 5 мкл смеси перфорированных клеток, тогда как 25 мкл клеток использовали для определения фоновой активности. Это позволило измерить все измеряемые активности в одной временной рамке для всех обработок. Фоновые значения активности умножали на десять для приведения их в соответствие с диапазоном графика. В правой части графика показаны контрольные образцы: хиты 2-го раунда L4-89 и L4-120, а также TetR(B) дикого типа с этаметсульфуроном, а также TetR дикого типа с 0,4 мкM atc в качестве родственного индуктора для сравнения (столбик с диагональной штриховкой). Код лунки указан наклонным текстом, согласно коду при перегруппировке в анализе, тогда как исходный код клона указан ниже горизонтальным текстом.
Фигура 6. Эффект дозы этаметсульфурона двух вариантов EsR, определенных транзиентной экспрессией в листьях Nicotiana benthamiana. Черные столбики обозначают TetR дикого типа, серые столбики обозначают хит EsR A11, и белые столбики обозначают хит EsR D01. Заштрихованный столбик обозначают контроль без репрессора, который указывает максимальный уровень репортерной экспрессии в анализе.
Фигура 7. Связывание ДНК с tetOp в отсутствие или в присутствии лиганда. Пять пмоль TetO или контрольной ДНК смешивали с указанными количествами репрессорного белка и индуктора в сложном буфере, содержащем 20 мМ Трис-HCl (pH 8,0) и 10 мМ ЭДТА.
Фигура 8. Структуры примерных зарегистрированных соединений сульфонилмочевины.
Фигура 9. Обобщение разнообразия источников, дизайна библиотек, а также разнообразия хитов и смещения популяции для нескольких поколений сульфонилмочевина-репрессорных шаффлинг-библиотек. Черта ("-") указывает отсутствие аминокислотного разнообразия, введенного в данном положении в библиотеке. X указывает, что олиги библиотеки были созданы для введения полного аминокислотного разнообразия (любая из 20 аминокислот) в данном положении в библиотеке. Остатки, выделенные жирным шрифтом, указывают замещение в ходе селекции, при этом больший размер шрифта соответствует большей степени замещения в отобранной популяции. Остатки в круглых скобках указывают отобранные мутации. Пул филогенетического разнообразия получен из широкого семейства 34 последовательностей репрессора тетрациклина.
Фигура 10. Депрессия флуоресцентного репортера под действием сульфонилмочевины в каллусе кукурузы (A) или растениях (B).
Фигура 11. Индукция β-галактозидазы этаметсульфуроном в примерных вариантах L13.
Подробное описание
Химически регулируемые инструменты экспрессии оказались ценными при изучении функции и регуляции генов во многих биологических системах. Данные системы позволяют тестировать эффект экспрессии любого целевого гена в культуральной системе или цельном организме, когда трансген нельзя специфически регулировать или непрерывно экспрессировать вследствие негативных последствий. Указанные системы по существу обеспечивают возможность проведения "пульс" или "пульс-чейз" тестирования экспрессии генов. Система экспрессии, опосредованной химическим выключателем, позволяет исследовать геномные, протеомные и/или метаболические ответы непосредственно после активации целевого гена. Подобные типы тестов невозможно провести с использованием конститутивных, экспериментальных или тканеспецифических систем экспрессии. Технологии химических выключателей также могут обеспечивать средство для генной терапии.
Системы химических выключателей могут применяться коммерчески, например, в сельскохозяйственной биотехнологии. В сельскохозяйственных целях предпочтительно обеспечить возможность контроля экспрессии и/или генетического потока трансгенов в окружающей среде, например, генов устойчивости к гербицидам, особенно в тех случаях, когда существуют дикие родственные формы целевых культур. Кроме того, наличие семейства жизнеспособных механизмов химического выключения позволило бы управлять арсеналом признаков из одной трансгенной культуры, например, одна продуктивная линия могла бы использоваться для предоставления выбранных признаков по желанию заказчика через определенную химическую активацию. Кроме того, получение гибридных семян можно было бы упростить с применением химического контроля в работе с гибридами.
Система выключателя генов на основе Tet-репрессора (TetR), широко используемая в животных системах, находила ограниченное применение в растительных генетических системах частично из-за сложностей, связанных с активаторными лигандами. TetR был модифицирован, чтобы узнавать коммерческие производные сульфонилмочевины вместо производных тетрациклина, с сохранением способности специфично связываться с последовательностями тетрациклинового оператора. Это было достигнуто путем модификации лиганд-связывающего домена Tet-репрессора с применением рационального моделирования белка и ДНК-шаффлинга ("перетасовки") для получения возможности узнавать коммерческие производные сульфонилмочевины. Первичная перетасовка TetR и скрининг с использованием чувствительного in vivo β-галактозидазного теста привели к специфичному узнаванию гербицида Harmony® (тифенсульфурон-метила) при концентрации 20 м.д. в ростовой среде и потере узнавания тетрациклина. После тестирования с другими соединениями сульфонилмочевины, многие из хитов, реактивных по отношению к Harmony®, также отвечали на другие соединения SU. В некоторых случаях, хиты обладали еще более высокой реактивностью в отношении родственных гербицидов хлорсульфурона и этаметсульфурона (2 м.д.). Последующие раунды шаффлинга и скрининга производных TetR приводили к вариантам TetR, которые сильно реагировали с 0,2 м.д. хлорсульфурона и 0,02 м.д. этаметсульфурона, согласно измерению с использованием in vivo анализов индукции в E. coli. Наиболее активные SuR варианты, чувствительные к этаметсульфурону (EsR), демонстрировали способность к индукции, почти равную соответствующей способности к индукции TetR класса B дикого типа ангидротетрациклином (atc) при использовании подобных концентраций индуктора. Указанные молекулы SuR не обладают активностью в отношении тетрациклинов, при этом TetR(B) дикого типа (SEQ ID NO: 2) не обладает активностью в отношении сульфонилмочевин.
Предложены композиции и способы, касающиеся применения сульфонилмочевина-реактивных репрессоров. Сульфонилмочевина-реактивные репрессоры (SuR) включают любой репрессорный полипептид, связывание которого с операторной последовательностью регулируется лигандом, который включает соединение сульфонилмочевины. В некоторых примерах репрессор специфично связывается с оператором в отсутствие лиганда, соединения сульфонилмочевины. В некоторых примерах репрессор специфично связывается с оператором в присутствии лиганда, соединения сульфонилмочевины. Репрессоры, которые связываются с оператором в присутствии лиганда, иногда называются обратными репрессорами. В некоторых примерах композиции включают SuR полипептиды, которые специфично связываются с тетрациклиновым оператором, где специфичное связывание регулируется соединением сульфонилмочевины. В некоторых примерах композиции включают выделенный сульфонилмочевина-репрессорный (SuR) полипептид, включающий, по меньшей мере, одну аминокислотную замену в лиганд-связывающем домене тетрациклинового репрессорного белка дикого типа, где полипептид SuR или его мультимер специфично связываются с полинуклеотидом, включающим операторную последовательность, где связывание репрессора-оператора регулируется отсутствием или присутствием соединения сульфонилмочевины. В некоторых примерах композиции включают выделенные сульфонилмочевинные репрессоры, включающие лиганд-связывающий домен, включающий, по меньшей мере, одну аминокислотную замену в лиганд-связывающем домене репрессорного тетрациклинового белка дикого типа, слитом с гетерологичным операторным ДНК-связывающим доменом, который специфично связывается с полинуклеотидом, включающим операторную последовательность или ее производную, где связывание репрессора-оператора регулируется отсутствием или присутствием соединения сульфонилмочевины. Может использоваться любой операторный ДНК-связывающий домен, включая, помимо прочего, операторный ДНК-связывающий домен из репрессоров, включающих tet, lac, trp, phd, arg, LexA, phiCh1 репрессор, лямбда C1 и Cro репрессоры, репрессор фага X, MetJ, phir1t rro, phi434 C1 и Cro репрессоры, RafR, gal, ebg, uxuR, exuR, ROS, SinR, PurR, FruR, P22 C2, TetC, AcrR, Betl, Bm3R1, EnvR, QacR, MtrR, TcmR, Ttk, YbiH, YhgD и mu Ner, или ДНК-связывающие домены в семействе Interpro, включая, помимо прочего, IPR001647, IPR010982 и IPR011991.
В некоторых примерах композиции включают выделенные сульфонилмочевина-репрессорные (SuR) полипептиды, включающие, по меньшей мере, одну аминокислотную замену в репрессорном тетрациклиновом белке дикого типа, где полипептид SuR или его мультимер специфично связываются с полинуклеотидом, включающим последовательность тетрациклинового оператора, где связывание репрессора-оператора регулируется отсутствием или присутствием соединения сульфонилмочевины.
Репрессоры дикого типа включают тетрациклиновые репрессоры класса A, B, C, D, E, G, H, J и Z. Пример класса TetR(A) присутствует в транспозоне 1721 Tn и депонирован под номером GenBank X61307, перекрестная ссылка gi48198, с соответствующим кодируемым белком под номером CAA43639, перекрестная ссылка gi48195, и под номером UniProt Q56321. Пример класса TetR(B) присутствует в транспозоне Tn10 и депонирован под номером GenBank X00694, перекрестная ссылка gi43052, с соответствующим кодируемым белком под номером CAA25291, перекрестная ссылка gi43052, и под номером UniProt P04483. Пример класса TetR(C) присутствует в плазмиде pSC101 и депонирован под номером GenBank M36272, перекрестная ссылка gi150945, с соответствующим кодируемым белком под номером AAA25677, перекрестная ссылка gi150946. Пример класса TetR(D) присутствует в Salmonella ordonez и депонирован под номером GenBank X65876, перекрестная ссылка gi49073, с соответствующим кодируемым белком под номером CAA46707, перекрестная ссылка gi49075, и под номером UniProt P0ACT5 и P09164. Пример класса TetR(E) был выделен из транспозона Tn10 E. coli и депонирован под номером GenBank M34933, перекрестная ссылка gi155019, с соответствующим кодируемым белком под номером AAA98409, перекрестная ссылка gi155020. Пример класса TetR(G) был выделен из Vibrio anguillarium и депонирован под номером GenBank S52438, перекрестная ссылка gi262928, с соответствующим кодируемым белком под номером AAB24797, перекрестная ссылка gi262929. Пример класса TetR(H) присутствует в плазмиде pMV111, выделенной из Pasteurella multocida и депонированной под номером GenBank U00792, перекрестная ссылка gi392871, с соответствующим кодируемым белком под номером AAC43249, перекрестная ссылка gi392872. Пример класса TetR(J) был выделен из Proteus mirabilis и депонирован под номером GenBank AF038993, перекрестная ссылка gi4104704, с соответствующим кодируемым белком под номером AAD12754, перекрестная ссылка gi4104706. Пример класса TetR(Z) был найден в плазмиде pAGI, выделенной из Corynebacterium glutamicum, и депонирован номером GenBank AF121000, перекрестная ссылка gi4583389, с соответствующим кодируемым белком под номером AAD25064, перекрестная ссылка gi4583390. В некоторых примерах тетрациклиновый репрессор дикого типа является тетрациклиновым репрессорным белком класса B. В некоторых примерах тетрациклиновый репрессор дикого типа является тетрациклиновым репрессорным белком класса D.
В некоторых примерах сульфонилмочевина-репрессорные (SuR) полипептиды включают аминокислотную замену в лиганд-связывающем домене тетрациклинового репрессорного белка дикого типа. В TetR белках дикого типа классов B и D аминокислотные остатки 6-52 представляют собой ДНК-связывающий домен. Остальная часть белка участвует в связывании лиганда и последующей аллостерической модификации. Что касается TetR класса B, остатки 53-207 представляют собой лиганд-связывающий домен, тогда как в TetR класса D остатки 53-218 составляют лиганд-связывающий домен. В некоторых примерах SuR полипептиды включают аминокислотную замену в лиганд-связывающем домене белка TetR(B) дикого типа. В некоторых примерах SuR полипептиды включают аминокислотную замену в лиганд-связывающем домене белка TetR(B) дикого типа SEQ ID NO: 1.
В некоторых примерах выделенные SuR полипептиды включают аминокислоту или любую комбинацию аминокислот, соответствующую эквивалентным аминокислотным положениям, выбранным из разнообразия аминокислот, показанных на Фигуре 9, где положение аминокислотного остатка, показанного на Фигуре 9, соответствует аминокислотной нумерации TetR(B) дикого типа. В некоторых примерах выделенные SuR полипептиды включают лиганд-связывающий домен, включающий, по меньшей мере, 10%, 20%, 30%, 40%, 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% аминокислотных остатков, показанных на Фигуре 9, где положение аминокислотного остатка соответствует эквивалентному положению при использовании аминокислотной нумерации TetR(B) дикого типа. В некоторых примерах выделенные SuR полипептиды включают, по меньшей мере, 10%, 20%, 30%, 40%, 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% аминокислотных остатков, показанных на Фигуре 9, где положение аминокислотного остатка соответствует эквивалентному положению при использовании аминокислотной нумерации TetR(B) дикого типа. В некоторых примерах TetR(B) дикого типа соответствует SEQ ID NO:1.
В некоторых примерах выделенный полипептид SuR включает лиганд-связывающий домен, включающий аминокислотную замену в положении остатка, выбранном из группы, состоящей из положения 55, 60, 64, 67, 82, 86, 100, 104, 105, 108, 113, 116, 134, 135, 138, 139, 147, 151, 170, 173, 174, 177 и любой их комбинации, где положение аминокислотного остатка и замена соответствуют эквивалентному положению при использовании аминокислотной нумерации TetR(B) дикого типа. В некоторых примерах выделенный полипептид SuR дополнительно включает аминокислотную замену в положении остатка, выбранном из группы, состоящей из 109, 112, 117, 131, 137, 140, 164 и любой их комбинации. В некоторых примерах TetR(B) дикого типа соответствует SEQ ID NO: 1.
В некоторых примерах выделенные SuR полипептиды включают лиганд-связывающий домен, включающий, по меньшей мере, 10%, 20%, 30%, 40%, 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% аминокислотных остатков, выбранных из группы, состоящей из:
(a) M или L в положении аминокислотного остатка 55;
(b) A, L или M в положении аминокислотного остатка 60;
(c) A, N, Q, L или H в положении аминокислотного остатка 64;
(d) M, I, L, V, F или Y в положении аминокислотного остатка 67;
(e) N, S или T в положении аминокислотного остатка 82;
(f) F, M, W или Y в положении аминокислотного остатка 86;
(g) C, V, L, M, F, W или Y в положении аминокислотного остатка 100;
(h) R, A или G в положении аминокислотного остатка 104
(i) A, I, V, F или W в положении аминокислотного остатка 105;
(j) Q или K в положении аминокислотного остатка 108;
(k) A, M, H, K, T, P или V в положении аминокислотного остатка 113;
(l) I, L, M, V, R, S, N, P или Q в положении аминокислотного остатка 116;
(m) I, L, V, M, R, S или W в положении аминокислотного остатка 134;
(n) R, S, N, Q, K или А в положении аминокислотного остатка 135;
(o) A, C, G, H, I, V, R или T в положении аминокислотного остатка 138;
(p) A, G, I, V, M, W, N, R или T в положении аминокислотного остатка 139;
(q) I, L, V, F, W, T, S или R в положении аминокислотного остатка 147;
(r) M, L, W, Y, K, R или S в положении аминокислотного остатка 151;
(s) I, L, V или А в положении аминокислотного остатка 170;
(t) A, G или V в положении аминокислотного остатка 173;
(u) L, V, W, Y, H, R, K или S в положении аминокислотного остатка 174; и,
(v) A, G, I, L, Y, K, Q или S в положении аминокислотного остатка 177,
где положение аминокислотного остатка соответствует эквивалентному положению при использовании аминокислотной нумерации TetR(B) дикого типа. В некоторых примерах выделенные SuR полипептиды включают, по меньшей мере, 10%, 20%, 30%, 40%, 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% аминокислотных остатков, выбранных из аминокислотных остатков, перечисленных в (a)-(v) выше, где положение аминокислотного остатка соответствует эквивалентному положению при использовании аминокислотной нумерации TetR(B) дикого типа. В некоторых примерах TetR(B) дикого типа соответствует SEQ ID NO:1.
В некоторых примерах выделенные SuR полипептиды, выбранные из-за своей повышенной активности по отношению к хлорсульфурону, включают лиганд-связывающий домен, включающий, по меньшей мере, 10%, 20%, 30%, 40%, 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% аминокислотных остатков, выбранных из группы, состоящей из:
(a) M в положении аминокислотного остатка 60;
(b) A или Q в положении аминокислотного остатка 64;
(c) M, F, Y, I, V или L в положении аминокислотного остатка 67;
(d) N или T в положении аминокислотного остатка 82;
(e) M в положении аминокислотного остатка 86;
(f) C или W в положении аминокислотного остатка 100;
(g) W в положении аминокислотного остатка 105;
(h) Q или K в положении аминокислотного остатка 108;
(i) M, Q, L или H в положении аминокислотного остатка 109;
(j) G, A, S или T в положении аминокислотного остатка 112;
(k) A в положении аминокислотного остатка 113;
(l) M или Q в положении аминокислотного остатка 116;
(m) M или V в положении аминокислотного остатка 134;
(n) G или R в положении аминокислотного остатка 138;
(o) N или V в положении аминокислотного остатка 139;
(p) F в положении аминокислотного остатка 147;
(q) S или L в положении аминокислотного остатка 151;
(r) A в положении аминокислотного остатка 164;
(s) A, L или V в положении аминокислотного остатка 170;
(t) A, G или V в положении аминокислотного остатка 173;
(u) L или W в положении аминокислотного остатка 174; и
(v) K в положении аминокислотного остатка 177,
где положение аминокислотного остатка соответствует эквивалентному положению при использовании аминокислотной нумерации TetR(B) дикого типа. В некоторых примерах выделенные SuR полипептиды включают, по меньшей мере, 10%, 20%, 30%, 40%, 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% аминокислотных остатков, выбранных из аминокислотных остатков, перечисленных в (a)-(v) выше, где положение аминокислотного остатка соответствует эквивалентному положению при использовании аминокислотной нумерации TetR(B) дикого типа. В некоторых примерах TetR(B) дикого типа соответствует SEQ ID NO: 1.
В некоторых примерах выделенные SuR полипептиды, выбранные из-за своей повышенной активности по отношению к этаметсульфурону, включают лиганд-связывающий домен, включающий, по меньшей мере, 10%, 20%, 30%, 40%, 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% аминокислотных остатков, выбранных из группы, состоящей из:
(a) M или L в положении аминокислотного остатка 55;
(b) A в положении аминокислотного остатка 64;
(c) M, Y, F, I, L или V в положении аминокислотного остатка 67;
(d) M в положении аминокислотного остатка 86;
(e) C в положении аминокислотного остатка 100;
(f) G в положении аминокислотного остатка 104;
(g) F в положении аминокислотного остатка 105;
(h) Q или K в положении аминокислотного остатка 108;
(i) Q, M, L или H в положении аминокислотного остатка 109;
(j) S, T, G или А в положении аминокислотного остатка 112;
(k) A в положении аминокислотного остатка 113;
(l) S в положении аминокислотного остатка 116;
(m) M или L в положении аминокислотного остатка 117;
(n) M или L в положении аминокислотного остатка 131;
(o) M в положении аминокислотного остатка 134;
(p) Q в положении аминокислотного остатка 135;
(q) A или V в положении аминокислотного остатка 137;
(r) C или G в положении аминокислотного остатка 138;
(s) I в положении аминокислотного остатка 139;
(t) F или Y в положении аминокислотного остатка 140;
(u) L в положении аминокислотного остатка 147;
(v) L в положении аминокислотного остатка 151;
(w) A в положении аминокислотного остатка 164;
(x) V, A или L в положении аминокислотного остатка 170;
(y) G, A или V в положении аминокислотного остатка 173
(z) L в положении аминокислотного остатка 174; и
(aa) N или K в положении аминокислотного остатка 177,
где положение аминокислотного остатка соответствует эквивалентному положению при использовании аминокислотной нумерации TetR(B) дикого типа. В некоторых примерах выделенные SuR полипептиды включают, по меньшей мере, 10%, 20%, 30%, 40%, 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% аминокислотных остатков, выбранных из аминокислотных остатков, перечисленных в (a)-(aa) выше, где положение аминокислотного остатка соответствует эквивалентному положению при использовании аминокислоты нумерации TetR(B) дикого типа. В некоторых примерах TetR(B) дикого типа соответствует SEQ ID NO:1.
В некоторых примерах выделенный SuR полипептид обладает, по меньшей мере, приблизительно 50%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% идентичностью последовательности с лиганд-связывающим доменом TetR(B) дикого типа, представленным в качестве примера аминокислотными остатками 53-207 из SEQ ID NO:1, где идентичность последовательности определена по полной длине лиганд-связывающего домена с применением метода глобального выравнивания. В некоторых примерах в методе глобального выравнивания используется алгоритм GAP с параметрами по умолчанию для % идентичности и % подобия аминокислотной последовательности, с использованием GAP Weight (вес открытия пропуска) 8 и Length Weight (вес продления пропуска) 2, а также матрицы замен BLOSUM62.
В некоторых примерах выделенный SuR полипептид обладает, по меньшей мере, приблизительно 50%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% идентичности последовательности с TetR(B) дикого типа, представленным в качестве примера SEQ ID NO:1, где идентичность последовательности определена по полной длине полипептида при использовании метода глобального выравнивания. В некоторых примерах в методе глобального выравнивания используется алгоритм GAP с параметрами по умолчанию для % идентичности и % подобия аминокислотной последовательности, с использованием GAP Weight 8 и Length Weight 2, а также матрицы замен BLOSUM62.
Композиции включают выделенные SuR полипептиды, обладающие, по меньшей мере, приблизительно 50%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% идентичностью последовательности с лиганд-связывающим доменом SuR полипептида, выбранного из группы, состоящей из SEQ ID NO:3-401, 1206-1213, 1228-1233 или 1240-1243, где идентичность последовательности определена по полной длине лиганд-связывающего домена при использовании метода глобального выравнивания. В некоторых примерах в методе глобального выравнивания используется алгоритм GAP с параметрами по умолчанию для % идентичности и % подобия аминокислотной последовательности, с использованием GAP Weight 8 и Length Weight 2, а также матрицы замен BLOSUM62.
В некоторых примерах выделенный SuR полипептид обладает, по меньшей мере, приблизительно 50%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% идентичностью последовательности с SuR полипептидом, выбранным из группы, состоящей из SEQ ID NO:3-401, 1206-1213, 1228-1233 или 1240-1243, где идентичность последовательности определена по полной длине полипептида при использовании метода глобального выравнивания. В некоторых примерах в методе глобального выравнивания используется алгоритм GAP с параметрами по умолчанию для % идентичности и % подобия аминокислотной последовательности, с использованием GAP Weight 8 и Length Weight 2, а также матрицы замен BLOSUM62.
В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L7-1A04 (SEQ ID NO: 220), с получением числа битов BLAST, по меньшей мере, 200, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 700 или 750, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L7-1A04 (SEQ ID NO:220), с получением числа битов BLAST, по меньшей мере, 374, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L7-1A04 (SEQ ID NO:220), с получением процента идентичности последовательности, по меньшей мере, 50%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% идентичности последовательности, где идентичность последовательности определена с помощью выравнивания BLAST при использовании матрицы BLOSUM62, штрафа за внесение пропуска 11 и штрафа за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L7-1A04 (SEQ ID NO:220), с получением процента идентичности последовательности, по меньшей мере, 88% идентичности последовательности, где идентичность последовательности определена при выравнивании BLAST с использованием матрицы BLOSUM62, штрафа за внесение пропуска 11 и штрафа за удлинение пропуска 1. В некоторых примерах процент идентичности определяется с применением метода глобального выравнивания при использовании алгоритма GAP с параметрами по умолчанию для % идентичности и % подобия аминокислотной последовательности, с использованием GAP Weight 8 и Length Weight 2, а также матрицы замен BLOSUM62. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L7-1A04 (SEQ ID NO: 220), с получением значения подобия BLAST, по меньшей мере, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 700, 750, 800, 850, 900, 910, 920, 930, 940, 950, 960, 970, 980, 990, 1000, 1010, 1020, 1030, 1040, 1050, 1060, 1070, 1080, 1090, 1100, 1110, 1120, 1130, 1140, 1150, 1160, 1170, 1180, 1190 или 1200, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L7-1A04 (SEQ ID NO:220), с получением значения величины E (e-value) BLAST, по меньшей мере, e-60, e-70, e-75, e-80, e-85, e-90, e-95, e-100, e-105, e-106, e-107, e-108, e-109, e-110, e-111, e-112, e-113, e-114, e-115, e-116, e-117, e-118, e-119, e-120 или e-125, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах полипептид выбран из группы, состоящей из SEQ ID NO:3-401, 1206-1213, 1228-1233 или 1240-1243.
В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-22 (SEQ ID NO:7), с получением числа битов BLAST, по меньшей мере, 200, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 700 или 750, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-22 (SEQ ID NO:7), с получением числа битов BLAST, по меньшей мере, 387, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-22 (SEQ ID NO:7), с получением процента идентичности последовательности, по меньшей мере, 50%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% идентичности последовательности, где идентичность последовательности определена с применением выравнивания BLAST при использовании матрицы BLOSUM62, штрафа за внесение пропуска 11 и штрафа за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-22 (SEQ ID NO:7), с получением процента идентичности последовательности, по меньшей мере, 92% идентичности последовательности, где идентичность последовательности определена при выравнивании BLAST с использованием матрицы BLOSUM62, штрафа за внесение пропуска 11 и штрафа за удлинение пропуска 1. В некоторых примерах идентичность процента определена с применением метода глобального выравнивания при использовании алгоритма GAP с параметрами по умолчанию для % идентичности и % подобия аминокислотной последовательности, с использованием GAP Weight 8 и Length Weight 2, а также матрицы замен BLOSUM62. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-22 (SEQ ID NO:7), с получением значения подобия BLAST, по меньшей мере, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 700, 750, 800, 850, 900, 910, 920, 930, 940, 950, 960, 970, 980, 990, 1000, 1010, 1020, 1030, 1040, 1050, 1060, 1070, 1080, 1090, 1100, 1110, 1120, 1130, 1140, 1150, 1160, 1170, 1180, 1190 или 1200, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-22 (SEQ ID NO:7), с получением значения E BLAST, по меньшей мере, e-60, e-70, e-75, e-80, e-85, e-90, e-95, e-100, e-105, e-106, e-107, e-108, e-109, e-110, e-111, e-112, e-113, e-114, e-115, e-116, e-117, e-118, e-119, e-120 или e-125, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах полипептид выбран из группы, состоящей из SEQ ID NO:3-401, 1206-1213, 1228-1233 или 1240-1243.
В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-29 (SEQ ID NO:10), с получением числа битов BLAST, по меньшей мере, 200, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 700 или 750, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-29 (SEQ ID NO:10), с получением числа битов BLAST, по меньшей мере, 393, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-29 (SEQ ID NO:10), с получением процента идентичности последовательности, по меньшей мере, 50%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% идентичности последовательности, где идентичность последовательности определена при выравнивании BLAST с использованием матрицы BLOSUM62, штрафа за внесение пропуска 11 и штрафа за удлинение пропуска 1. В некоторых примерах процент идентичности определен с применением метода глобального выравнивания при использовании алгоритма GAP с параметрами по умолчанию для % идентичности и % подобия аминокислотной последовательности, с использованием GAP Weight 8 и Length Weight 2, а также матрицы замен BLOSUM62. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-29 (SEQ ID NO:10), с получением значения подобия BLAST, по меньшей мере, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 700, 750, 800, 850, 900, 910, 920, 930, 940, 950, 960, 970, 980, 990, 1000, 1010, 1020, 1030, 1040, 1050, 1060, 1070, 1080, 1090, 1100, 1110, 1120, 1130, 1140, 1150, 1160, 1170, 1180, 1190 или 1200, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1. В некоторых примерах SuR полипептиды включают аминокислотную последовательность, которая может быть оптимально выровнена с последовательностью полипептида L1-29 (SEQ ID NO:10), с получением значения подобия BLAST, по меньшей мере, 1006, где в BLAST выравнивании используется матрица BLOSUM62, штраф за внесение пропуска 11 и штраф за удлинение пропуска 1