Улучшенные n-терминальные кэппинг модули для сконструированных белков с анкириновым повтором
Иллюстрации
Показать всеНастоящее изобретение относится к области биотехнологии, конкретно к N-терминальным кэппирующим модулям для белков. Полученные N-терминальные кэппинг-модули для сконструированных белков с анкириновым повтором (DARPin) обеспечивают их большую термальную стабильность DARPin по сравнению с немодифицированным белком. 5 н. и 16 з.п. ф-лы, 3 пр., 1 табл., 4 ил.
Реферат
Область, к которой относится изобретение
Настоящее изобретение относится к улучшенным N-терминальным кэппинг модулям для сконструированных белков с анкириновым повтором (DARPin), которые придают улучшенную термальную стабильность DARPin, а также к нуклеиновым кислотам, кодирующим такие белки, фармацевтическим композициям, включающим такие белки и применению таких белков в лечении заболеваний.
Предпосылки создания изобретения
Кроме антител существуют новые связывающие белки или связывающие домены, которые могут использоваться для специфического связывания целевой молекулы (например, Binz, H.K., Amstutz, Р. и Plückthun, A., Nat. Biotechnol. 23, 1257-1268, 2005). Один такой новый класс связывающих белков или связывающих доменов основывается на сконструированных белках повторов или сконструированных повторяемых доменах (WO 2002/020565; Binz, H.K., Amstutz, P., Kohl, A., Stumpp, M.T., Briand, C., Forrer, P., Grütter, M.G., и Plückthun, A., Nat. Biotechnol. 22, 575-582, 2004; Stumpp, M.T., Binz, H.K и Amstutz, P., Drug Discov. Today 13, 695-701, 2008). WO 2002/020565 описывает, как могут быть сконструированы библиотеки белков повторов и их общее применение. Такие сконструированные повторяемые домены используют модулярную природу белков повторов и имеют N-терминальные и C-терминальные кэппинг модули для предотвращения агрегации сконструированных повторяемых доменов путем экранирования гидрофобного ядра домена (Forrer, P., Stumpp, М.Т., Binz, H.K. и Plückthun, A., FEBS letters 539, 2-6, 2003). Эти кэппинг модули основываются на кэппирующих повторах природного гуанин-аденин-связывающего белка (GA-связывающего белка). Было показано, что термальная и термодинамическая стабильность этих доменов сконструированных анкириновых повторов может быть дополнительно повышена путем усовершенствования С-терминального кэппирующего повтора, который имеет происхождение от GA-связывающего белка (Interlandi, G., Wetzel, S.K, Settanni, G., Plückthun, А. и Caflisch, A., J. Mol. Biol. 375, 837-854, 2008; Kramer, M.A, Wetzel, S.K., Plückthun, A., Mittl, P.R.E, и Grütter, M.G., J. Mol. Biol. 404, 381-391, 2010). Авторы вводили в общей сложности восемь мутаций в этот кэппинг модуль и удлиняли его C-терминальную спираль путем прибавления трех различных аминокислот. Тем не менее, введение этих модификаций в C-терминальный кэппинг модуль приводило к тенденции нежелательной димеризации сконструированного повторяемого домена, который несет этот мутированный C-терминальный кэппинг модуль. Таким образом, существует необходимость в получении дополнительных оптимизированных C-терминальных кэппинг модулей или C-терминальных кэппирующих повторов сконструированных доменов анкиринового повтора.
В общем случае, существует потребность в специфических для мишени улучшенных белках с анкириновым повтором с улучшенной стабильностью для лечения рака и других патологических состояний.
Техническая проблема, которая лежит в основе настоящего изобретения, заключается в идентификации новых белков с анкириновыми повторами с улучшенной стабильностью для улучшенного лечения рака и других патологических состояний. Решение этой технической проблемы достигается путем обеспечения воплощений, охарактеризованных в формуле изобретения.
Краткое изложение сущности изобретения
Настоящее изобретение относится к связывающему белку, включающему, по крайней мере, один домен анкиринового повтора, где указанный домен анкиринового повтора включает N-терминальный кэппирующий модуль, имеющий аминокислотную последовательность
GSDLGKKLLE AARAGQDDEV RILLKAGADV NA (SEQ ID NO: 14) или
GSDLGKKLLE AARAGQDDEV RELLKAGADV NA (SEQ ID NO: 15), в которой аминокислотный остаток L в положении 24 последовательности SEQ ID NO: 14 или SEQ ID NO: 15 является необязательно замененным V, I или A;
вплоть до 9 аминокислот SEQ ID NO: 14 или SEQ ID NO: 15 в других положениях, отличных от положения 24, необязательно являются замененными любыми аминокислотами; и
в котором G в положении 1 и/или S в положении 2 SEQ ID NO: 14 или SEQ ID NO: 15 являются необязательно отсутствующими.
В частности, изобретение относится к связывающему белку, где указанный N-терминальный кэппирующий модуль включает последовательность GSX1LX2KKLLE AARAGQDDEV X3X4LX5X6X7GADV NA (SEQ ID NO: 5), в которой G в положении 1 и/или S в положении 2 последовательности SEQ ID NO: 5 являются необязательно отсутствующими;
X1 представляет собой аминокислотный остаток G, A, или D;
X2 представляет собой аминокислотный остаток G или D;
X3 представляет собой аминокислотный остаток R или E;
X4 представляет собой аминокислотный остаток I, Е или V;
X5 представляет собой аминокислотный остаток L, V, I или A;
X6 представляет собой аминокислотный остаток A, K или E; и
X7 представляет собой аминокислотный остаток, выбранный из группы, состоящей из A, H, Y, K и R.
В другом воплощении изобретение относится к связывающему белку, включающему, по крайней мере, один домен анкиринового повтора, где указанный домен анкиринового повтора включает N-терминальный кэппирующий модуль, имеющий аминокислотную последовательность, по крайней мере, с 70%-ной идентичностью аминокислотной последовательности с последовательностью
GSDLGKKLLE AARAGQDDEV RILLKAGADV NA (SEQ ID NO: 14) или
GSDLGKKLLE AARAGQDDEV RELLKAGADV NA (SEQ ID NO: 15), и при условии, что аминокислотный остаток в положении 24 в аминокислотной последовательности указанного N-терминального кэппирующего модуля представляет собой L, V, I или A;
и такие N-терминальные кэппирующие молекулы, в которых аминокислоты в положении 1 и/или 2 являются отсутствующими.
Такие связывающие белки демонстрируют улучшенную термальную стабильность по сравнению с таким же связывающим белком, отличающимся только одним N-терминальным кэппирующим модулем, например, по сравнению со связывающим белком с N-терминальными кэппинг модулями, известными из уровня техники, такими как N-терминальный кэппирующий модуль, имеющий аминокислотную последовательность с аминокислотой М (метионин) в положении 24, например, SEQ ID NO: 14 или SEQ ID NO: 15, в которых L в положении 24 является замененной М.
Изобретение также относится к связывающему белку, включающему, по крайней мере, один домен анкиринового повтора, где указанный домен анкиринового повтора включает C-терминальный кэппирующий модуль, который имеет аминокислотную последовательность X1DKX2GKTX3X4DX5X6X7DX8GX9EDX10AEX11LQKAA (SEQ ID NO: 6).
Изобретение также относится к молекулам нуклеиновой кислоты, которые кодируют связывающие белки в соответствии с настоящим изобретением, и к фармацевтической композиции, включающей упомянутые выше связывающие белки или молекулы нуклеиновой кислоты.
Изобретение также относится к способу лечения патологического состояния при использовании связывающих белков в соответствии с изобретением.
Краткое описание фигур
Фигура 1. Термальная стабильность DARPin#17 и DARPin#18.
Представлены результаты термальной денатурации DARPin#17 и DARPin#18.
Термальная денатурация сопровождалась повышением интенсивности флуоресценции красителя SYPRO оранжевого, присутствующего в PBS при pH 7,4. Значения Tm для DARPin#17 и DARPin#18 были оценены как такие на уровне 64,5°C и 71,0°C, соответственно.
F, относительные единицы флуоресценции (RFUs), возбуждение при 515-535 нм, определение при 560-580 нм; T, температура в °C; определение DARPin смотри ниже.
Фигура 2. Термальная стабильность DARPin#19 и DARPin 20.
Представлены результаты термальной денатурации DARPin #19 и DARPin#20.
Термальная денатурация сопровождалась CD сигналом на уровне 222 нм в PBS при pH 7,4. Значения Tm для DARPin#19 и DARPin#20 были оценены как такие на уровне 72,3°C и 74,8°C, соответственно.
FU, фракция развернутого белка; T, температура в °C; определение DARPin смотри ниже.
Фигура 3. Термальная стабильность DARPin#21 и DARPin#23
Представлены результаты термальной денатурации DARPin#21 и DARPin#23.
Термальная денатурация сопровождалась CD сигналом на уровне 222 нм в PBS при pH 7,4. Значения Tm для DARPin#21 и DARPin#23 были оценены как такие на уровне 56.5°C и 63.5°C, соответственно.
FU, фракция развернутого белка; T, температура в °C; определение DARPin смотри ниже.
Фигура 4. Термальная стабильность DARPin#24 и DARPin#26
Представлены результаты термальной денатурации DARPin#24 и DARPin#26.
Термальная денатурация сопровождалась CD сигналом на уровне 222 нм в PBS при pH 7,4. Значения Tm для DARPin#24 и DARPin#26 были оценены как такие на уровне 83°C и 89°C, соответственно.
RE, относительный CD сигнал при 222 нм, нормализованный к сигналу, измеренному при 20°C; T, температура в °C; определение DARPin смотри ниже.
Подробное описание изобретения
Термин "белок" относится к полипептиду, в котором, по крайней мере, часть полипептида имеет, или обладает способностью приобретать определенное пространственное расположение путем формирования вторичных, третичных или четвертичных структур в пределах полипептидного(ых) цепи(ей) и/или между ними. В том случае, если белок включает два или более полипептидов, то индивидуальные полипептидные цепи могут быть связаны нековалентно или ковалентно, например, с помощью дисульфидной связи между двумя полипептидами. Часть белка, которая индивидуально имеет или обладает способностью приобретать определенное пространственное расположение путем формирования вторичных или третичных структур, называется "белковым доменом". Такие белковые домены являются хорошо известными квалифицированному специалисту в данной области техники.
Термин "рекомбинантный", как используется в словосочетании рекомбинантный белок, рекомбинантный белковый домен, рекомбинантный связывающий белок и тому подобное, означает, что указанные полипептиды получают с помощью методик рекомбинантной ДНК, хорошо известных квалифицированному специалисту в релевантной области техники. Например, рекомбинантная молекула ДНК (например, полученная с помощью синтеза генов), которая кодирует полипептид, может быть клонирована в бактериальную экспрессионную плазмиду (например, pQE30, Qiagen), дрожжевую экспрессионную плазмиду или экспрессионную плазмиду млекопитающих. Когда, например, такая сконструированная рекомбинантная бактериальная экспрессионная плазмида встраивается в приемлемую бактерию (например, Escherichia coli), то эта бактерия может продуцировать полипептид, который кодируется этой рекомбинантной ДНК. Соответствующим образом полученный полипептид называется рекомбинантным полипептидом.
В контексте настоящего изобретения термин "полипептид" относится к молекуле, которая состоит из одной или более цепей многочисленных аминокислот, то есть, из двух или более, аминокислот, связанных с помощью пептидных связей. Предпочтительно, полипептид состоит более чем из восьми аминокислот, связанных с помощью пептидных связей.
Термин "полипептидная метка" относится к аминокислотной последовательности, которая присоединяется к полипептиду/белку, где указанная аминокислотная последовательность является полезной для очистки, определения или мечения указанного полипептида/белка, или где указанная аминокислотная последовательность улучшает физико-химическое поведение полипептида/белка, или где указанная аминокислотная последовательность обладает эффекторной функцией. Индивидуальные полипептидные метки, остатки и/или домены связывающего белка могут быть связаны друг с другом непосредственно или с помощью полипептидных линкеров. Эти полипептидные метки являются хорошо известными в области техники и полностью доступны квалифицированному специалисту в данной области техники. Примеры полипептидных меток представляют собой малые полипептидные последовательности, например, His (например, His-метка последовательности SEQ ID NO: 16), myc, FLAG или Strep-метки или остатки, такие как ферменты (например, ферменты, подобные щелочной фосфатазе), которые позволяют осуществлять определение указанного полипептида/белка, или остатки, которые могут использоваться для мечения (такие как иммуноглобулины или их фрагменты) и/или в качестве эффекторных молекул.
Термин "полипептидный линкер" относится к аминокислотной последовательности, которая является способной к связыванию, например, двух белковых доменов, полипептидной метки и белкового домена, белкового домена и остатка, отличного от полипептида, такого как полиэтиленгликоль или двух последовательностей метки. Такие дополнительные домены, метки, остатки, отличные от полипептидов, и линкеры являются хорошо известными квалифицированному специалисту в релевантной области техники. Список примеров обеспечивается в описании к патентной заявке WO 2002/020565. Частные примеры таких линкеров представляют собой глицин-серин линкеры и пролин-треонин линкеры варьирующей длины; является предпочтительным, когда указанные линкеры имеют длину от 2 до 24 аминокислот; более предпочтительно, когда указанные линкеры имеют длину от 2 до 16 аминокислот.
Термин "связывающий белок" относится к белку, включающему один или более связывающих доменов, одно или более биоактивных соединений и один или более полимерных остатков, как дополнительно объясняется ниже. Предпочтительно, когда указанный связывающий белок включает вплоть до четырех связывающих доменов. Более предпочтительно, когда указанный связывающий белок включает вплоть до двух связывающих доменов. Наиболее предпочтительно, когда указанный связывающий белок включает только один связывающий домен. Кроме того, любой такой связывающий белок может включать дополнительные белковые домены, которые не являются связывающими доменами, остатки мультимеризации, полипептидные метки, полипептидные линкеры и/или единичный остаток Cys. Примеры остатков мультимеризации представляют собой константные участки тяжелой цепи иммуноглобулина, которые спариваются с обеспечением функциональных Fc доменов иммуноглобулина, и лейциновые "застежки" или полипептиды, включающие свободный тиол, который образует межмолекулярную дисульфидную связь между двумя такими полипептидами. Единичный остаток Cys может использоваться для конъюгации других остатков к полипептиду, например, путем использования малеимидной связи, которая является хорошо известной квалифицированному специалисту в данной области техники. Предпочтительно, когда указанный связывающий белок представляет собой рекомбинантный связывающий белок. Также является предпочтительным, когда связывающие домены связывающего белка обладают различными целевыми специфичностями.
Термин "связывающий домен" означает белковый домен, который демонстрирует такую же сборку (пространственное размещение), что и белковый каркас и обладает предварительно определенным свойством, как определяется ниже. Такой связывающий домен может быть получен с помощью целесообразных, или в наиболее общем случае, комбинаторных методик конструирования белка, методов, которые являются известными в области техники (Binz и др., 2005, в приведенном выше месте). Например, связывающий домен, имеющий предварительно определенное свойство, может быть получен с помощью способа, включающего этапы (a) обеспечения разнообразной коллекции белковых доменов, которые демонстрируют такую же сборку, что и белковый каркас, как определено дополнительно ниже; и (b) скрининга указанной разнообразной коллекции и/или селекции из указанной разнообразной коллекции для получения, по крайней мере, одного белкового домена, обладающего указанным предварительно определенным свойством. Разнообразная коллекция белковых доменов может обеспечиваться с помощью нескольких способов в соответствии с используемой системой скрининга и/или селекции и может включать применение способов, хорошо известных квалифицированному специалисту в данной области техники, таких как фаговый дисплей или рибосомальный дисплей. Предпочтительно, указанный связывающий домен представляет собой рекомбинантный связывающий домен.
Термин "предварительно определенное свойство" относится к свойству, такому как, связывание с мишенью, блокирование мишени, активация опосредованной мишенью реакции, ферментативная активность и другие близкие свойства. В зависимости от типа желаемого свойства, средний специалист в данной области техники будет способен идентифицировать формат и необходимые этапы для осуществления скрининга и/или селекции связывающего домена с желаемым свойством. Предпочтительно, указанное предварительно определенное свойство представляет собой связывание с мишенью.
Предпочтительный связывающий белок включает, по крайней мере, один повторяемый домен.
Термины "имеет связывающую специфичность для мишени", "которые специфически связываются с мишенью" или "целевая специфичность" и тому подобные означают, что связывающий белок или связывающий домен связываются в PBS с мишенью с более низкой константой диссоциации, чем с неродственным белком, например, таким как связывающий мальтозу белок Е.coli (MBP). Предпочтительно, когда константа диссоциации в PBS для мишени является, по крайней мере в 10, более предпочтительно в 102, даже более предпочтительно в 103, или наиболее предпочтительно в 104 раз ниже, чем соответствующая константа диссоциации для MBP.
Способы определения констант диссоциации белок-белковых взаимодействий, такие как методики, которые основываются на поверхностном плазмонном резонансе (SPR) (например, SPR равновесный анализ) или изотермическая титрационная калориметрия (ITC), являются хорошо известными квалифицированному специалисту в данной области техники. Измеренные значения Kd конкретного белок-белкового взаимодействия могут варьировать, если измеряются при различных условиях (например, концентрации соли, pH). Таким образом, измерение значений Kd предпочтительно осуществляют при использовании стандартизированных растворов белка и стандартизированного буфера, такого как PBS.
Термин "мишень" относится к индивидуальной молекуле, такой как молекула нуклеиновой кислоты, полипептида или белка, углевода, или любой другой существующей в природе молекуле, включая любую часть такой индивидуальной молекулы, или к комплексам двух или более таких молекул. Мишень может представлять собой цельную клетку или образец ткани, или она может представлять собой любую не существующую в природе молекулу или остаток. Предпочтительно, когда мишень представляет собой существующий в природе или неприродный полипептид или полипептид, содержащий химические модификации, например, модифицированный с помощью природного или неприродного фосфорилирования, ацетилирования или метилирования.
Определения, приведенные в данной заявке ниже для белков повторов, основываются на таких, которые описаны в патентной заявке WO 2002/020565. Патентная заявка WO 2002/020565 дополнительно содержит общее описание характеристик белковых повторов, методик и применений.
Термин "повторяемые белки" относится к белкам, включающим один или более повторяемых доменов. Предпочтительно, каждый указанный белок повторов включает вплоть до четырех повторяемых доменов. Более предпочтительно, когда каждый указанный белок повторов включает вплоть до двух повторяемых доменов. Наиболее предпочтительно, когда каждый указанный повторяемый белок включает только один повторяемый домен. Кроме того, указанный белок повторов может включать дополнительные небелковые повторяемые домены, полипептидные метки и/или полипептидные линкеры.
Термин "повторяемый домен" относится к белковым доменам, включающим две или более последовательных повторяемых единиц (модулей) в качестве структурных единиц, где указанные структурные единицы имеют такую же сборку и плотно упаковываются с образованием, например, сферической структуры, имеющей соединительное гидрофобное ядро. Предпочтительно, повторяемый домен дополнительно включает N-терминальную и/или C-терминальную кэппирующую единицу (или модуль). Даже более предпочтительно, когда указанные N-терминальные и/или C-терминальные кэппирующие единицы (или модули) представляют собой кэппирующие повторы.
Термин "сконструированный повторяемый белок" и "сконструированный повторяемый домен" относится к повторяемому белку или повторяемому домену, соответственно, полученному в результате изобретательской процедуры, которая объясняется в патентной заявке WO 2002/020565. Сконструированные повторяемые белки и сконструированные повторяемые домены являются синтетическими, а не природными. Они могут представлять собой созданные человеком белки или домены, соответственно, полученные путем экспрессии соответственным образом сконструированных нуклеиновых кислот. Предпочтительно, экспрессию осуществляют в прокариотических или эукариотических клетках, таких как бактериальные клетки, или путем использования бесклеточной экспрессионной системы in vitro. В соответствии с этим, сконструированный белок с анкириновым повтором (то есть, DARPin) соответствует связывающему белку в соответствии с изобретением, включающему, по крайней мере, один домен анкиринового повтора.
Термин "структурная единица" относится к локально упорядоченной части полипептида, образованной пространственными взаимодействиями между двумя или более сегментами вторичной структуры, которые находятся рядом друг с другом в полипептидной цепи. Такая структурная единица демонстрирует структурный мотив. Термин "структурный мотив" относится к пространственному расположению элементов вторичной структуры, присутствующих, по крайней мере, в одной структурной единице. Структурные мотивы являются хорошо известными квалифицированному специалисту в данной области техники. Структурные единицы, взятые отдельно, не являются способными приобретать определенное пространственное расположение; однако их последовательное расположение, например, в виде повторяемых модулей в повторяемом домене, приводит к взаимной стабилизации соседних единиц, что приводит к образованию суперспиральной структуры.
Термин "повторяемая единица" относится к аминокислотной последовательности, включающей мотивы повторяемой последовательности одного или более существующих в природе повторяемых белков, где указанные "повторяемые единицы" обнаруживаются во множественных копиях, и которые демонстрируют определенную топологию сборки, общую для всех указанных мотивов, определяющих сборку этого белка. Такие повторяемые единицы соответствуют "повторяемым структурным единицам (повторам)" повторяемых белков, как описывается Forrer и др., 2003, в приведенном выше месте, или "последовательным структурным единицам (повторам)" повторяемых белков, как описывается Binz и др., 2004, в приведенном выше месте. Такие повторяемые единицы включают каркасные остатки и остатки взаимодействия. Примеры таких повторяемых единиц представляют собой повторяемые единицы армадилло, обогащенные лейцином повторяемые единицы, единицы анкиринового повтора, повторяемые единицы тетратрикопептида, повторяемые единицы HEAT и вариантные повторяемые единицы, обогащенные лейцином. Существующие в природе белки, содержащие две или более таких повторяемых единиц, называются "существующими в природе повторяемыми белками". Аминокислотные последовательности индивидуальных повторяемых единиц повторяемых белков могут иметь значительное количество мутаций, замен, инсерций и/или делеций по сравнению с каждым другим, в то время как все еще существенно сохраняют общую модель, или мотив повторяемой единицы.
Термин "единица анкиринового повтора" будет означать повторяемую единицу, которая представляет собой анкириновый повтор, как описывается, например, Forrer и др., 2003, в приведенном выше месте. Анкириновые повторы являются хорошо известными квалифицированному специалисту в данной области техники.
Термин "каркасные участки" относится к аминокислотным остаткам повторяемой единицы, или соответствующим аминокислотным остаткам повторяемых модулей, которые осуществляют свой вклад в топологию сборки, то есть те, которые осуществляют свой вклад в сборку указанной повторяемой единицы (или модуля), или те, которые осуществляют свой вклад во взаимодействие с соседней единицей (или модулем). Такой вклад может представлять собой взаимодействие с другими остатками в повторяемой единице (или модуле), или влияние на конформацию полипептидного скелета, как обнаруживается в α-спиралях или β-складках, или аминокислотных цепочках, которые формируют линейные полипептиды или петли.
Термин "остатки целевого взаимодействия" относится к аминокислотным остаткам повторяемой единицы, или к соответствующим аминокислотным остаткам повторяемых модулей, которые осуществляют свой вклад во взаимодействие с целевыми веществами. Такой вклад может представлять собой непосредственное взаимодействие с целевыми веществами, или влияние на другие непосредственно взаимодействующие остатки, например, путем стабилизации конформации полипептида повторяемой единицы (или модуля) для того, чтобы позволить осуществить или улучшить взаимодействие непосредственно взаимодействующих остатков с указанной целью. Такие каркасные остатки и целевые остатки взаимодействия могут быть идентифицированы с помощью анализа структурных данных, полученных с помощью физико-химических Методов, таких как рентгеноструктурная кристаллография, ЯМР и/или CD спектроскопия, или путем сравнения с известной и близкой структурной информацией, которая является хорошо известной практикующим специалистам в структурной биологии и/или биоинформатике.
Предпочтительно, когда повторяемые единицы, используемые для дедукции мотива повторяемой последовательности, являются гомологичными повторяемыми единицам, где повторяемые единицы включают тот же структурный мотив и в которых более чем 70% каркасных участков указанных повторяемых единиц являются гомологичными друг другу. Предпочтительно, более чем 80% каркасных участков указанных повторяемых единиц являются гомологичными. Наиболее предпочтительно, когда более чем 90% каркасных участков указанных повторяемых единиц являются гомологичными. Компьютерные программы для определения процента гомологии между полипептидами, такие как Fasta, Blast или Gap, являются известными квалифицированному специалисту в данной области техники. Также является предпочтительным, когда повторяемые единицы, используемые для дедукции мотива повторяемой последовательности, являются гомологичными повторяемыми единицам, полученным из повторяемых доменов, отобранных на мишени и имеющих такую же целевую специфичность.
Термин "мотив повторяемой последовательности" относится к аминокислотной последовательности, которая выводится из одной или более повторяемых единиц или повторяемых модулей. Предпочтительно, когда указанные повторяемые единицы или повторяемые модули являются такими из повторяемых доменов, имеющих связывающую специфичность для той же мишени. Такой мотив повторяемых последовательностей включает положения остатков каркасного участка и положения остатков целевого взаимодействия. Указанные положения остатков каркасного участка соответствуют положениям каркасных участков повторяемых единиц (или модулей). Подобно этому, указанные положения остатков целевого взаимодействия соответствуют положениям остатков целевого взаимодействия повторяемых единиц (или модулей). Мотив повторяемых последовательностей включает фиксированные положения и случайные положения. Термин "фиксированное положение" относится к аминокислотному положению в мотиве повторяемой последовательности, где указанное положение принимается за определенную аминокислоту. Наиболее часто, такие фиксированные положения соответствуют положениям каркасных участков и/или положениям остатков целевого взаимодействия, которые являются специфическими для определенной мишени. Термин "рандомизированное положение" относится к аминокислотному положению в мотиве повторяемой последовательности, в котором две или более аминокислот допускаются в указанном аминокислотном положении, например, в котором допускаются любые из обычных двадцати существующих в природе аминокислот, или в котором допускаются более двадцати существующих в природе аминокислот, таких, как аминокислоты, отличные от цистеина, или аминокислоты, отличные от глицина, цистеина и пролина. Наиболее часто, такие рандомизированные положения соответствуют положениям остатков целевого взаимодействия. Однако некоторые положения каркасных участков также могут быть рандомизированы.
Термин "топология сборки" относится к третичной структуре указанных повторяемых единиц или повторяемых модулей. Топология сборки будет определяться цепочками аминокислот, формирующими, по крайней мере, части α-спиралей или β-складок, или цепочками аминокислот, формирующими линейные полипептиды или петли, или любой комбинацией α-спиралей, β-складок и/или линейных полипептидов/петель.
Термин "последовательный" относится к размещению, в котором повторяемые единицы или повторяемые модули размещаются последовательно друг за другом. В сконструированных повторяемых белках, существует, по крайней мере, 2, обычно приблизительно от 2 до 6, в частности, по крайней мере, приблизительно 6, часто 20 или более повторяемых единиц (или модулей). В большинстве случаев повторяемые единицы (или модули) повторяемого домена будут демонстрировать высокую степень идентичности последовательности (одинаковые аминокислотные остатки в соответствующих положениях) или подобия последовательности (аминокислотные остатки являются различными, но имеют подобные физико-химические свойства), и некоторые из аминокислотных остатков могут представлять собой ключевые остатки, которые являются строго консервативными. Однако высокая степень вариабельности последовательности благодаря аминокислотным инсерциям и/или делециям, и/или заменам между различными повторяемыми единицами (или модулями) повторяемого домена может быть возможной при условии, что поддерживается общая топология сборки повторяемых единиц (или модулей).
Способы для непосредственного определения топологии сборки белков повторов при использовании физико-химических средств, таких как рентгеновская кристаллография, ЯМР или спектроскопия циркулярного дихроизма, являются хорошо известными практикующему специалисту в данной области техники. Способы идентификации и определения повторяемых единиц или мотивов повторяемых последовательностей или идентификации семейств родственных белков, включающих такие повторяемые единицы или мотивы, такие, как поиски гомологии (BLAST и т.д.), являются хорошо установленными в области биоинформатики и хорошо известны практикующему специалисту в данной области техники. Этап уточнения исходного мотива повторяемой последовательности может включать итеративный процесс.
Термин "повторяемые модули" относится к повторяемой аминокислотной последовательности сконструированных повторяемых доменов, которые исходно имеют происхождение от повторяемой единицы существующих в природе повторяемых белков. Каждый повторяемый модуль, который содержится в повторяемом домене, имеет происхождение от одной или более повторяемых единиц семейства или подсемейства существующих в природе повторяемых белков, например, семейства белковых повторов армадилло или белков с анкириновым повтором.
"Повторяемые модули" могут включать положения с аминокислотными остатками, присутствующими во всех копиях соответствующих повторяемых модулей ("фиксированные положения"), и положения с отличающимися или "рандомизированными" аминокислотными остатками ("рандомизированные положения").
Термин "кэппирующий модуль" относится к полипептиду, слитому с N- или C-терминальным повторяемым модулем повторяемого домена, где указанный кэппирующий модуль формирует плотные третичные взаимодействия (то есть, взаимодействия третичной структуры) с указанным повторяемым модулем, обеспечивая, таким образом, колпачок, который защищает гидрофобное ядро указанного повторяемого модуля со стороны, которая не находится в контакте с последовательным повторяемым модулем, от растворителя. Указанный N- и/или C-терминальный кэппирующий модуль может представлять собой, или может иметь происхождение от кэппирующей единицы или другой структурной единицы, которая обнаруживается в существующих в природе белковых повторах, соседствующих с повторяемой единицей. Термин "кэппирующая единица" относится к существующему в природе собранному полипептиду, где указанный полипептид определяет конкретную структурную единицу, которая является N- или C-терминально слитой с повторяемой единицей, где указанный полипептид формирует плотные взаимодействия третичной структуры с указанной повторяемой единицей, обеспечивая, таким образом, колпачок, который защищает гидрофобное ядро указанной повторяемой единицы с одной стороны, от растворителя. Предпочтительно, кэппинг модули или кэппирующие единицы представляют собой кэппирующие повторы. Термин "кэппирующий повтор" относится к кэппирующему модулю или кэппирующей единице, которая имеет подобную или такую же сборку, что и указанная соседняя повторяемая единица (или модуль), и/или подобность последовательности указанной соседней повторяемой единицы (или модуля). Кэппинг модули и кэппирующие повторы описываются в WO 2002/020565 и Interlandi и др., 2008 (в приведенном выше месте). Например, WO 2002/020565 описывает N-терминальный кэппирующий модуль (то есть, кэппирующий повтор), который имеет аминокислотную последовательность
GSDLGKKLLEAARAGQDDEVRILMANGADVNA (SEQ ID NO: 1) и
C-терминальный кэппирующий модуль (то есть кэппирующий повтор), имеющий аминокислотную последовательность
QDKFGKTAFDISIDNGNEDLAEILQKLN (SEQ ID NO: 2).
Interlandi и др., 2008 (в приведенном выше месте) описывают C-терминальные кэппинг модули, имеющие аминокислотные последовательности
QDKFGKTPFDLAIREGHEDIAEVLQKAA (SEQ ID NO: 3) и
QDKFGKTPFDLAIDNGNEDIAEVLQKAA (SEQ ID NO: 4).
Например, N-терминальный кэппирующий модуль последовательности SEQ ID NO: 17 кодируется аминокислотами от положения 1 до положения 32, а C-терминальный кэппирующий модуль последовательности SEQ ID NO: 17 кодируется аминокислотами от положения 99 до положения 126.
Настоящее изобретение относится к связывающему белку, включающему, по крайней мере, один домен анкиринового повтора, где указанный домен анкиринового повтора включает N-терминальный кэппирующий модуль, имеющий аминокислотную последовательность
GSDLGKKLLE AARAGQDDEV RILLKAGADV NA (SEQ ID NO: 14) или
GSDLGKKLLE AARAGQDDEV RELLKAGADV NA (SEQ ID NO: 15), в которой аминокислотный остаток L в положении 24 SEQ ID NO: 14 или SEQ ID NO: 15 является необязательно замененным V, I или A;
вплоть до 9 аминокислот SEQ ID NO: 14 или SEQ ID NO: 15 в других положениях, отличных от положения 24, необязательно являются замененными любыми аминокислотами; и
в которой G в положении 1 и/или S в положении 2 SEQ ID NO: 14 или SEQ ID NO: 15 являются необязательно отсутствующими.
Было обнаружено, что положение 24 в N-терминальном кэппирующем модуле не должно представлять собой метионин (M). В последовательности SEQ ID NO: 14 и SEQ ID NO: 15, положение 24 представляет собой лейцин (L). Аминокислота в этом положении может представлять собой V, I или A. Предпочтительной является L в положении 24, или замещение с помощью А. Наиболее предпочтительным является L в положении 24.
Принцип замещения метионина в положении 24 может быть применен к разнообразию других N-терминальных кэппирующих модулей. Как следствие этого, предмет в соответствии с изобретением также включает все те N-терминальные кэппинг модули, которые отличаются от аминокислотной последовательности SEQ ID NO: 14 и SEQ ID NO: 15 путем замены вплоть до 9 аминокислот в других положениях, отличных от положения 24. Более предпочтительно такие N-терминальные кэппинг модули отличаются замещением 8 аминокислот, более предпочтительно 7 аминокислот, более предпочтительно 6 аминокислот, более предпочтительно 5 аминокислот, даже более предпочтительно 4 аминокислот, более предпочтительно 3 аминокислот, более предпочтительно 2 аминокислот, и наиболее предпочтительно 1 аминокислоты.
Замещение аминокислот может осуществляться при использовании любой из 20 наиболее часто встречающих в природе аминокислот, предпочтительно с помощью аминокислот, выбранных из группы, состоящей из A, D, E, F, H, I, K, L, M, N, Q, R, S, T, V, W и Y; и более предпочтительно из группы, состоящей из A, D, E, H, I, K, L, Q, R, S, T, V, и Y. Также предпочтительно, замена аминокислот осуществляется с гомологичной аминокислоты; аминокислота заменяется аминокислотой, которая имеет боковую цепь с подобными биофизическими свойствами. Например, негативно заряженная аминокислота D может быть заменена негативно заряженн