Мутант тяжелой цепи, приводящий к повышенной выработке иммуноглобулина
Иллюстрации
Показать всеНастоящее изобретение относится к иммунологии и биотехнологии. Предложены варианты нуклеиновых кислот, каждый из которых кодирует аминокислотную последовательность тяжелой цепи иммуноглобулина IgG1. Указанная цепь содержит на С-конце СН3-домена глицин-лизиновый дипептид, кодируемый кодоном ggaaaa, ggcaaa или gggaaa. Описаны: плазмида, кодирующая тяжелую цепь иммуноглобулина; клетки-варианты, обеспечивающие экспрессию иммуноглобулина IgG1; способ получения иммуноглобулина в клетках млекопитающего; способ улучшения экспрессии иммуноглобулина в клетках млекопитающего; - использующие варианты нуклеиновой кислоты. Использование изобретения обеспечивает предупреждение экспрессии побочного продукта массой 80 кДа, что может найти применение при производстве иммуноглобулинов. 7 н. и 11 з.п. ф-лы, 7 ил., 3 табл., 6 пр.
Реферат
В заявке описаны способы и нуклеиновые кислоты для получения иммуноглобулинов в клетках млекопитающих.
Предпосылки создания изобретения
Системы экспрессии для получения рекомбинантных полипептидов известны в данной области и опубликованы. Для получения полипептидов применяют фармацевтически приемлемые клетки млекопитающих, например, клетки СНО, клетки ВНК, клетки NSO, клетки Sp2/0, клетки COS, клетки НЕК, клетки PER.C6® и другие. Нуклеиновые кислоты, кодирующие полипептид, внедряют в клетки, например, с помощью плазмиды, например, экспрессирующей плазмиды. Важными элементами экспрессирующей плазмиды являются прокариотическая единица размножения плазмид, например, плазмид Escherichia coli, включающая начало репликации (репликатор) и селективный маркер, эукариотический селективный маркер и одну или несколько экспрессирующих кассет для экспрессии целевой нуклеиновой кислоты (кислот), каждая из которых включает промотор, структурный ген и терминатор транскрипции, включая сигнал полиаденилирования. Для временной экспрессии в клетки млекопитающих может быть включен репликатор млекопитающих, например, SV40 Ori или OriP. В качестве промотора может быть выбран конститутивный или индуцибельный промотор. Для оптимизации транскрипции последовательность Kozak может быть включена в 5'-нетранслируемую область. Для процессинга иРНК также может быть включен сигнал полиаденилирования.
Белки, особенно иммуноглобулины, занимают важное место в арсенале современной медицины. Для назначения людям каждое фармацевтическое вещество должно соответствовать определенным критериям. Чтобы убедиться в безопасности биофармацевтических агентов для людей, вещества, которые могут вызвать серьезные повреждения, должны быть особенно тщательно удалены.
Сплайсинг иРНК регулируется наличием сайта донора сплайсинга в комбинации с сайтом акцептора сплайсинга, которые расположены по 5'-концу и 3'-концу интрона, соответственно. По кн.: «Recombinant DNA: A Short course», 1983, под ред. Watson и др., изд-во Scientific American Books, распространение книг осуществляет фирма W.H.Freeman and Company, Нью-Йорк, Нью-Йорк, США, описывают консенсусную последовательность ag|gtragt 5'-сайта донора сплайсинга (экзон|интрон) и (y)nNcag|g 3'-сайта акцептора сплайсинга (экзон|интрон) (r=пуриновое основание; y=пиримидиновое основание; n=целое число; N=какое-либо природное основание).
В 1980 годы были опубликованы первые статьи, рассматривающие репликатор секретируемых и связанных с мембраной форм иммуноглобулинов. Формирование секретированной (sIg) и связанной с мембраной (mIg) изоформ происходит в результате иного сплайсинга иРНК-предшественника тяжелой цепи. В изоформе mIg сайт сплайсинга донора в экзоне, кодирующем С-концевой домен секретированной формы (т.е. домен CH3 или CH4, соответственно), и сайт акцептора сплайсинга, расположенный от него на расстоянии вниз по цепи, используют для связи константной области с расположенными ниже по цепи экзонами, кодирующими трансмембранный домен.
Способ получения молекул синтетической нуклеиновой кислоты с пониженными несоответствующими или непредусмотренными показателями транскрипции при экспрессии в отдельных клетках-хозяевах описан в WO 2002/016944. В WO 2006/042158 описаны молекулы нуклеиновой кислоты, модифицированные для повышенной экспрессии рекомбинантного белка и/или понижения или элиминации ошибочно сплайсированных и/или интронных побочных продуктов, сформировавшихся в результате сплошного считывания.
Таким образом, существует потребность в способе получения рекомбинантных продуктов применительно к иммуноглобулинам с пониженным содержанием побочных продуктов.
Краткое описание изобретения
Первый объект настоящего изобретения предусматривает нуклеиновую кислоту, кодирующую аминокислотную последовательность С-концевой части CH3-домена иммуноглобулинов класса IgE или IgM, в которой дипептид глицин-лизин, включенный в первичную аминокислотную последовательность С-концевой части CH3- или CH4-домена, кодируется нуклеиновой кислотой ggaaaa, или нуклеиновой кислотой ggcaaa, или нуклеиновой кислотой gggaaa, или нуклеиновой кислотой gggaag, или нуклеиновой кислотой ggcaag, или нуклеиновой кислотой ggaaag.
В одном из вариантов осуществления настоящее изобретение нуклеиновая кислота кодирует аминокислотную последовательность, выбранную из аминокислотных последовательностей SEQ ID NO:1, 3, 4, 5, 6, 7 или 8. В другом варианте осуществления настоящее изобретение представляет нуклеиновую кислоту, кодирующую дипептид глицин-лизин, предворяемый нуклеотидом g или а. В другов варианте осуществления настоящего изобретения нуклеиновой кислотой, кодирующей дипептид глицин-лизин, является нуклеиновая кислота ggaaaa, или нуклеиновая кислота ggcaaa, или нуклеиновая кислота gggaaa.
Второй объект настоящего изобретения представляет собой плазмиду, включающую нуклеиновую кислоту по настоящему изобретению, а третьим объектом настоящего изобретения являются клетки, включающие нуклеиновую кислоту по настоящему изобретению.
Другим объектом настоящего изобретения является нуклеотидная последовательность SEQ ID NO:17, 18, 19, 20, 21, 22, 23, 30 или 31.
Пятым объектом настоящего изобретения является способ получения иммуноглобулина в клетках млекопитающего, включающий следующие стадии:
а) трансфекции клеток млекопитающего нуклеиновой кислотой, кодирующей тяжелую цепь иммуноглобулина, представляющей нуклеиновую кислоту SEQ ID NO:17, 18, 19, 20, 21, 22, 23, 30 или 31, которая кодирует С-концевую часть тяжелой цепи иммуноглобулина,
б) культивирования трансфецированных клеток млекопитающего в условиях, пригодных для экспрессии иммуноглобулина,
в) выделения иммуноглобулина из культуры или из клеток.
В одном из вариантов осуществления настоящего изобретения клетками млекопитающих являются клетки СНО, клетки ВНК, клетки NSO, клетки Sp2/0, клетки COS, клетки НЕК или клетки PER.C6®. Предпочтительно клетками млекопитающих являются клетки СНО, или клетки ВНК, или клетки PER.C6®. В другом варианте осуществления настоящего изобретения клетки млекопитающих трансфецированы двумя нуклеиновыми кислотами, причем первая нуклеиновая кислота включает экспрессирующую кассету, кодирующую легкую цепь иммуноглобулина, а вторая нуклеиновая кислота включает экспрессирующую кассету, кодирующую тяжелую цепь иммуноглобулина, включающую нуклеиновую кислоту SEQ ID NO:17, 18, 19, 20, 21, 22, 23, 30 или 31, кодирующую С-концевую часть тяжелой цепи иммуноглобулина.
Заключительным объектом настоящего изобретения является способ улучшения экспрессии иммуноглобулина в клетках млекопитающих, в котором нуклеиновая кислота, кодирующая тяжелую цепь иммуноглобулина, включает нуклеиновую кислоту ggaaaa, или нуклеиновую кислоту ggcaaa, или нуклеиновую кислоту gggaaa, или нуклеиновую кислоту ggaaag, или нуклеиновую кислоту ggcaag, или нуклеиновую кислоту gggaag, кодирующую дипептид глицин-лизин, содержащийся в CH3- или CH4-домене.
Подробное описание изобретения
Настоящее изобретение включает нуклеиновую кислоту, кодирующую аминокислотную последовательность С-концевой части CH3-домена иммуноглобулина класса IgA или IgG, или С-концевой части CH4-домена иммуноглобулина класса IgE или IgM, в котором дипептид глицин-лизин, включенный в аминокислотную последовательность С-концевой части CH3- или CH4-домена, кодируется нуклеиновой кислотой ggaaaa, или нуклеиновой кислотой ggcaaa, или нуклеиновой кислотой gggaaa, или нуклеиновой кислотой ggaaag, или нуклеиновой кислотой ggcaag, или нуклеиновой кислотой gggaag, причем нуклеиновой кислоте, кодирующей дипептид глицин-лизин, необязательно предшествует или нуклеотид g, или нуклеотид а.
Способы и методики, которые могут использоваться в настоящем изобретении, известны специалистам в данной области и описаны, например, в кн.: «Current Protocols in Molecular Biology», 1997, под ред. Ausubel F.M., т.I-III, и в кн. Sambrook и др.: «Molecular Cloning: A Laboratory Manual», 1989, 2-е изд., изд. Cold Spring Harbor Laboratory Press, Cold Spring Harbor Нью-Йорк. Специалистам в данной области известно, что применение методов рекомбинации ДНК позволяет получать многочисленные производные нуклеиновой кислоты и/или полипептида. Такие производные могут, например, модифицироваться в одном определенном или в нескольких положениях путем замещения, изменения, обмена или инсерции. Модификация или дериватизация может, например, выполняться методами сайт-направленного мутагенеза. Такие модификации могут быть легко выполнены специалистами в данной области (см., например, Sambrook J. и др. в кн.: «Molecular Cloning: A laboratory manual», 1999, изд. Cold Spring Harbor Laboratory Press, Нью-Йорк, США). Применение рекомбинантной методики помогает специалистам в данной области трансформировать разные клетки-хозяева гетерологичными нуклеиновыми кислотами. Хотя в механизмах транскрипции и трансляции, т.е. экспрессии, в разных клетках использованы одни и те же элементы, клетки, принадлежащие к разным видам, могут иметь помимо других отличий разные используемые кодоны. Таким образом, идентичные полипептиды (по аминокислотной последовательности) могут кодироваться разными нуклеиновыми кислотами. Кроме того, из-за вырожденности генетического кода разные нуклеиновые кислоты могут кодировать один и тот же полипептид.
В контексте настоящего изобретения понятие «нуклеиновая кислота» относится к полимерной молекуле, состоящей из отдельных нуклеотидов (также называемых основаниями) а, с, g и t (или и в РНК), например, для ДНК, РНК или их модификаций. Полинуклеотидная молекула может быть молекулой природного полинуклеотида, или молекулой синтетического полинуклеотида, или комбинацией одной или нескольких природных молекул полинуклеотида с одной или несколькими синтетическими молекулами полинуклеотида. Это понятие также относится к природным полинуклеотидным молекулам, в которых один или несколько нуклеотидов заменены (например, с помощью мутагенеза), делегированы или добавлены. Нуклеиновая кислота также может быть выделенной или интегрированной в другую нуклеиновую кислоту, например, в экспрессирующую кассету, плазмиду или хромосому клетки-хозяина. Нуклеиновая кислота также отличается последовательностью нуклеиновой кислоты, состоящей из отдельных нуклеотидов.
Специалистам в данной области хорошо известны методы преобразования аминокислотной последовательности, например, полипептида, в соответствующую последовательность нуклеиновой кислоты, кодирующую аминокислотную последовательность. Следовательно, нуклеиновая кислота отличается последовательностью нуклеиновой кислоты, состоящей из отдельных нуклеотидов, а также последовательностью аминокислот полипептида, кодируемого этой нуклеиновой кислотой.
К понятию «плазмида» относятся, например, векторные и экспрессирующие плазмиды, а также плазмиды трансфекции. Понятие «вектор» в настоящем изобретении используют в качестве синонима понятия «плазмида». Обычно «плазмида» также включает начало репликации (репликатор), например, репликатор ColE1 или oriP, и селективный маркер (например, маркер ампицилина, канамицина, тетрациклина или хлорамфеникола) для репликации и селекции, соответственно, плазмиды в бактериях.
Понятие «экспрессирующая кассета» относится к конструкции, которая содержит требуемые регуляторные элементы, например, промотор и сайт полиаденилирования, для экспрессии по меньшей мере содержащейся в клетке нуклеиновой кислоты.
Понятие «селективный маркер» означает нуклеиновую кислоту, которая позволяет клеткам, несущим селективный маркер, быть специфически отобранными по этому признаку по типу «за» или «против» в присутствии соответствующего селективного агента. Обычно селективный маркер может подтвердить устойчивость к лекарственному средству или компенсировать метаболический или катаболический дефект в клетке-хозяине. Маркер может быть положительным, отрицательным или бифункциональным. Удобным положительным селективным маркером является ген устойчивости к антибиотику. Такой селективный маркер позволяет клеткам-хозяевам, трансфецированным этим маркером, быть положительно отобранными в присутствии соответствующего селективного агента, т.е. антибиотика. Нетрансформированные клетки-хозяева не могут расти или выживать в условиях селективной культуры, т.е. в присутствии селективного агента, в культуре. Положительные селективные маркеры позволяют проводить отбор клеток, несущих маркер, а маркеры отрицательной селекции позволяют селективно элиминировать клетки, несущие маркер. К селективным маркерам, применяемым в эукариотических клетках, относятся, например, гены аминогликозидфосфотрансферазы (aminoglycoside phosphotransferase - АРН), например, селективные маркеры гигромицин (hyg), неомицин (neo) и G418, дигидрофолатредуктаза (DHFR), тимидинкиназа (tk), глутаминсинтетаза (GS), аспарагинсинтетаза, триптофансинтетаза (селективным агентом является индол), гистидинолдегидрогеназа (селективный агент гистидинола D) и нуклеиновые кислоты, обусловливающие устойчивость к пуромицину, блеомицину, флеомицину, хлорамфениколу, зеоцину и морфофеноловой кислоте. Другие маркеры описаны в WO 92/08796 и WO 94/28143.
В контексте настоящего изобретения понятие «экспрессия» относится к процессам транскрипции и/или трансляции в клетке. Уровень транскрипции исследуемой последовательности нуклеиновой кислоты может быть установлен на основе количества соответствующей иРНК, которая имеется в клетке. Например, транскрибированная с исследуемой последовательности иРНК может быть оценена количественно методом РВ-ПЦР или норзен-гибридизацией (см. выше Sambrook и др., 1989). Полипептиды, кодированные исследуемой нуклеиновой кислотой, могут быть оценены количественно разными методами, например, ELISA, по оценке биологической активности полипептида или анализом, зависящим от такой активности, например, вестерн-блоттингом или радиоиммуноанализом, используя иммуноглобулины, которые распознают и связывают полипептид (см. выше Sambrook и др.).
Понятие «клетка» или «клетка-хозяин» в контексте настоящего изобретения означает клетку, в которой нуклеиновая кислота, например, кодирующая гетерологичный полипептид, может быть, или уже является, интродуцированной/трансфецированной. Понятие «клетка» включает и прокариотические клетки, которые используют для размножения плазмид, и эукариотические клетки, которые используют для экспрессии нуклеиновой кислоты. Предпочтительно эукариотические клетки являются клетками млекопитающих. Предпочтительно клетки млекопитающих выбраны из группы клеток млекопитающих, включающей клетки СНО (например, СНО K1, CHO DG44), клетки ВНК, клетки NSO, клетки SP2/0, клетки НЕК 293, клетки НЕК 293 EBNA, клетки PER.C6® и клетки COS. Понятие экспрессирующей «клетки» в контексте настоящего изобретения означает клетку субъекта и ее потомство. Таким образом, понятие «трансформант» и «трансформированная клетка» включает первичную клетку субъекта и клетки в культурах, полученные из нее независимо от числа переносов. Также очевидно, что потомство может в точности быть не идентично по содержанию ДНК из-за продуманных или непредвиденных мутаций. К этому варианту также относится вариант потомства с той же функцией или с тем же биологическим действием, которые выявлены в первоначально трансформированной клетке.
Понятие «полипептид» означает полимер, включающий аминокислоты, соединенные пептидными связями, независимо то того, являются ли они природными или синтетическими. Полипептиды, длиной примерно не более 20 аминокислотных остатков, могут быть обозначены «пептидами», причем молекулы, включающие два или несколько полипептидов, или включающие один полипептид более чем из 100 аминокислотных остатков, могут быть названы «белками». Полипептид может также включать компоненты, не являющиеся аминокислотами, например, углеводные группы, ионы металлов или эфиры карбоновых кислот. Компоненты, не являющиеся аминокислотами, могут быть присоединены клеткой, в которой экспрессирован полипептид, и могут меняться в зависимости от типа клеток. Полипептиды в настоящем изобретении выражены с точки зрения их аминокислотной структуры или нуклеиновой кислоты, их кодирующей. Добавления, например углеводные группы, обычно точно не установлены, но тем не менее они могут присутствовать.
Понятие «аминокислота» в контексте настоящего изобретения означает группу карбокси α-аминокислот, которая непосредственно или в форме предшественника может быть кодирована нуклеиновой кислотой. Отдельные аминокислоты кодируются нуклеиновыми кислотами, каждая из которых состоит из трех нуклеотидов и называется кодоном или триплетом. Каждая аминокислота кодируется по меньшей мере одним кодоном. Например, аминокислота глицин может кодироваться каждым из четырех нуклеиновых кислот (кодонов) gga, ggc, ggg и ggt, а аминокислота лизин кодируется двумя нуклеиновыми кислотами - ааа и aag. Этот феномен называется «вырожденностью генетического кода». Группа аминокислот включает аланин (трехбуквенный код: ala, обозначение одной буквой: А), аргинин (arg, R), аспарагин (asn, N), аспарагиновая кислота (asp, D), цистеин (cys, С), глутамин (gin, Q), глутаминовая кислота (glu, Е), глицин (gly, G), гистидин (his, Н), изолейцин (ile, I), лейцин (leu, L), лизин (lys, К), метионин (met, М), фенилаланин (phe, F), пролин (pro, Р), серии (ser, S), треонин (thr, Т), триптофан (trp, W), тирозин (tyr, Y) и валин (val, V).
Понятие «иммуноглобулин» в контексте настоящего изобретения означает белок, состоящий из одного или нескольких полипептидов, главным образом кодированных генами иммуноглобулина. Это определение включает варианты, например, мутантные формы, т.е. формы с замещениями, делениями и инсерциями одной или нескольких аминокислот, усеченные с N-конца формы, гибридные формы, химерные формы, а также гуманизированные формы. Установленные гены иммуноглобулина включают гены разных константных областей, а также гены неисчислимого количества вариабельной области иммуноглобулина, например, у приматов или грызунов. Предпочтительными являются моноклональные иммуноглобулины. Каждая из тяжелой и легкой полипептидных цепей иммуноглобулина может включать константную область (обычно карбоксильную концевую часть).
Понятие «моноклональный иммуноглобулин» в контексте настоящего изобретения означает иммуноглобулин, полученный из популяции в значительной степени гомогенных иммуноглобулинов, т.е. отдельные иммуноглобулины, составляющие популяцию, идентичны за исключением возможных естественных мутаций, которые могут присутствовать в минорных количествах. Моноклональные иммуноглобулины высокоспецифичны, направлены против определенных антигенных сайтов. Кроме того, в отличие от препаратов поликлонального иммуноглобулина, которые включают разные иммуноглобулины, направленные против разных антигенных сайтов (детерминантов или эпитопов), каждый моноклональный иммуноглобулин направлен против единственного антигенного сайта на антигене. Преимущество моноклональных иммуноглобулинов, помимо их специфичности, заключается в том, что они могут быть синтезированы без примесей в виде других иммуноглобулинов. Определение «моноклональный» характеризует иммуноглобулин в качестве полученного из популяции иммуноглобулинов, являющейся в значительной степени гомогенной, и не означает, что требуется получение иммуноглобулина каким-либо определенным способом.
«Гуманизированные» формы иммуноглобулинов, не являющихся иммуноглобулинами человека (например, иммуноглобулины грызуна), представляют химерные иммуноглобулины, которые содержат неполные последовательности, производные от иммуноглобулина, не являющегося иммуноглобулином человека, и от иммуноглобулина человека. В основном гуманизированные иммуноглобулины производны от иммуноглобулина человека (реципиента иммуноглобулина), в котором остатки из гипервариабельной области заменены остатками гипервариабельной области иммуноглобулинов других видов, не человека, являющихся донорами иммуноглобулина, например, мыши, крысы, кролика или обезьяны, обладающих желаемой специфичностью или сродством (см., например, Morrison S.L. и др., Proc. Natal. Acad. Sci. USA 81, 1984, сс.6851-6855, US 5202238, US 5204244). В некоторых случаях остатки каркасного участка (framework region - FR) иммуноглобулина человека замещены на соответствующие остатки не от человека. Кроме того, гуманизированные иммуноглобулины могут включать дополнительные модификации, например, аминокислотные остатки, которые не обнаружены у иммуноглобулина реципиента или у иммуноглобулина донора. Эти модификации приводят к вариантам таких иммуноглобулинов реципиента или донора, которые являются гомологичными, но не идентичными соответствующей исходной последовательности. Такие модификации получают для проведения дополнительной очистки. В общем гуманизированный иммуноглобулин может включать практически все из по меньшей мере одного, обычно двух вариабельных доменов, в которых все или практически все из гипервариабельных петель соответствуют петлям иммуноглобулина донора, коим не является человек, и все или практически все из участков FR являются участками FR реципиентного иммуноглобулина человека. Гуманизированный иммуноглобулин необязательно также может включать по меньшей мере часть константной области иммуноглобулина, обычно иммуноглобулина человека. Способы гуманизирования иммуноглобулина, не являющегося иммуноглобулином человека, известны в данной области. Предпочтительно гуманизированный иммуноглобулин содержит один или несколько аминокислотных остатков, внедренных в него из источника, которым не является человек. Такие аминокислотные остатки, не связанные с человеком, часто обозначаются «импортными» остатками, которые обычно берут из «импортного» вариабельного домена. Гуманизирование может быть по существу выполнено по методу Winter с соавторами путем замещения последовательностей гипервариабельной области для соответствующих последовательностей иммуноглобулина, не являющегося иммуноглобулином человека. Следовательно, такие «гуманизированные» иммуноглобулины являются химерными иммуноглобулинами, причем существенно в меньшей степени по сравнению с интактным вариабельным доменом человека замещены соответствующей последовательностью от представителя вида, но не человека. На практике гуманизированные иммуноглобулины обычно являются иммуноглобулинами человека, в которых некоторые остатки гипервариабельной области и возможно некоторые остатки каркасного участка замещены остатками от аналогичных сайтов у иммуноглобулинов грызунов или обезьян.
В зависимости от аминокислотной последовательности константной области тяжелых цепей, иммуноглобулины поделены на классы: IgA, IgD, IgE, IgG и IgM. Некоторые из них могут быть дополнительно поделены на подклассы (изотипы), например, IgG1, IgG2, IgG3 и IgG4, IgA1 и IgA2. По константным областям тяжелой цепи разные классы тяжелых цепей иммуноглобулинов обозначаются α-, δ-, ε-, γ- и µ-цепь, соответственно. Константная область тяжелой цепи иммуноглобулина человека полной длины класса IgA, IgD и IgG составлена из константного домена 1 (обозначаемого в настоящем изобретении «CH1»), шарнирной области, константного домена 2 (CH2) и константного домена 3 (CH3). Иммуноглобулины человека класса IgE и IgM включают дополнительный четвертый константный домен (CH4). Кроме того, иммуноглобулины класса IgM представляют полимеры, включающие разнообразные иммуноглобулины, например, пять или шесть, ковалентно связанные дисульфидными связями. Аминокислотные последовательности С-концевого константного домена таких разных классов иммуноглобулина человека перечислены в табл.1. Первая аминокислота последовательности SEQ ID NO:01-08 может присутствовать или отсутствовать, поскольку эта аминокислота кодируется двумя экзонами: экзоном, кодирующим С-концевой константный домен, и экзоном, кодирующим предшествующий домен.
Таблица 1. | ||
С-концевая аминокислотная последовательность иммуноглобулинов разных классов. Подчеркнуты дипептиды глицин-лизин. | ||
Класс иммуноглобулина (С-концевой константный домен) | Аминокислотная последовательность С-концевой части (в направлении от N-конца к С-концу) | SEQ ID NO: |
IgA1 (CH3), IgA2 (CH3) | GNTFRPEVHL LPPPSEELAL NELVTLTCLA RGFSPKDVLV RWLQGSQELP REKYL TWASR QEPSQGTTTF AVTSILRVAA EDWKKGDTFS CMVGHEALPL AFTQK TIDRL AGKPTHVNVS VVMAEVDGTC Y | 01 |
IgD (CH3) | AAQAPVKLSLN LLASSDPPEA ASWLLCEVSG FSPPNILLMW LEDQREVNTS GFAPARPPPQ PGSTTFWAWS VLRVPAPPSP QPATYTCVVS HEDSRTLLNA SRSLEVSY | 02 |
IgE (CH4) | GPRAAPEVYA FATPEWPGSR DKRTLACLIQ NFMPEDISVQ WLHNEVQLPD ARHSTTQPRK TKGSGFFVFS RLEVTRAEWE QKDEFICRAV HEAASPSQTV QRAVSVNPGK | 03 |
IgM (CH4) | GVALHRPDVY LLPPAREQLN LRESATITCL VTGFSPADVF VQWMQRGQPL SPEKYVTSAP MPEPQAPGRY FAHSILTVSE EEWNTGETYT CVVAHEALPN RVT ERTVDK STGKPTLYNV SLVMSDTAGT CY | 04 |
IgGI (CH3) | GQPREPQVYT LPPSRDELTK NQVSLTCLVK GFYPSDIAVE WESNGQPENN YKTTPPVLDS DGSFFLYSKL TVDKSRWQQG NVFSCSVMHE ALHNHYTQKS LSLSPGK | 05 |
IgG2 (CH3) | GQPREPQVYT LPPSREEMTK NQVSLTCLVK GFYPSDIAVE WESNGQPENN YKTTPPMLDS DGSFFLYSKL TVDKSRWQQG NVFSCSVMHE ALHNHYTQKS LSLSPGK | 06 |
IgG3 (CH3) | GQPREPQVYT LPPSREEMTK NQVSLTCLVK GFYPSDIAVE WESSGQPENN YNTTPPMLDS DGSFFLYSKL TVDKSRWQQG NIFSCSVMHE ALHNRFTQKS LSLSPGK | 07 |
IgG4 (CH3) | GQPREPQVYT LPPSQEEMTK NQVSLTCLVK GFYPSDIAVE WESNGQPENN YKTTPPVLDS DGSFFLYSRL TVDKSRWQEG NVFSCSVMHE ALHNHYTQKS LSLSLGK | 08 |
Понятие «С-концевая часть CH3-домена иммуноглобулина класса IgA или IgG, или С-концевая часть CH4-домена иммуноглобулина класса IgE или IgM» означает аминокислотные последовательности тяжелой цепи иммуноглобулина, которые локализованы с С-конца полной длины или природной тяжелой цепи иммуноглобулина, причем С-конец указанной С-части идентичен С-концу первичной аминокислотной последовательности тяжелой цепи иммуноглобулина. Понятие «первичная аминокислотная последовательность» означает аминокислотную последовательность тяжелой цепи иммуноглобулина после трансляции соответствующей иРНК. Такая первичная аминокислотная последовательность может также быть модифицирована в экспрессирующих клетках после трансляции иРНК, например, пептидазами, отщепляющими одну или несколько С-концевых аминокислот из первичной аминокислотной последовательности. Следовательно, первичная аминокислотная последовательность и секретированная аминокислотная последовательность могут быть неидентичны, но могут отличаться некоторыми аминокислотами по С-концу. В одном из вариантов осуществления настоящего изобретения С-концевая часть включает по меньшей мере 100 С-концевых аминокислот первичной аминокислотной последовательности тяжелой цепи иммуноглобулина или предпочтительно по меньшей мере 50 С-концевых аминокислот первичных аминокислотных последовательностей тяжелой цепи иммуноглобулина, или предпочтительно по меньшей мере 20 С-концевых аминокислот первичной аминокислотной последовательности тяжелой цепи иммуноглобулина. В одном из вариантов осуществления настоящего изобретения нуклеиновая кислота по настоящему изобретению кодирует аминокислотную последовательность С-концевой части CH3-домена иммуноглобулина класса IgG, или С-концевой части CH4-домена иммуноглобулина класса IgE. В другом варианте осуществления настоящего изобретения нуклеиновая кислота по настоящему изобретению кодирует аминокислотную последовательность С-концевой части домена CH3 иммуноглобулина класса IgG.
Аминокислотные последовательности С-концевого константного домена разных иммуноглобулинов человека кодируются соответствующими последовательностями ДНК. В геноме такие последовательности ДНК содержат кодирующие (экзонные) и некодирующие (интронные) последовательности. После транскрипции ДНК в иРНК-предшественника, указанная иРНК-предшественник также содержит такие интронные и экзонные последовательности. Перед трансляцией некодирующие интронные последовательности удаляются в ходе процессинга иРНК за счет их сплайсинга из первичного транскрипта иРНК для получения зрелой иРНК. Сплайсинг первичной иРНК контролируется сайтом сплайсирования донора в комбинации с должным образом расположенным на расстоянии сайтом сплайсирования акцептора. Сайт сплайсирования донора локализован на 5'-конце, а сайт сплайсирования акцептора локализован на 3'-конце интронной последовательности, и оба частично удаляются во время процесса сплайсинга иРНК-предшественника.
Понятие «должным образом расположенные на расстоянии» в контексте настоящего изобретения означает, что сайт сплайсинга донора и сайт сплайсинга акцептора в нуклеиновой кислоте собраны таким образом, что все требуемые элементы для сплайсинга имеются и находятся в соответствующем положении, что позволяет осуществляться процессу сплайсинга.
Настоящее изобретение включает нуклеиновую кислоту, кодирующую аминокислотную последовательность С-концевой части CH3-домена иммуноглобулина класса IgA или IgG или С-концевой части CH4-домена иммуноглобулина класса IgE или IgM, в которой дипептид глицин-лизин, включенный в указанную аминокислотную последовательность С-концевой части CH3- или CH4-домена, кодируется нуклеиновой кислотой ggaaaa, или нуклеиновой кислотой ggcaaa, или нуклеиновой кислотой gggaaa.
Неожиданно было установлено, что с нуклеиновой кислотой по настоящему изобретению формирование нежелательных побочных продуктов в результате эпизодов нежелательного сплайсинга может быть понижено.
Понятие «дипептид глицин-лизин» в контексте настоящего изобретения означает пептид, включающий в направлении от N-конца к С-концу две аминокислоты, глицин и лизин, связанные пептидной связью. Понятие «дипептид глицин-лизин» в контексте настоящего изобретения означает фракцию дипептида более крупного полипептида или белка, которая может быть обнаружена в начале, внутри или с конца более крупного полипептида. Аминокислота лизин может кодироваться нуклеиновой кислотой ааа или aag. Таким образом, в другом варианте осуществления настоящего изобретения дипептид глицин-лизин, включенный в аминокислотную последовательность С-концевой части CH3- или CH4-домена тяжелой цепи иммуноглобулина, кодируется нуклеиновой кислотой ggaaag, или нуклеиновой кислотой ggcaag, или нуклеиновой кислотой gggaag. В другом варианте осуществления настоящего изобретения нуклеиновой кислоте, кодирующей дипептид глицин-лизин, предшествует нуклеотид а или g.
Последовательности нуклеиновых кислот, кодирующие С-концевой константный домен разных классов и подклассов иммуноглобулина человека, перечислены в табл.2. Для домена CH3 IgG1 и IgG2 человека известны два варианта формы. В одном из вариантов осуществления настоящего изобретения нуклеиновая кислота кодирует часть С-концевого константного домена тяжелой цепи иммуноглобулина.
Таблица 2. | ||
Последовательности нуклеиновой кислоты, кодирующие С-концевую часть тяжелой цепи иммуноглобулинов человека разных классов. | ||
Класс иммуноглобулина (С-концевой константный домен) | Последовательность нуклеиновой кислоты, кодирующая С-концевую часть аминокислотной последовательности тяжелой цепи иммуноглобулина | SEQ ID NO: |
IgA1 (CH3), IgA2 (CH3) | ggcttcagcc ccaaggacgt gctggttcgc tggctgcagg ggtcacagga gctgccccgc gagaagtacc tgacttgggc atcccggcag gagcccagcc agggcaccac caccttcgct gtgaccagca tactgcgcgt ggcagccgag gactggaaga agggggacac cttctcctgc atggtgggcc acgaggccct gccgctggcc ttcacacaga agaccatcga ccgcttggcg ggtaaaccca cccatgtcaa tgtgtctgtt gtcatggcgg aggtggacgg cacctgctac | 09 |
IgD (CH3) | taccacccaa cgtccgtgac tgtcacctgg tacatgggga cacagagcca gccccagaga accttccctg agatacaaag acgggacagc tactacatga caagcagcca gctctccacc cccctccagc agtggcgcca aggcgagtac aaatgcgtgg tccagcacac cgccagcaag agtaagaagg agatcttccg ctggccaggt aggtcgcacc ggagatcacc cagaagggcc ccccaggacc cccagcacct tccactcagg gcctgaccac aaagacagaa gcaagggctg | 10 |
IgE (CH4) | tttgcgacgc cggagtggcc ggggagccgg gacaagcgca ccctcgcctg cctgatccag aacttcatgc ctgaggacat ctcggtgcag tggctgcaca acgaggtgca gctcccggac gcccggcaca gcacgacgca gccccgcaag accaagggct ccggcttctt cgtcttcagc cgcctggagg tgaccagggc cgaatgggag cagaaagatg agttcatctg ccgtgcagtc catgaggcag cgagcccctc acagaccgtc cagcgagcgg tgtctgtaaa tcccggtaaa | 11 |
IgM(CH4) | acgggcttct ctcccgcgga cgtcttcgtg cagtggatgc agagggggca gcccttgtcc ccggagaagt atgtgaccag cgccccaatg cctgagcccc aggccccagg ccggtacttc gcccacagca tcctgaccgt gtccgaagag gaatggaaca cgggggagac ctacacctgc gtggtggccc atgaggccct gcccaacagg gtcaccgaga ggaccgtgga caagtccacc ggtaaaccca ccctgtacaa cgtgtccctg gtcatgtccg acacagctgg cacctgctac | 12 |
Класс иммуноглобулина (С-концевой константный домен) | Последовательность нуклеиновой кислоты, кодирующая С-концевую часть аминокислотной последовательности тяжелой цепи иммуноглобулина | SEQ ID NO: |
IgG1 (CH3) вариант 1 | gtgtacaccc tgcccccatc ccgggatgag ctgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctatcc cagcgacatc gccgtggagt gggagagcaa tgggcagccg gagaacaact acaagaccac gcctcccgtg ctggactccg acggctcctt cttcctctac agcaagctca ccgtggacaa gagcaggtgg cagcagggga acgtcttctc atgctccgtg atgcatgagg ctctgcacaa ccactacacg cagaagagcc tctccctgtc tccgggtaaa | 13 |
IgG1 (CH3) вариант 2 | gggcagcccc gagaaccaca ggtgtacacc ctgcccccat cccgggatga gctgaccaag aaccaggtca gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc gacggctcct tcttcctcta cagcaagctc accgtggaca agagcaggtg gcagcagggg aacgtcttct catgctccgt gatgcatgag gctctgcaca accactacac acagaagagc ctctccctgt ctccgggtaa a | 28 |
IgG2 (CH3) вариант 1 | gtgtacaccc tgcccccatc ccgggaggag atgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctaccc cagcgacatc gccgtggagt gggagagcaa tgggcagccg gagaacaact acaagaccac acctcccatg ctggactccg acggctcctt cttcctctac agcaagctca ccgtggacaa gagcaggtgg cagcagggga acgtcttctc atgctccgtg atgcatgagg ctctgcacaa ccactacacg cagaagagcc tctccctgtc tccgggtaaa | 14 |
IgG2 (CH3) вариант 2 | gggcagcccc gagaaccaca ggtgtacacc ctgcccccat cccgggagga gatgaccaag aaccaggtca gcctgacctg cctggtcaaa ggcttctacc ccagcgacat ctccgtggag tgggagagca atgggcagcc ggagaacaac tacaagacca cacctcccat gctggactcc gacggctcct tcttcctcta cagcaagctc accgtggaca agagcaggtg gcagcagggg aacgtcttct catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc ctctccctgt ctccgggtaa a | 29 |
IgG3 (CH3) | gtgtacaccc tgcccccatc ccgggaggag atgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctaccc cagcgacatc gccgtggagt gggagagcag cgggcagccg gagaacaact acaacaccac gcctcccatg ctggactccg acggctcctt cttcctctac agcaagctca ccgtggacaa gagcaggtgg cagcagggga acatcttctc atgctccgtg atgcatgagg ctctgcacaa ccgcttcacg cagaagagcc tctccctgtc tccgggtaaa | 15 |
IgG4 (CH3) | gtgtacaccc tgcccccatc ccaggaggag atgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctaccc cagcgacatc gccgtggagt gggagagcaa tgggcagccg gagaacaact acaagaccac gcctcccgtg ctggactccg acggctcctt cttcctctac agcaggctaa ccgtggacaa gagcaggtgg caggagggga atgtcttctc atgctccgtg atgcatgagg ctctgcacaa ccactacaca cagaagagcc tctccctgtc tctgggtaaa | 16 |
В одном из вариантов осуществления настоящего изобретения нуклеиновая кислота по настоящему изобретению кодирует аминокислотную последовательность, выбранную из аминокислотных последовательностей SEQ ID NO:1,3, 4, 5, 6, 7 или 8.
В одном из вариантов осуществления настоящего изобретения нуклеиновая кислота кодирует часть С-концевого константного домена тяжелой цепи иммуноглобулина класса IgA, IgE, IgM или IgG и выбрана из нуклеиновых кислот SEQ ID NO:17, 18, 19, 20, 21, 22, или 23, или 30, или 31. В другом варианте осуществления настоящего изобретения нуклеиновая кислота кодирует часть С-концевого константного домена тяжелой цепи иммуноглобулина класса IgA, IgE, IgM или IgG и выбрана из нуклеиновых кислот SEQ ID NO:17, 18, 19, 22, 23, 30 или 31. В другом варианте осуществления настоящего изобретения нуклеиновая кислота кодирует часть С-концевого константного домена тяжелой цепи иммуноглобулина класса IgA, IgE, IgM или IgG и выбрана из нуклеиновых кислот SEQ ID NO:17, 18. 19, 22 или 23.
Нуклеиновые кислоты с нуклеотидной последовательностью SEQ ID NO:17-23 и 30-31 также являются объектом настоящего изобретения. В одном из вариантов осуществления настоящего изобретения нуклеотидные последовательности SEQ ID NO:17, 18, 19, 22, 23, 30 или 31 являются объектом настоящего изобретения. В другом варианте осуществления настоящего изобретения нуклеотидные последовательности SEQ ID NO:17, 18, 19, 22 или 23 являются объектом настоящего изобретения.
В одном из вариантов осуществления настоящего изобретения нуклеиновая кислота кодирует С-концевой константный домен иммуноглобулина класса IgA, IgE, IgM или IgG и включает нуклеиновую кислоту, выбранную из нуклеиновых кислот SEQ ID NO:17, 18, 19, 20, 21, 22 или 23, или 30, или 31, которая кодирует часть С-концевого домена тяжелой цепи иммуноглобулина. В другом варианте осуществления настоящего изобретения нуклеиновая кислота кодирует С-концевой константный домена иммуноглобулина класса IgA, IgE, IgM или IgG и включает нуклеиновую кислоту, выбранную из нуклеиновых кислот SEQ ID N0: 17, 18, 19, 22, 23, 30 или 31, которая кодирует часть С-концевого домена тяжелой цепи иммуноглобулина. В другом варианте осуществления настоящего изобретения нуклеиновая кислота кодирует С-концевой константный домен иммуноглобулинов класса IgA, IgE, IgM или IgG и включает нуклеиновую кислоту, выбранную из нуклеиновых кислот SEQ ID NO:17, 18, 19, 22 или 23, которая кодирует часть С-концевого домена тяжелой цепи иммуноглобулина.
Таблица 3 | ||
Последовательности нуклеиновых кислот по настоящему изобретению, кодирующие часть аминокислотной последовательности С-концевого константного домена тяжелой цепи иммуноглобулинов разных классов | ||
Класс иммуноглобулина | Последовательность нуклеиновой кислоты, кодирующей С-концевую аминокислотную последовательность | SEQ ID NO: |
IgA | ggcaaaccca cccatgtcaa tgtgtctgtt gtcatggcgg aggtggacgg cacctgctac | 17 |
IgE | catgaggcag cgagcccctc acagaccgtc cagcgagcgg tgtctgtaaa tcccggcaaa | 18 |
IgM | ggcaaaccca ccctgtacaa cgtgtccctg gtcatgtccg acacagctgg cacctgctac |