Синтетические 5 utr (нетранслируемые области), экспрессионные векторы и способ повышения трансгенной экспрессии

Иллюстрации

Показать все

Группа изобретений относится к области биотехнологии. Настоящее изобретение обеспечивает синтетические 5'UTR области, содержащие первый полинуклеотидный фрагмент в виде второго интрона гена кальциевой АТФазы саркоплазматического/эндоплазматического ретикулума и второй полинуклеотидный фрагмент, представленный частью 5' нетранслируемой области (5'UTR) гена казеина. Синтетические 5'UTR области применяются для усиления экспрессии трансгена, при этом 5'UTR области расположены между промотором и последовательностью, представляющей интерес в экспрессионном векторе. В настоящем изобретении также предложены векторы, содержащие 5'UTR области, и способ усиления экспрессии трансгена при их применении. 9 н. и 16 з.п. ф-лы, 17 ил., 2 табл., 3 пр.

Реферат

Область изобретения

Это изобретение относится к области биотехнологии. В частности, относится к повышению посттранскрипционного контроля экспрессии гена в эукариотических клетках.

Уровень техники

После транскрипции первичных мРНК с ДНК экспрессия эукариотических генов проходит несколько этапов контроля. Первичный транскрипт мРНК включает в себя кодирующие (экзоны) и некодирующие (интроны) зоны. Во время сплайсинга мРНК интроны транскрипта вырезаются и удаляются, а экзоны соединяются вместе, образуя зрелую матричную РНК (мРНК). Сплайсинг служит контрольным этапом в продуцировании множественных изоформ белка отдельного гена посредством дополнения и удаления экзонов в разных комбинациях. Этот процесс, называемый альтернативным сплайсингом, происходит в четко регулируемых, многокомпонентных структурах, называемых сплайсосомами, которые находятся под управлением внутриклеточных и внеклеточных сигнальных путей.

Альтернативный сплайсинг внутри кодирующей белок зоны приводит к образованию сложных изоформ с разнообразными функциями. Кроме того, было показано, что сплайсинг значительно увеличивает синтез белков в клетках млекопитающих (Huang и Gorman, 1990. Nucleic Acids Research 18(4):937-947). Механизм этого процесса неизвестен. Альтернативный сплайсинг также может происходить в нетранслируемых зонах транскрипта, что может содействовать энхансеру или стабилизации доменов в конечном транскрипте, в результате чего увеличивается трансляция белка.

Было показано, что включение элементов сплайсинга в 5'-регуляторную область синтетической конструкции гена увеличивает экспрессию генов, гипотетически в связи с улучшением транспорта мРНК из ядра в цитоплазму (см. выше Huang и Gorman; Choi et al., 1991. Molecular and Cellular Biology 11(6):3070-3074). В результате этого процесса интроны часто включают между промотором и сайтом множественного клонирования коммерчески доступных экспрессивных векторов млекопитающих. Однако комбинации интронов с другими регуляторными зонами в целях увеличения экспрессии генов не были исследованы.

Краткое описание изобретения

В настоящем изобретении предложены синтетические полинуклеотидные последовательности 5'UTR, которые предназначены для увеличения экспрессии трансгенного компонента синтетической конструкции гена в клетке-хозяине. Будучи не связаны с теорией, синтетические 5'UTR области сконструированы таким образом, чтобы экспрессия трансгена могла быть повышена за счет увеличения транспорта и стабильности РНК.

Синтетические последовательности 5'UTR содержат полинуклеотидный фрагмент, который включает сайт сплайсинга, одного эукариотического гена, соединенный с полинуклеотидным фрагментом, кодирующим последовательность 5'UTR, другого эукариотического гена, который стабилен на уровне РНК и белка. В одном из вариантов осуществления изобретения синтетическая последовательность 5'UTR является химерной последовательностью, содержащей полинуклеотидный фрагмент, включающий сайт сплайсинга гена кальциевой АТФазы сакроплазматического/эндоплазматического ретикулума, и полинуклеотидный фрагмент, содержащий, по меньшей мере, часть 5'UTR гена казеина.

Синтетические полинуклеотидные последовательности 5'UTR согласно изобретению применяли в целях увеличения экспрессии интересующей последовательности или интересующей кодирующей зоны внутри синтетической конструкции гена. С помощью технологии рекомбинантной ДНК синтетическую последовательность 5'UTR можно включить в вирусные или невирусные векторы между промотором и интересующей нуклеотидной последовательностью. Синтетические последовательности 5'UTR можно расположить по концам нуклеотидных последовательностей, имеющих сайты эндонуклеаз рестрикции и другие нуклеотиды, необходимые для активации эндонуклеаз рестрикции. Фланкирующие последовательности могут содержать сайты клонирования внутри вектора.

В настоящем изобретении также предложены векторы, содержащие синтетические 5'UTR области. В одном из вариантов осуществления изобретения вектор является эукариотическим экспрессионным вектором.

В настоящем изобретении предложены также способы увеличения трансгенной экспрессии в эукариотической клетке. Указанные способы включают этапы создания синтетической последовательности 5'UTR путем слияния полинуклеотидного фрагмента одного гена эукариотической клетки, содержащего сайт сплайсинга, и полинуклеотидного фрагмента другого гена эукариотической клетки, содержащего, по меньшей мере, фрагмент 5'UTR, с целью получить химерную полинуклеотидную последовательность, и этапы включения химерной полинуклеотидной последовательности внутрь экспрессионного вектора между промотором и интересующей последовательностью.

Заявителем было неожиданно обнаружено, что синтетическая последовательность 5'UTR, созданная путем соединения полинуклеотидного фрагмента, содержащего интрон гена кальциевой АТФазы саркоплазматического/эндоплазматического ретикулума, с полинуклеотидным фрагментом, содержащим, по меньшей мере, фрагмент гена казеина, в результате ведет к увеличению экспрессии гена. Как подробно описано в настоящей заявке, два разных варианта синтетической 5'UTR увеличивают экспрессию репортерного гена по сравнению с контролем в двух разных типах клеток, трансфицированных экспрессионным вектором, содержащим синтетическую 5'UTR.

Таким образом, один объект изобретения состоит в применении синтетической последовательности 5'UTR, которая содержит полинуклеотидный фрагмент, включающий сайт сплайсинга, соединенный с полинуклеотидным фрагментом, содержащим, по меньшей мере, часть гетерологической 5' нетранслируемой области для того, чтобы увеличить трансгенную экспрессию в эукариотической клетке.

Другой объект изобретения состоит в применении синтетической последовательности 5'UTR, которая содержит полинуклеотидный фрагмент, включающий интрон, соединенный с полинуклеотидным фрагментом, содержащим, по меньшей мере, часть гетерологической 5' нетранслируемой области для того, чтобы увеличить трансгенную экспрессию в эукариотической клетке.

Еще один объект изобретения состоит в применении синтетической последовательности 5'UTR, которая содержит полинуклеотидный фрагмент, включающий интрон, который имеет прилегающие с 3'- и 5'-концов фрагменты близлежащих экзонов, соединенный с полинуклеотидным фрагментом, содержащим, по меньшей мере, часть гетерологической 5' нетранслируемой области для того, чтобы увеличить трансгенную экспрессию в эукариотической клетке.

Другой объект изобретения предлагает синтетическую последовательность 5'UTR, совместимую с включением в вектор.

Другой объект изобретения предлагает векторы, содержащие синтетические 5'UTRs.

Другой объект изобретения предлагает клетки-хозяева, содержащие синтетические 5'UTR области.

Описание последовательностей

SEQ ID NO:1 представлена вариантом синтетической последовательности 5'UTR, содержащей: сайт рестрикции MluI, SEQ ID NO:2, сайт рестрикции KpnI, SEQ ID NO:3, сайт рестрикции MfeI. SEQ ID NO:1 также упоминается в настоящей заявке как 5U2.

SEQ ID NO:2 представлена вариантом последовательности интрона 2 гена собаки SERCA2, мутированным предполагаемым консенсусным поли-А сайтом с частью экзона 2, расположенной в 5'-конце, и частью экзона 3, расположенной в 3'-конце. SEQ ID NO:2 является мутированной неполной последовательностью 26-й хромосомы Canis familiaris, полученной путем механического фрагментирования целого генома (общий номер доступа NC-06608.2).

SEQ ID NO:3 представлена вариантом последовательности 5'UTR бычьего казеина. SEQ ID NO:3 является неполной последовательностью полноразмерной мРНК бета-казеина Bos taurus (общий номер доступа NM_181008).

SEQ ID NO:4 представлена нормальным вариантом последовательности интрона 2 SERCA2 собаки с частью экзона 2, расположенной в 5'-конце, и частью экзона 3, расположенной в 3'-конце. SEQ ID NO:4 является неполной последовательностью 26-й хромосомы Canis familiaris и получена путем механического фрагментирования целого генома (общий номер доступа NC_006608.2).

SEQ ID NO:5 представлена нормальным вариантом последовательности интрона 2 SERCA2 человека с частью экзона 2, расположенной в 5'-конце, и частью экзона 3, расположенной в 3'-конце. SEQ ID NO:5 является неполной последовательностью 12-й хромосомы Homo sapiens, совокупность реперов, полная последовательность (общий номер доступа NC_000012).

SEQ ID NO:6 представлена нормальным вариантом последовательности интрона 2 SERCA2 мыши с частью экзона 2, расположенной в 5'-конце, и частью экзона 3, расположенной в 3'-конце. SEQ ID NO:6 является последовательностью 5-й хромосомы Mus musculus, совокупность реперов (общий номер доступа NC_000071).

SEQ ID NO:7 представлена синтетической последовательностью 5'UTR, содержащей сайт рестрикции AscI, сайт рестрикции MluI, SEQ ID NO:4, сайт рестрикции KpnI, SEQ ID NO:3, сайт рестрикции MfeI. SEQ ID NO:7 также упоминается в настоящей заявке как INXN-1.

SEQ ID NO:8 представлена вариантом последовательности 5'UTR казеина мыши. SEQ ID NO:8 является неполной последовательностью мРНК бета-казеина Mus musculus (кДНК клон MGC:91065) (общий номер доступа ВС080709).

SEQ ID NO:9 представлена вариантом последовательности 5'UTR казеина крысы. SEQ ID NO:9 является неполной последовательностью мРНК казеина Rattus norvegicus (Csn2) (общий номер доступа NM_017120).

SEQ ID NO:10 представлена вариантом 5'UTR последовательности казеина овцы. SEQ ID NO:10 является неполной последовательностью мРНК бета-казеина Ovis aries (CSN2) (общий номер доступа NM_001009373).

SEQ ID NO:11 представлена экзоном 3 SECRA2 собаки. SEQ ID NO:11 является неполной последовательностью 26-й хромосомы Canis familiaris и получена путем механического фрагментирования целого генома (общий номер доступа NC_006608).

SEQ ID NO:12 представлена вариантом векторной последовательности, содержащей синтетический 5'UTR. Вектор, представленный SEQ ID NO:12, включает SEQ ID NO:1 и схематично изображен на Фигуре 10.

SEQ ID NO:13 представлена другим вариантом векторной последовательности, содержащей синтетическую 5'UTR. Вектор, представленный SEQ ID NO:13, включает SEQ ID NO:7 и схематично изображен на Фигуре 11.

SEQ ID NO:14 представлена вектором, содержащим контрольную (поли-G) синтетическую 5'UTR, и схематично изображена на Фигуре 9.

В любой из этих последовательностей Т (тимидин) может быть замещен на U (урацил).

Описание фигур

На ФИГУРЕ 1А показано схематическое изображение полинуклеотида, имеющего последовательность SEQ ID NO:4.

На ФИГУРЕ 1В показано схематическое изображение полинуклеотида, имеющего последовательность SEQ ID NO:5, и полинуклеотида, имеющего последовательность SEQ ID NO:6.

На ФИГУРЕ 1C показаны полинуклеотиды, имеющие последовательности SEQ ID NO:2 и SEQ ID NOS:4-6. Второй интрон SECRA2 выделен черным цветом. Прилежащие экзоны или их части не окрашены.

На ФИГУРЕ 2А показано схематическое изображение полинуклеотида, имеющего последовательность SEQ ID NO:1.

На ФИГУРЕ 2В показано схематическое изображение полинуклеотида, имеющего последовательность SEQ ID NO:7.

На ФИГУРЕ 3А показано схематическое изображение синтетической 5'UTR, включенной в экспрессионный вектор между промотором и интересующей последовательностью.

На ФИГУРЕ 3В показано схематическое изображение синтетических 5'UTR, включенных в экспрессионный вектор между промотором и клонирующим сайтом.

На ФИГУРЕ 4 изображены результаты исследования синтетических 5'UTR вариантов осуществления изобретения в клетках НЕК-293.

На ФИГУРЕ 5 изображены результаты исследования синтетических 5'UTR вариантов осуществления изобретения в клетках 1080.

На ФИГУРЕ 6 изображены результаты исследований синтетических 5'UTR вариантов осуществления изобретения в виде кратного прироста относительно контроля в клетках НЕК-293 и клетках 1080, при этом контрольные значения приведены к 1.

На ФИГУРЕ 7 изображен контрольный вектор, используемый в Примере 1 (VVN-2712), при этом кодирующая последовательность бета-галактозидазы (LacZ) не имеет 5'UTR и функционально связана с CMV промотором.

На ФИГУРЕ 8 изображен контрольный вектор, используемый в Примере 1 (VVN-2713), при этом указанный вектор не имеет 5'UTR и LacZ.

На ФИГУРЕ 9 изображен вектор, используемый в Примере 1 (VVN-8318), при этом кодирующая последовательность бета-галактозидазы (LacZ) функционально связана с поли-G 5'UTR и CMV промотором.

На ФИГУРЕ 10 изображен вектор, используемый в Примере 1 (VVN-8277), при этом кодирующая последовательность бета-галактозидазы (LacZ) функционально связана с 5'UTR согласно изобретению (5U2) и CMV промотором.

На ФИГУРЕ 11 изображен вектор, используемый в Примере 1 (VVN-8276), при этом кодирующая последовательность бета-галактозидазы (LacZ) функционально связана с 5'UTR согласно изобретению (INXN-1) и CMV промотором.

На ФИГУРЕ 12 представлена таблица, содержащая данные Примера 1, изображенного на ФИГУРАХ 4-6.

На ФИГУРЕ 13 изображен участок линейной структуры геномной и мРНК последовательностей SECRA2 лошади домашней, содержащие второй интрон и экзоны 2 и 3. 5'- и 3'-концы второго интрона обозначены стрелками.

На ФИГУРАХ 7-11 были использованы следующие обозначения: про CMV=промотор цитомегаловируса, LacZ=LacZ кодирующая последовательность, SV40pA=SV40 поли-А, Amp=ген устойчивости к ампициллину, Neo=ген устойчивости к неомицину, MCS=сайт множественного клонирования, SPL-1=часть экзона 2 SECRA2+интрон 2 SECRA2+часть экзона 3 SECRA2, UTR-1=часть 5' UTR казеина.

Подробное описание изобретения

Следующие определения применимы ко всему описанию, фигурам и формуле изобретения. Однако термины, используемые в описании и формуле изобретения, которым не даны определения в настоящей заявке, имеют общепринятые значения, известные в данной области техники.

При использовании в этом описании терминов «один» имеется в виду значение «по меньшей мере, один» или «один или более», если не указано другое.

Термины «нуклеиновая кислота», «молекула нуклеиновой кислоты», «последовательность нуклеиновых кислот», «олигонуклеотид», « последовательность олигонуклеотида», «нуклеотидная последовательность», «полинуклеотид» и «полинуклеотидная последовательность» в настоящей заявке взаимозаменяемы и относятся к фосфатным эфирам полимерных форм рибонуклеозидов (аденозин, гуанозин, уридин или цитидин; «РНК молекулы») или дезоксирибонуклеозидов (дезоксиаденозин, дезоксигуанин, дезокситимидин или дезоксицитизин; «ДКН молекулы») или к другим их фосфоэфирным аналогам, таким как фосфотиоаты и тиоэфиры, в одноцепочечной форме либо в форме двухцепочечной спирали. Возможно существование двухцепочечных ДНК-ДНК, ДНК-РНК и РНК-РНК спиралей. Термин молекула нуклеиновой кислоты, в частности ДНК или РНК молекула, относится только к первичной или вторичной структуре молекулы и не касается других отдельных третичных форм. Таким образом, этот термин включает двойную спираль ДНК, в том числе, линейные или кольцевые ДНК молекулы (например, фрагменты рестрикции), плазмиды, сверхспирали ДНК и хромосомы. При описании структуры отдельных двухцепочечных молекул ДНК в настоящей заявке согласно принятому обозначению последовательность можно описать только как последовательность вдоль нетранскрибируемой цепи ДНК в направлении от 5'-к 3'-концу (то есть цепи, имеющей последовательность, гомологичную мРНК). «Рекомбинантная молекула ДНК» - это молекула ДНК, которая претерпевает молекулярно-биологическое преобразование. ДНК включает, но не ограничивается указанными, кДНК, геномную ДНК, ДНК плазмиды, синтетическую ДНК и полусинтетическую ДНК.

Термин «фрагмент», используемый применительно к полинуклеотидной последовательности (например, «полинуклеотидный фрагмент»), относится к нуклеотидной последовательности, длина которой уменьшена по отношению к длине рассматриваемой нуклеиновой кислоты и которая содержит помимо общей части нуклеотидную последовательность, идентичную рассматриваемой нуклеиновой кислоте. Такой фрагмент нуклеиновой кислоты согласно изобретению при необходимости можно включить в более длинный полинуклеотид, составной частью которого он будет являться. Согласно изобретению такие фрагменты содержат или, в качестве альтернативы, состоят из полинуклеотидов, длина которых находится в пределах, по меньшей мере, от 6, 8, 9, 10, 12, 15, 18, 20, 21, 22, 23, 24, 25, 30, 39, 40, 42, 45, 48, 50, 51, 54, 57, 60, 63, 66, 70, 75, 78, 80, 90, 100, 105, 120, 135, 150, 200, 300, 500, 720, 900, 1000 или 1500 следующих друг за другом нуклеотидов нуклеиновой кислоты.

Термин «химерный» означает содержание фрагментов, не встречающихся вместе в их естественном состоянии. Например, химерный полинуклеотид является полинуклеотидом, содержащим фрагменты, не граничащие друг с другом в их естественном состоянии.

Термин «синтетический», используемый применительно к полинуклеотидной последовательности, относится к ненатуральному полинунуклеотиду (или части полинуклеотида), который отличается от нормальной полинуклеотидной последовательности. Например, синтетический ген (или часть гена) может содержать одну или более последовательностей нуклеиновых кислот, в природе не расположенных совместно друг с другом (химерные последовательности), и/или могут включать замещения, инсерции, делеции и их комбинации.

Термин «ген» относится к полинуклеотиду, содержащему нуклеотиды, которые кодируют функциональную молекулу (например, полипептид или РНК), и включает кДНК или нуклеиновые кислоты геномной ДНК. В общем смысле следует понимать, что геномная ДНК, кодирующая полипептид или РНК, содержит некодирующие зоны (то есть интроны), которые вырезаются из зрелой мРНК, и, следовательно, не представлены в кДНК, кодирующей тот же полипептид или РНК. «Ген» может содержать фрагмент из нуклеиновых кислот, который экспрессирует специфическую РНК, белок или полипептид. Дополнительно, «ген» может содержать регуляторные последовательности, предшествующие (5' некодирующие последовательности) и следующие за (3' некодирующие последовательности) кодирующей последовательностью. «Ген» может также содержать триплекс-образующие олигонуклеотиды (TFO). Термин «нативный ген» относится к гену, существующему в природе с его собственными регуляторными последовательностями. «Химерный ген» или «рекомбинантный ген» относится к любому ненативному гену, содержащему регуляторные и/или кодирующие последовательности, которые не встречаются в природе совместно. Следовательно, химерный ген может содержать регуляторные последовательности и кодирующие последовательности, полученные из разных источников, или регуляторные последовательности и кодирующие последовательности, полученные из одного и того же источника, но расположенные в порядке, отличающемся от естественного. «Эндогенный ген» относится к нативному гену в его естественном местоположении в геноме организма.

«Чужеродный» ген, «экзогенный» ген, или «гетерологичный» ген, или «трансген» относится к гену, который обычно не присутствует в клетке-хозяине или организме, но который вводят в клетку-хозяин или организм путем переноса гена. Трансгены могут содержать как нативные гены, включенные в ненативный организм, так и химерные или синтетические гены. Также трансген может быть версией кДНК эндогенного гена. Также трансген может быть немутированным вариантом мутированного эндогенного гена или мутированной версией немутированного эндогенного гена. Также трансген может быть терапевтическим геном или опытным геном, таким как репортер. Трансген может быть введен напрямую в клетки-мишени организма-хозяина или опосредованно через перенос трансформированных клеток, например аутологичных клеток, в организм хозяина.

Под термином «5'-концевая нетранслируемая область» или «5'UTR» гена следует понимать часть гена, которая транскрибируется в первичный транскрипт РНК (пре-мРНК) и расположена перед кодирующей последовательностью. Полученный путем транскрипции ДНК первичный транскрипт является начальным продуктом РНК, содержащим интроны и экзоны. Большое количество транскриптов должны подвергнуться РНК-процессингу для того, чтобы сформировать физиологически активные типы РНК. Процессинг зрелой мРНК может включать тримминг концов, удаление интронов, кэпирование и/или вырезание отдельных молекул рРНК из их РНК-предшественников. 5'UTR область мРНК, следовательно, представляет собой ту часть мРНК, которая не транслируется в белок и расположена перед кодирующей последовательностью. В геномной последовательности 5'UTR обычно определяется как область между сайтом инициации транскрипции и инициирующим кодоном. 5' нетранслируемые области (5'UTRs) мРНК позвоночных могут содержать от нескольких десятков до нескольких сотен оснований в длину (Crowe et al., 2006. BMC Genomics 7:16).

«Синтетическая 5'UTR» - это искусственная 5'UTR, отличающаяся от нормальной полинуклеотидной последовательности 5'UTR. Синтетическая 5'UTR может содержать одну или более последовательностей нуклеиновых кислот, в природе не расположенных совместно друг с другом (химерные последовательности), и/или может включать замещения, инсерции, делеции и их комбинации.

«Граница сплайсинга», «интрон-экзонная граница сплайсинга» или «сайт сплайсинга» - это области на границах интрона в эукариотических пре-мРНК, распознаваемые клеточными аппаратами сплайсинга, где два близлежащих экзона соединяются, а интрон удаляется. Сайты сплайсинга представлены консервативными последовательностями на 5'- и 3'-границах интрон/экзон. Для подавляющего большинства интронов наиболее консервативными последовательностями являются GU, ограничивающая 5'-конец, и AG с 3'-конца. Однако также известны исключения среди этих типичных последовательностей, такие как интроны с AU-AC сайтами сплайсинга. 5'-концевой сайт сплайсинга на границе интрон/экзон известен как донорный сайт сплайсинга. 3'-концевой сайт сплайсинга на границе интрон/экзон известен как акцепторный сайт сплайсинга.

«Сплайсосома» - это большой рибонуклеопротеиновый комплекс, который служит в качестве клеточного аппарата сплайсинга. Сплайсосомы состоят из субъединиц малых ядерных рибонуклеопротеинов (мяРНП), которые собираются на пре-мРНК. Сами мяРНП состоят из малых ядерных РНК (мяРНК) и нескольких протеиновых субъединиц. Во время процесса сплайсинга распознавание сайтов сплайсинга внутри пре-мРНК осуществляется путем спаривания оснований с мяРНК.

«Гетерологичную» ДНК относят к ДНК, которая обычно не присутствует в клетках или хромосомных сайтах клетки. Следовательно, гетерологичная ДНК включает чужеродный клетке ген. «Гетерологичная» ДНК также может включать ген, обычно присутствующий в клетке, но находящийся в неестественном местоположении. Более того, «гетерологичной» молекулой ДНК может быть молекула ДНК, содержащая чужеродный сегмент ДНК, функционально связанный с сегментом ДНК хозяина, например с промотором транскрипции. С другой стороны, гетерологичная молекула ДНК может содержать эндогенный ген, функционально связанный с экзогенным промотором. Далее, «гетерологичную» ДНК можно отнести к ДНК-молекуле или фрагменту, которые получены из гена, не имеющего общего эволюционного происхождения с рассматриваемой ДНК-молекулой или фрагментом.

Термин «геном» включает хромосомную, а также митохондриальную, хлоропластную и вирусную ДНК или РНК.

Термин «зонд» относится к одноцепочечной молекуле нуклеиновой кислоты, которая может гибридизоваться с целевой комплементарной одноцепочечной молекулой нуклеиновой кислоты, образуя двухцепочечную молекулу.

«Кодирующая последовательность» ДНК относится к двухцепочечной последовательности ДНК, которая кодирует полипептид и которая может быть транскрибирована и транслирована в полипептид в клетке in vitro или in vivo или внеклеточно, например, в пробирке, когда эта последовательность контролируется соответствующими регуляторными последовательностями. «Соответствующие регуляторные последовательности» относятся к нуклеотидным последовательностям, расположенным до (5' некодирующие последовательности), внутри или после (3' кодирующие последовательности) кодирующей последовательности, и которые влияют на транскрипцию, процессинг или стабильность РНК или трансляцию ассоциированной кодирующей последовательности. Регуляторные последовательности могут включать промоторы, лидерные последовательности трансляции, интроны, последовательности распознавания полиаденилирования, сайт процессинга РНК, центр связывания эффектора и структуру типа «стебель-петля». Границы кодирующей последовательности определены инициирующим кодоном в 5'(амино)-конце и стоп-кодоном трансляции в 3'(карбоксильном)-конце. Кодирующая последовательность может включать, но не ограничивается указанными, эукариотические, прокариотические и химерные последовательности, кДНК с мРНК, последовательности геномной ДНК и даже синтетические последовательности ДНК.

«Открытая рамка считывания», обозначенная аббревиатурой ORF, относится к длине последовательности нуклеиновой кислоты, любой (ДНК, кДНК или РНК), которая содержит сайт инициации трансляции, или инициирующий кодон, такой как ATG или AUG, и терминирующий кодон, и потенциально может быть транслирована в полипептидную последовательность.

Термин «по ходу транскрипции» относится к нуклеотидной последовательности, которая расположена с 3'-конца относительно рассматриваемой нуклеотидной последовательности. В частности, расположенные по ходу транскрипции нуклеотидные последовательности обычно относятся к последовательностям, которые следуют за сайтом инициации транскрипции. Например, инициирующий кодон трансляции гена находится по ходу транскрипции относительно сайта инициации транскрипции.

Термин «против хода транскрипции» относится к нуклеотидной последовательности, которая расположена с 5'-конца относительно рассматриваемой нуклеотидной последовательности. В частности, расположенные против хода транскрипции нуклеотидные последовательности обычно относятся к последовательностям, которые находятся с 5'-стороны кодирующей последовательности или сайта инициации транскрипции. Например, большинство промоторов расположены против хода транскрипции относительно сайта инициации транскрипции.

Термин «химически синтезированный», в отношении последовательности ДНК, значит, что сборка цепи ДНК из составляющих ее нуклеотидов была проведена in vitro. Неавтоматический химический синтез ДНК может быть выполнен с помощью хорошо отлаженных технологий, или можно осуществить автоматический химический синтез с помощью одного из нескольких коммерчески доступных приборов. Следовательно, гены можно изготовить для получения их оптимальной экспрессии, основанной на оптимизации нуклеотидной последовательности, чтобы отразить особенности состава кодонов клетки-хозяина. Специалист в данной области техники примет во внимание вероятность успешной экспрессии гена, если частота кодона смещена относительно тех кодонов, предпочтительных для хозяина. Определение предпочтительных кодонов может быть основано на исследовании генов, полученных из клетки-хозяина, если информация о последовательностях доступна.

Термины «эндонуклеаза рестрикции» и «фермент рестрикции» в настоящей зваявке взаимозаменяемы и относятся к ферменту, который связывается и разрезает специфичную нуклеотидную последовательности внутри двухцепочечной ДНК.

Термины «полипептид», «пептид» и «белок» в настоящей заявке взаимозаменяемы и относятся к полимерному соединению, содержащему ковалентно связанные аминокислотные остатки. Аминокислоты имеют следующую основную структуру.

«Полимеразная цепная реакция», сокращено ПЦР, относится к методу ферментативной амплификации in vitro нуклеотидных последовательностей. ПЦР включает повторяющиеся серии температурных циклов, каждый из которых состоит из трех стадий: денатурация матричной нуклеотидной последовательности, имеющей целью разделить цепи целевой молекулы, отжиг одноцепочечного олигонуклеотидного праймера с матричной нуклеотидной последовательностью и удлинение подвергнутого отжигу праймера (праймеров) ДНК-полимеразой.

Термин «гомология» относится к проценту идентичности между двумя полинуклеотидами или двумя полипептидными цепями. Соответствие между двумя последовательностями можно определить с помощью методик, известных специалистам в данной области. Например, гомологию можно выявить путем прямого сравнения известных последовательностей двух полипептидных молекул с помощью «выравнивания» последовательностей и использования доступных компьютерных программ. В качестве альтернативы, гомологию можно установить путем гибридизации полинуклеотидов в условиях, когда образуются стабильные дуплексы между гомологичными областями, с последующим расщеплением специфичной к одноцепочечным участкам нуклеазой и определением размеров расщепленных фрагментов.

Используемый в настоящей заявке термин «гомологичный», во всех его грамматических формах и вариациях в написании, относится к сходству между белками, имеющими «общее эволюционное происхождение», включая белки из суперсемейств (например, суперсемейство иммуноглобулинов) и гомологичные протеины разных видов (например, легкая цепь миозина и прочее) (Reeck et al., Cell 50:667 (1987)). Последовательности таких белков (и кодирующих их генов) обладают гомологией, что отражено в их высокой степени подобия. Однако термин «гомологичный» в общем употреблении и в настоящем применении, в особенности используемый с наречием «высоко», можно отнести к подобию последовательностей, но не к общему эволюционному происхождению. Таким образом, термин «подобие последовательностей», во всех его грамматических формах, относится к степени идентичности или соответствия между нуклеотидными последовательностями или аминокислотными последовательностями белков, которые могут иметь, а могут и не иметь общего эволюционного происхождения (см. Reeсk et al., Cell 50:667 (1987)). В одном из вариантов две последовательности ДНК «гомологичны в значительной степени» или «подобны в значительной степени» в случае, когда, по меньшей мере, около 21% (желательно, по меньшей мере, около 50% и еще более предпочтительно, по меньшей мере, около 75%, 90%, 95%, 96%, 97%, 98% или 99%) нуклеотидов совпадают на определенной длине последовательности ДНК. Последовательности, которые в значительной степени гомологичны, можно идентифицировать путем сравнения последовательностей с использованием имеющегося в базах данных последовательностей стандартного программного обеспечения, или в эксперименте по Саузерн-гибридизации, например, при жестких условиях, которые определяются для такой системы отдельно. Задание соответствующих условий для гибридизации может определить специалист в этой области техники (см. например, Sambrook et al., 1989).

Используемый в настоящей заявке термин «подобный в значительной степени» относится к фрагментам нуклеотидных последовательностей, где изменения в одном или более нуклеотидных основаниях приводят к замещению одной или более аминокислот, но не оказывают влияния на функциональные свойства белков, кодируемых ДНК-последовательностью. «Подобный в значительной степени» также относится к фрагментам нуклеиновых кислот, при этом изменения в одном или более нуклеотидных основаниях не влияют на способность фрагмента нуклеотидной последовательности опосредовать изменения экспрессии генов путем антисмысловой или косупрессионной технологии. «Подобный в значительной степени» также относится к модификациям фрагментов нуклеотидных последовательностей данного изобретения, таким как делеция или инсерция одного или более нуклеотидных оснований, не оказывающим значительного влияния на функциональные свойства получаемого транскрипта. Следовательно, подразумевается, что изобретением охвачены больше, чем специфические последовательности, приведенные в примерах. Каждая из представленных модификаций хорошо известна специалисту в данной области, так же как определение сохранения биологической активности кодируемых продуктов.

Более того, специалисту в данной области известно, что подобные в значительной степени последовательности, включенные в это изобретение, также характеризуются их способностью к гибридизации в жестких условиях. Молекула нуклеиновой кислоты способна гибридизоваться с другой молекулой нуклеиновой кислоты, такой как кДНК, геномная ДНК или РНК, когда одноцепочечная форма нуклеиновой кислоты может комплементарно связаться с другой молекулой нуклеиновой кислоты при соответствующих температурных условиях и ионной силе раствора (см. Sambrook et al., 1989). Условия гибридизации и промывки хорошо известны и приведены в пособии Sambrook, J., Fritsch, E.F. And Maniatis, T. Molecular Cloning. A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (1989), в особенности в Главе 11 и Таблице 11.1. Температурные условия и ионная сила определяют «жесткость» гибридизации.

Жесткость условий можно подобрать таким образом, чтобы проводить поиск умеренно подобных фрагментов, таких как гомологичные последовательности эволюционно далеких организмов, либо высокоподобных фрагментов, таких как гены, которые являются копиями функциональных ферментов от близкородственных организмов. Для предварительного скрининга гомологичных нуклеиновых кислот могут быть использованы нежесткие условия гибридизации, соответствующие температуре 55°С и, например, 5-кратному SSC, 0.1% SDS, 0.25% молока, в отсутствие формамида; или 30% формамид, 5-кратный SSC, 0.5% SDS. Умеренная жесткость условий гибридизации соответствует более высокой температуре и, например, 40% формамида с 5- или 6-кратным SSC (буфер для денатурации). Высокая жесткость условий гибридизации соответствует самой высокой температуре и, например, 50% формамида, 5- или 6-кратному SSC.

Для гибридизации необходимо, чтобы две нуклеиновые кислоты содержали комплементарные последовательности, хотя в зависимости от жесткости условий гибридизации между основаниями возможны несоответствия. Термин «комплементарный» применяют для описания связи между нуклеотидными основаниями, которые способны гибридизоваться друг с другом. Например, касательно ДНК, аденозин комплементарен тимину, а цитозин комплементарен гуанину. Таким образом, настоящее изобретение также включает отдельные фрагменты нуклеиновых кислот, которые комплементарны полным последовательностям, как здесь было описано или применено, а также тем в значительной степени подобным последовательностям нуклеиновых кислот.

В одном из вариантов осуществления изобретения полинуклеотиды выявляют путем применения условий гибридизации, содержащих этап гибридизации при 55°С, и с использованием условий, какие были описаны выше. В другом варианте осуществления изобретения температура составляет 60°С; в отдельных случаях температура достигает 63°С или 65°С.

Промывки после гибридизации также определяют жесткость условий. В одном варианте предпочтительных условий применяют серию промывок, начиная с 6-кратного SSC, 0.5% SDS при комнатной температуре в течение 15 мин, затем повторяют в 2-кратном SSC, 0.5% SDS при 45°С в течение 30 мин, а потом дважды в 0.2XSSC, 0.5% SDS при 50°С в течение 30 мин. В другом примере жестких условий применяют более высокие температуры, и где промывки идентичны упомянутым выше, за исключением температуры последних двух 30-мин промывок в 0.2XSSC, 0.5% SDS, которую увеличили до 60°С. Еще в одном примере очень жестких условий две последние промывки проводят в 0.1XSSC, 0.1% SDS при 65°С. Для гибридизации необходимо, чтобы две нуклеиновые кислоты содержали комплементарные последовательности, хотя в зависимости от жесткости гибридизации между основаниями возможны несоответствия.

Соответствующая жесткость для подвергающихся гибридизации нуклеиновых кислот зависит от длины нуклеиновых кислот и степени комплементарности (комплементации), переменных, хорошо известных специалистам в данной области. Чем больше степень подобия или гомологии между двумя нуклеотидными последовательностями, тем выше значение температуры для получения гибридов нуклеиновых кислот, имеющих такие последовательности. Относительная стабильность (соответствующая более высокой температуре) гибридизации нуклеиновых кислот уменьшается в следующем порядке: РНК:РНК, ДНК:РНК, ДНК:ДНК. Формулы для вычисления температуры для гибридов длиной более 100 нуклеотидов были получены (см. Sambrook et al., 9.50-0.51). Для гибридизации более коротких нуклеиновых кислот, например олигонуклеотидов, расположение несоответствий становится более важным и длина олигонуклеотидов определяет ее (гибри