Выделенная последовательность днк, вектор, способ получения гомогенного белка gp350, гомогенный белок gp350, фармацевтическая композиция для лечения евv-связанного заболевания или состояния
Реферат
Предложена выделенная ДНК, кодирующая белок gp350. Белок gp350 используется в фармацевтической композиции для лечения EBV-связанного заболевания или состояния. Выделенная ДНК входит в состав вектора, который вводят в клетку-хозяин, где происходит экспрессия белка gp350. ДНК в составе вектора исключает продуцирование белка gp220 и продуцирует только gp350. 6 с. и 2 з. п. ф-лы, 5 ил. , 3 табл.
Вирус Эпштейна-Барра (Epstein-Barr= EBV), член группы герпесвирусов, вызывает у людей инфекционный мононуклеоз. Это заболевание поражает более чем 90% населения. Аналитики здравоохранения оценивают потери, связанные с этим заболеванием в Соединенных Штатах, в 100 миллионов долларов ежегодно. Этот вирус распространяется преимущественно капельным путем со слюной индивидуумов, распространяющих этот вирус. Дети, инфицированные EBV, в большинстве случаев асимптотичны или у них очень слабые симптомы, тогда как у подростков или у взрослых при инфицировании развиваются типичные инфекционные мононуклеозы, характеризующиеся лихорадкой, фарингитами и аденопатией. У людей, которые были инфицированы, анти-EBV антитела сохраняются в течение всей остальной жизни, и поэтому они имеют иммунитет к последующим инфекциям. В настоящее время не существует коммерчески доступных EBV вакцин.
Помимо своих инфекционных характеристик, было показано, что EBV трансформирует лимфоциты в быстро делящиеся клетки, и поэтому косвенным образом связан с различными лимфомами, включая лимфому Burkitts или оральную волосистую лейкоплакию. EBV были также обнаружены в образцах тканей от индивидуумов с назофарингеальными опухолями. По всему миру насчитывается порядка 80000 случаев рака носоглотки, и он превалирует у этнических китайцев. Разработка живой, ослабленной вакцины для EBV была и остается серьезной проблемой. Из-за потенциального онкогенного характера, связанного с EBV, исследователи возражали против использования подходов, связанных с живыми вакцинами. Это изобретение позволяет преодолеть проблемы, связанные с живыми вакцинами, за счет создания способов и композиций для субъединичных вакцин, которые не требуют использования потенциально онкогенных живых вирусов. Субъединичная вакцина представляет собой один или более из антигенных протеинов из вируса, которые вызовут иммунную реакцию и выработают иммунитет. Два из наиболее важных антигенных EBV протеинов являются гликопротеинами gр350/300 и gр220/200, которые образуют часть оболочки вирусной мембраны и позволяют вирусным частицам связываться с мишеневыми клетками человека и проникать в них за счет взаимодействия с протеином клеточных мембран, CD21. См. Nemerow, J. Virology 61: 1416 (1987). Они были давно отмечены как кандидаты для субъединичных вакцин, но трудности в получении антигенно активного протеина, выделенного из природных источников, и низкие выходы гликопротеинов при получении их из рекомбинантных источников затруднят и попытки исследователей и разработку вакцин. В литературе указано, что эти протеины имеют различные интервалы молекулярных весов (350 или 300 килодальтон /кД/ для одного из протеинов и 220 или 200 килодальтон для другого протеина). Здесь протеин gр350 или 300 именуется как gр350, а протеин 220 или 200 здесь обозначается как протеин gр220. В целом оба эти протеина здесь обозначают как gр350/220 протеин (протеины). Альтернативно сплайсированный, отдельный ген кодирует gр350/220 протеины и приводит к созданию gр350 и gр220 мРНК транскриптов; причем неизвестны природные варианты сайтов сплайсинга гена gр350/200. Генные продукты двух продуктов экспрессии представляют собой gр350 и gр220 протеины. Открытая считывающая рамка для gр350/220 ДНК последовательности составляет 2721 пару оснований (bр). Вся считывающая рамка кодирует 907 аминокислот gр350. См. патент США 4707358, выданный Kieff (1987). Сплайсированный вариант считывающей рамки охватывает 2130 оснований и транслирует в gр220 протеин последовательность 710 аминокислот. Теоритический молекулярный вес gр350 протеина и gр220 протеина составляет 95 кД и 70 кД, соответственно. Измеренные молекулярные веса экспрессированных gр350 протеина и gр220 протеина варьируются, но составляют примерно 350 килодальтон и 220 килодальтон, соответственно. Интенсивное гликозилирование протеинов ответственно за различия между предсказанным и реальным молекулярными весами. В каждой из отдельных клеток оба протеина, gр350 и gр220, продуцируются в молярном отношении от около 6: 1 до 1: 1. Так, например, в клетках В95-8, которые устойчиво инфицированы EBV, это отношение, по-видимому, варьируется, но иногда достигает значений 6: 1. См. Miller, Proc. Natl. Acad. Sci 69: 383 (1972). Аналогично, рекомбинантное получение этих гликопротеинов поэтому обычно приводит к смеси gр350 и gр220 протеинов. До сих пор gр350/220 протеины экспрессировали в клетки крысиного гипофиза, в клетки яичников китайского хомяка VERO, почек африканской зеленой обезьяны, а также в дрожжевые клетки. См. Whang, J. Virol. 61: 1796 (1982), Motz, Gene 44: 353 (1986) и Emini Virology 166: 387 (1988). Система экспрессии вируса бычьей папилломы была использована для получения gр350/220 протеинов в мышиных фибробластных клетках. См. Madej, Vaccine 10: 777 (1992). Лабораторные и вакцинные штаммы вакцинного вируса также были использованы для экспрессии gр350/220 протеинов. Модифицированные рекомбинантные варианты EBV gp350/220 ДНК и протеин известны специалистам. Более конкретно, были сконструированы рекомбинантные усеченные конструкции gp350/220 гена, не содержащие соединяющих с мембраной последовательностей. Такие конструкции все еще продуцируют смесь двух gр350 и gр220, но делеция участка связывания с мембраной допускает секрецию протеина. См. Finerty, J. Gen. Virology 73: 449 (1992) и Madej J. Vaccine 10: 777 (1992). Кроме того, были также получены различные рекомбинантно полученные рестрикционные фрагменты и протеины слияния, содержащие различные gp350/220 последовательности, и они были экспрессированы в E. coli. См. ЕР патентную публикацию 0173254, опубликованную 24 июля 1991 г. Соответственно, исследования EBV, касающиеся gр350/220, до настоящего времени были сфокусированы на получении эффективной экспрессии нативной gр350/220 последовательности или на модифицированой последовательности, не содержащей трансмембранного домена, что приводило к получению смеси двух альтернативно сплайсированных вариантов нативного, или не содержащего трансмембранного домена протеина, или на получении последовательностей эпитопного фрагмента в -галактозидазных протеинах слияния. Известны частично очищенные препараты gр350/220. См. Finerty, J. Gen. Virology 73: 449 (1992) (рекомбинантно получены, частично очищены). Что касается нативного gp350/220 протеина, то в большинстве случаев процесс очистки протеинов приводит к инактивированию антигенности протеина, что делает неприемлемым его использование в субъединичной вакцине. Однако, высокой степени очистки препараты антигенно активного gp350 протеина из нативных (т. е. не рекомбинантных) источников, все-таки были получены, как сообщалось в литературе. См. David, J. Immunol Methods 108: 231 (1988). Кроме того, вирус рекомбинантной вакцины, экспрессирующий gp350/220 протеин, был использован для вакцинации хлопчатникового тамарина против индуцированной EBV лимфомы. См. J. Med. Virology 25: 189 (1988), Mackett, EMBO J. 4: 3229 (1985) и Mackett, VACCINES 86, рр 293 (Lerner RA, Chanock RM, Brown F Eds 1986, Cold Spring Harbor Laboratory). Однако, до сих пор не была сконструирована вирусная gp350/220 ДНК последовательность с тем, чтобы обеспечить экспрессию отдельно одного или другого сплайсированного варианта гена, что обеспечило бы продуцирование чистого gp350 или gр220 протеина. Не были также сконструированы рекомбинантные или мутантные вирусы, которые экспрессировали бы тот или иной из gp350 и gр220 протеинов. Обычно сплайсинговые сайты облегчают процессинг пре-мРНК молекул в мРНК. В вирусе полиомы сайты сплайсинга необходимы для эффективного накопления последующих мРНК. Изменение 3' и 5' сплайсинговых сайтов в транскриптах вируса полиомы снижает или полностью блокирует накопление мРНК. См. Treisman Nature 292: 595 (1981). В вирусе SV40 иссекаемые интроны облегчают транспорт мРНК из ядер и мРНК стабилизацию в ядрах, и так как эти интрон/эксон соединяющие последовательности облегчают связывание мелких ядер, RNP частиц, считают, что пресплайсированная мРНК может оказаться не в состоянии нужным образом включаться в схему процессинга. Было показано, что точечные мутации по сайгам сплайсинга эксон/интрон уменьшают расщепление эксон/интрон и могут нарушить пре-мРНК процессинг, ядерный транспорт и стабильность. См. Ryu, J. Virology 63: 4386 (1989) и Gross, Nature 286: 634 (1980). Поэтому до настоящего изобретения влияние модификации сайтов сплайсинга на функциональную экспрессию и антигенную активность протеинов, кодируемых EBV gp350/220 последовательностью, было совершенно неизвестно и непредсказуемо. Дополнительная известная по данному вопросу литература включает следующее. EBV биология и заболевание в общем плане приведены в обзоре Straus, Annal of Int. Med. 118: 45 (1993). Описание EBV BLLFI открытой считывающей рамки приведено у Baer, Nature 310: 207 (1984). Описание ДНК и аминокислотных последовательностей gp350/220 вируса Эпштейн-Барра приведены в статье Beisel, J. Virology 54: 665 (1985) и Biggin, EMBO J. 3: 1083 (1984) и в патентах США 4707358, выданных Kieff et. al (1987). Сравнение ДНК последовательностей, кодирующих gp350/220 в вирусах Эпштейн-Барра типов А и В, раскрыто у Lee, Virology 195: 578 (1993). Моноклональные антитела, которые демонстрируют нейтрализующую активность против gp350/220 гликопротеина EBV, раскрыты у Thorley-Lawson, Proc. Natl. Acad. Sci. 77: 5307 (1980). И, наконец, сайты сплайсинга для консенсусных последовательностей для донорных и акцепторных сайтов сплайсинга раскрыты у Mount, Nucleic Acids Res 10: 459 (1982). В одном аспекте настоящего изобретения предложены нон-сплайсинговые варианты EBV gp350/220 ДНК последовательности. ДНК последовательности настоящего изобретения могут включать выделенную ДНК последовательность, которая кодирует экспрессию гомогенного gp350 протеина. ДНК последовательность, кодирующая gp350 протеин, характеризуется как последовательность, содержащая идентичную или практически идентичную нуклеотидной последовательности на фиг. 1, где нативные нуклеотидные последовательности донорных и акцепторных сайтов сплайсинга заменены на ненативные нуклеотиды и их фрагменты. ДНК последовательность может включать 5' и 3' некодирующие последовательности, фланкирующие кодирующую последовательность, и далее включать аминотерминальную сигнальную последовательность. Фиг. 1 иллюстрирует некодирующие последовательности и указывает конец предполагаемой сигнальной последовательности звездочкой. Однако, очевидно, что ДНК последовательности настоящего изобретения могут не содержать некоторые или все из этих фланкирующих последовательностей или сигнальных последовательностей. ДНК последовательности нон-сплайсинговых вариантов настоящего изобретения получают за счет введения мутаций в представленную на фиг. 1 ДНК последовательность в донорных и акцепторных сплайсинговых сайтах гена, кодирующего gp350/220/. Это исключает продуцирование gp220 протеина, так что продуцируется только gp350 протеин. Соответственно, другой аспект изобретения включает гомогенные gp350 протеины и способы получения протеинов за счет экспрессии нон-сплайсинговых вариантов EBV gp350/220 ДНК последовательности в клетках соответствующих прокариотных или эукариотных хозяев. Что касается терминов, используемых в отношении gp350 протеинов, гомогенность означает полное или практически полное отсутствие gp220 протеина. Мы отмечаем, что гомогенный gp350 протеин, рекомбинантно полученный в клетках млекопитающих или насекомых, насколько нам известно, никогда не упоминался до сих пор в научной литературе. В еще одном аспекте предложены гомогенные gp350 протеины, содержащие дополнительные делеции, в секретируемом продукте. Такие делеции включают либо удаление трансмембранного участка, либо удаление трансмембранного участка и остального С-конца gp350. Такие дополнительно модифицированные ДНК последовательности и кодируемые ими протеины составляют еще один аспект изобретения. Предложена также рекомбинантная ДНК молекула, содержащая векторную ДНК и ДНК последовательность, кодирующую гомогенный gp350 протеин. ДНК молекула обеспечивает gp350 последовательность, оперативно связанную с подходящей регуляторной последовательностью, способной управлять репликацией и экспрессией гомогенного gp350 в клетках выбранного хозяина. Клетки хозяина, трансформированные такими ДНК молекулами, для использования при экспрессии рекомбинантных гомогенных gp350, также предоставлены в этом изобретении. ДНК молекулы и трансформированные клетки хозяев в настоящем изобретении используют в другом аспекте изобретения, в новом способе получения рекомбинантного гомогенного gp350 протеина или его фрагментов. В этом способе клеточную линию, трансформированную ДНК последовательностью, кодирующей гомогенный gp350 протеин или его фрагмент (или описанную выше рекомбинантную молекулу ДНК), оперативно связанную с подходящей регуляторной или контролирующей экспрессию последовательностью, способной контролировать экспрессию протеина, культивируют в соответствующих условиях, обеспечивающих экспрессию рекомбинантной ДНК. Затем экспрессированные протеины собирают из клеток хозяина или культуральной среды с помощью обычных средств. В качестве клеток хозяина в этом способе можно использовать ряд известных клеток; в настоящее время предпочтительны клетки млекопитающих и клетки насекомых. ДНК последовательности и протеины настоящего изобретения можно использовать при получении терапевтических и иммуногенных соединений, содержащих EBV антигенные детерминанты. Такие соединения находят применение в субъединичных вакцинах для профилактики, лечения и предотвращения таких заболеваний, связанных с EBV, как мононуклеоз, лимфома Буркетта и карцинома носоглотки. Соответственно, в еще одном аспекте настоящего изобретения представлены такие терапевтические и/или иммуногенные фармацевтические композиции для предотвращения и лечения таких связанных с EBV состояний и заболеваний у человека, как инфекционный мононуклеоз, лимфома Буркетта и карцинома носоглотки. Такие терапевтические и/или иммуногенные фармацевтические композиции включают иммуногенно индуцирующее эффективное количество одного или более из гомогенных gp350 протеинов настоящего изобретения в смеси с фармацевтически приемлемым носителем, таким, как гидроксид алюминия, физиологический раствор или фосфатный буферированный физиологический раствор, как это известно специалистам. Под "иммуногенно индуцирующим" подразумевают количество, которого достаточно для стимулирования у млекопитающего продуцирования антител к EBV. В другом варианте, активный ингредиент можно вводить в форме содержащих липосомы агрегатов. Для профилактического применения такие фармацевтические композиции могут быть выполнены в форме субъединичных вакцин для введения людям. Пациентов можно вакцинировать дозой, достаточной для стимулирования образования у пациента антител; и повторно вакцинировать спустя шесть месяцев или год. В следующем аспекте изобретения предложен способ лечения связанных с EBV заболеваний и состояний за счет введения пациенту, в частности человеку, иммуногенно индуцирующего терапевтически эффективного количества гомогенного gp350 протеина в подходящем фармацевтическом носителе. Еще одним способом изобретения является способ стимуляции иммунной реакции против EBV за счет введения пациенту иммуногенно индуцирующего эффективного количества гомогенного gp350 протеина в подходящем фармацевтическом носителе. Фиг. 1 иллюстрирует ДНК и аминокислотную последовательность gp350/220 (из Beisel, J. Virology 54: 665 (1985)). Указаны донорные и акцепторные сплайсинговые сайты. Трансмембранный участок обозначен горизонтальными стрелками, а звездочкой (*) отмечен конец предположительной сигнальной последовательности. Нумерация нуклеотидов представлена слева; нумерация аминокислот - справа. Фиг. 2 иллюстрирует конструирование gp350 делеции и сайт-направленных мутантов. Плазмидные карты, обозначенные как pMDTM и pMSTOP, представляют примеры нон-сплайсинговых вариантов gp350/220 настоящего изобретения. На фиг. 2А линейная модель gp350 протеина представлена примерно в масштабе с кодирующим клоном, BLLF1 (изображен внизу). На протеине указаны N-терминальная сигнальная последовательность (SS) и трансмембранный домен (ТМ), а на диаграмме гена изображены важные рестрикционные сайты. gp350 ген был клонирован в два сегмента, HindIII/BfaI BLSH1 фрагмент и BanI/HindIII BLSH2 фрагмент. SCYT создают, используя полимеразную цепную реакцию, начиная с указанного участка BLLF1. Фиг. 2В иллюстрирует схему клонирования для pDTM, pSTOP, pMDTM и pMSTOP (плазмиды не в масштабе). Подробности схемы клонирования приведены в примерах 1 и 2. На плазмидных картах отмечены соответствующие рестрикционные сайты, используемые векторы клонирования и gp350 генные фрагменты. Мутации сайтов сплайсинга в pMDTM и pMSTOP отмечены звездочками. Фиг. 3 иллюстрирует результаты иммуноосаждения гомогенного gp350 протеина из pMDTM клонов в анализе SDS-PAGE. Позитивные контрольные клетки (GH319), секретирующие усеченную форму gp350/220 протеина, негативные контрольные клетки (рЕЕ14) и некоторые pMDTM клоны метаболически помечены 35S метионином в течение 5,5 часа; гомогенный gp350 протеин был иммуноосажден из надосадочных жидкостей тканевых культур. Для каждого типа клеток образцы надосадочных жидкостей тканевых культур (S) и осажденные gp350/220 (Iр) обрабатывали электрофоретически на 5% SDS-PAGE (электрофорез в полиакриламидном геле). Слева представлены маркеры молекулярных весов. Фиг. 4 представляет результаты Норзернблоттинга протеина из pMDTM клонов, экспрессированных в СНО клетках, как указано в примерах 3, 4. Раскрыты композиции и способы, включающие клонированные EBV ДНК последовательности, кодирующие нон-сплайсинговые варианты gp350 протеина. Как было указано, такие нон-сплайсинговые варианты здесь обозначаются как гомогенные gp350 протеины. Обычно, если gp350/220 ген экспрессируется в клетках млекопитающих, вырабатываются два генных продукта, gp350 и gp220, за счет РНК сплайсинга гена. Настоящее изобретение дает возможность получать только один генный продукт, gp350. Настоящее изобретение включает удаление нескольких или всех РНК сплайсинговых сайтовых сигналов в gp350 гене и экспрессию гена в клетки подходящего хозяина. Мутации gp350/220 гена вводят для предотвращения продуцирования 220 кД версии протеина, когда gp350/220 экспрессируют в клетках млекопитающих. В результате получают мРНК транскрипты, кодирующие только gp350. Исключение gp220 экспрессии за счет использования gp350/220 нон-сплайсингового варианта gp350/220 гена приводит к усиленному продуцированию gp350 по сравнению с gp220. Продуцирование gp220 не существенно для продуцирования эффективно анти-EBV вакцины, так как gp350 содержит все потенциально антигенные сайты, находящиеся на gp220. Поэтому в одном аспекте настоящее изобретение обеспечивает ДНК последовательность, кодирующую полипептидную последовательность, практически такую же, что и gp350, за исключением того, что кодон донорного сплайсингового сайта, кодирующий аминокислоту 501, и кодон акцепторного сплайсингового сайта, кодирующий аминокислоту 698, были модифицированы за счет замены нативных нуклеотидов ненативными нуклеотидами. Предпочтительно, нативные нуклеотиды заменять ненативными нуклеотидами таким образом, чтобы аминокислотные последовательности оставались такими же. Так например, нативные нуклеотиды AAGT в донорном сплайсинговом сайте (нуклеотиды 1500-1504) и нативные нуклеотиды А и Т, фланкирующие GG акцепторный сплайсинговый сайт (нуклеотиды 2091 и 2094), заменяют нуклеотидами GTCA и Т и А, соответственно. Соответственно, в результате такой замены в донорном сайте глутамин в положении аминокислоты 500 и серин в положении 501 остаются теми же. Аналогично, в результате модификации в акцепторном сайте треонин в положении аминокислоты 697 и глицин в положении 698 остаются теми же. Аналогично, замещения отличаются от тех, которые были приведены в качестве примера, могут быть легко осуществлены специалистами, как более подробно указано далее. Поэтому в одном из аспектов настоящее изобретение включает гомогенные gp350 протеины. Гомогенные gp350 протеины отличаются далее тем, что имеют аминокислотную последовательность, практически такую же, что представлена на фиг. 1, с аминокислоты 1 до 907, с аминокислоты 1 до 862 или с аминокислоты 1 до 907, исключая аминокислоты 863-881, причем каждая может содержать или не содержать N-терминальную сигнальную последовательность из 18 аминокислот. Кроме того, предложены аналоги гомогенных gp350 протеинов и они включают мутанты, в которых существуют вариации в аминокислотных последовательностях, которые сохраняют агтигенную активность, и, предпочтительно, гомологичны на, по крайней мере, 80%, более предпочтительно 90% и еще более предпочтительно на 95% с соответствующим участком гомогенных gp350 протеинов. Примеры включают протеины и полипептиды с небольшими аминокислотными вариациями в аминокислотной последовательности, представленной на фиг. 1; в частности, с заменами консервативных аминокислот. Консервативными заменами являются те, которые имеют место внутри семейства аминокислот, которые родственны по своим боковым цепям. Генетически кодиируемые аминокислоты обычно делятся на 4 семейства: (1) кислотные = аспартат, глутамат; (2) основные = лизин, аргинин, гистидин; (3) неполярные = аланин, валин, лейцин, изолейцин, пролин, фенилаланин, метионин, триптофан и (4) незаряженные полярные = глицин, аспарагин, глутамин, цистеин, серин, треонин, тирозин. Фенилаланин, триптофан и тирозин иногда классифицируют как ароматические аминокислоты. Так например, разумно предположить, что отдельная замена лейцина или аналогичное консервативное замещение аминокислот структурно родственными аминокислотами не окажет значительного влияния на антигенную активность или функциональность. Настоящее изобретение предлагает преимущество более простого выделения gp350. Так как gp350 и gp220 отличаются сходными биохимическими свойствами, gp220 часто выделяется совместно с gp350 при очистке препаратов. Клеточная экспрессия только нон-сплайсингового варианта gp350/220 гена упрощает выделение протеина. Это снижает стоимость получения gp350. Настоящее изобретение также делает более простым получение биохимических характеристик исходного материала для выделения gp350. Благодаря наличию только одного вида анализ содержания протеина и анализ аминокислотной последовательности можно осуществлять без учета присутствия второго вида. Настоящее изобретение дополнительно предлагает преимущество усиленного продуцирования gp350 протеина. Предотвращение сплайсинга gp350 гена смещает продуцирование клеткой двух продуктов (gp350 и gp220) на продуцирование только gp350. В некоторых клетках, как было оценено, концентрации gp220 составляют 30-100% от gp350 концентрации. При исключении сплайсинга гена продуцирование gp350 повышается за счет отсутствия продуцирования gp220. ДНК последовательность gp350/220 гена описана Beisel, J. Virology 54: 665 (1985) и Biggin, EMBO J. 3: 1083 (1984) и представлена на фиг. 1. Ген представляет считывающую рамку из 2721 оснований, кодирующую 907 аминокислот и определяющий продукт первичной трансляции около 95 кД. Различие между предсказанным и реальным значениями связано с интенсивным гликозилированием протеина. 591 основание (кодируют 197 аминокислот) удалены в результате сплайсинга для исключения продуцирования gp220. Кажущийся молекулярный вес gp350/220 генного продукта может также меняться в зависимости от типа используемой измерительной системы, утилизации сайтов гликозилирования и различных типов клеток, различий в посттрансляционном процессинге или селективной генной мутации. Измеряемые величины варьируются для продуктов различных вариантов нон-сплайсинговых сайтов gp350/220 гена, но термин "гомогенный gp350 протеин или протеины" охватывает генные продукты нон-сплайсинговых вариантов, необязательно содержащих дополнительные делеции или мутации, такие, как С-терминальные делеции и/или трансмембранные модификации, также описываемые здесь. Термин "gp220 протеин" относится к альтернативно сплайсированному gp350/220 продукту с молекулярным весом примерно 220 кД. Сайты сплайсинга в gp350/220 генном продукте были определены за счет сравнения gp350/220 гена с консенсусными донорными и акцепторными сплайсинговыми последовательностями, основанными на других генах, преимущественно из эукариотных организмов. Консенсусные последовательности, выявленные Mount, Nucleic Acids Res. 10: 459 (1982) при изучении сайтов сплайсинга в других генах, имеют вид: Звездочки у оснований сверху обозначают основания, которые появляются в 100% всех сайтов сплайсинга (высоко консервативны). Положения с двумя основаниями или одним основанием представляют консервативные положения. Знак / указывает реальный сайт сплайсинга. В gp350/220 гене донорный сайт сплайсинга расположен после нуклеотида 1051, а акцепторный сайт сплайсинга после нуклеотида 2092, как видно из ДНК последовательности (Biggin EMBO J. 3: 1083 (1984)) гена gp350/220. (Используемая здесь нумерация и нумерация на фиг. 1 соответствует нумерации у Biggin). Сайт сплайсинга расположен в соответствующем участке гена в штамме EBV типа В (донорный сплайсинговый сайт после A1501 и акцепторный сплайсинговый сайт после G2029). Настоящее изобретение охватывает композиции, полученные с использованием сайтов сплайсинга либо А, либо В штаммов или других EBV штаммов для получения отдельного вида мРНК из gp350/220 гена. ДНК последовательность типа А из вируса из штамма В95-8 была использована в примерах, хотя в той же степени можно использовать ДНК последовательность штамма типа В, так как транслированные генные продукты штаммов типа А и В идентичны. В В штамме отсутствуют аминокислоты 507-520 и 570-576. Штамм типа А используют благодаря тому, что он содержит все возможные gp350 антигенные сайты. В другом варианте можно использовать EBV gp350/220, содержащий штамм-специфические последовательности в соответствии с имеющимися здесь указаниями, что будут продуцироваться EBV штамм-специфические гомогенные gp350 протеины, обладающие иммуногенными свойствами, специфичными для конкретного штамма, и поэтому пригодные для использования в иммуногенных и/или терапевтических композициях для предотвращения или лечения заболеваний, связанных со штамм-специфическими EBV. В таблице 1 представлены дикого типа нуклеотидные и аминокислотные последовательности для донорного и акцепторного сайтов сплайсинга. Чтобы предотвратить РНК сплайсинг gp350/220 гена, в последовательность нуклеиновых кислот gp350/220 гена вводят мутации для замены соответствующих пар оснований сайта сплайсинга РНК. Для придания нефункциональности сайту сплайсинга, предпочтительно, по крайней мере, одно из оснований, выбранных из двух высоко консервативных оснований, ограничивающих донорный сайт или акцепторный сайт, следует заменить неконсервативными основаниями, более предпочтительно, по крайней мере, два высоко консервативных основания следует мутировать в неконсервативные основания. Другие консервативные основания, на расстоянии более двух оснований от сайта сплайсинга, также можно заменить неконсервативными основаниями сайта сплайсинга для дальнейшего ухудшения распознавания сайта сплайсинга. Как донорный, так и акцепторный сайты можно изменить, чтобы нарушить механизм сплайсинга. Предпочтительно, чтобы как донор, так и акцептор содержали, по крайней мере, по одному изменению в каждом, в одном из четырех высоко консервативных положений оснований сайта сплайсинга, и более предпочтительно, по крайней мере, по два изменения в двух из четырех высоко консервативных положений оснований сайта сплайсинга. Если один из сайтов сплайсинга не может быть подвергнут мутации из-за желания сохранить дикого типа аминокислотную последовательность, тогда предпочтительно вводить, по крайней мере, две мутации в другой сайт сплайсинга. Мутации по gp350/220 сайтам сплайсинга могут вводить изменения в аминокислотную последовательность экспрессируемого впоследствии gp350 протеина. Предпочтительно, чтобы такие изменения были бы замещениями консервативных аминокислот. Консервативные замещения в аминокислотной последовательности, в противоположность неконсервативным изменениям в аминокислотной последовательности, помогут сохранить антигенные сайты. Изменения консервативных амнокислот можно осуществлять до тех пор, пока изменение основания (или изменения оснований) не приведут к подходящим изменениям в инвариантных донорных/акцепторных основаниях. Так например, Gly может заменить Ser501 в донорном сплайсинговом сайте, используя любой Gly-специфический кодон, отличный от GGU (использование GGU сохраняет G нуклеотид и не приведет к желательной замене GT в сигнале сплайсинга). Аналогично, в акцепторном сплайсинговом сайте замена Gly698 на А1а будет консервативным изменением, но так как все А1а кодоны начинаются с высоко консервативного G нуклеотида, это не может привести к нужной замене. Хотя пролин также может быть изменением консервативной аминокислоты, пролин не следует использовать для замены дикого типа аминокислоты, так как это приведет к модификации третичной структуры протеина, и за счет этого замаскирует один или более из gp350 антигенных сайтов. В таблице 1 представлены приемлемые консервативные аминокислотные замещения в дикого типа последовательностях. Внизу таблицы 1 представлен пример мутации с консервативными изменениями аминокислот. Хотя один из аспектов настоящего изобретения включает неспецифический вариант gр350/220, могут оказаться желательными и дополнительные мутации gр350/220 кодирующей последовательности. Для получения растворимых гомогенных gр350/220 протеинов ("растворимые протеины" либо свободны в растворе, либо ассоциированы с мембраной, но не интегрированы с мембраной), например, чтобы избежать проблем клеточной токсичности, возникающей при экспрессии полной длины gр350 в качестве интегрального мембранного протеина, соединяющий с мембраной участок (известный также как трансмембранный участок) gр350 модифицируют за счет делеции всей или части его кодирующей ДНК последовательности. Соединяющий с мембраной участок gр350/220 включает аминокислоты 861 (метионин) до 881 (аланин). См. Beisel, J. Virology 54: 665 (1985). Предпочтительно, чтобы, по крайней мере, 8 аминокислот трансмембранного участка были подвергнуты делеции, более предпочтительно, чтобы были подвергнуты делеции 12 аминокислот, и наиболее предпочтительно, чтобы были подвергнуты делеции от 12 до 18 аминокислот. Соответственно, в другом аспекте в настоящем изобретении предложены нон-сплайсинговые варианты gp350/220 ДНК и/или gp350 гомогенные протеины, которые дополнительно содержат, по крайней мере, одну делецию в трансмембранном участке gp350/220 ДНК и/или gp350 гомогенном протеине, что приводит к экспрессии растворимого гомогенного gp350 протеина. Помимо делеции всего или части трансмембранного домена нон-сплайсингового gp350/220 варианта, можно также подвергнуть делеции целиком или частично, как здесь описано, С-терминальную последовательность, следующую после трансмембранного домена, включающую аминокислоты 881-907, в соответствии с настоящим изобретением. Таким образом, в еще одном аспекте настоящее изобретение включает нон-сплайсинговые варианты gp350/220 ДНК и/или гомогенный протеин, дополнительно модифицированные за счет делеции всей или части кодирующей ДНК, и/или аминокислотной последовательности, содержащей трансмембранный участок gp350/220 и даже дополнительно модифицированной за счет делеции остальной С-терминальной ДНК и/или аминокислотной последовательности gp350/220. Соответственно, другой аспект настоящего изобретения включает нон-сплайсинговые варианты ДНК последовательностей, кодирующих гомогенные gp350 протеины настоящего изобретения. Такие ДНК последовательности включают ДНК последовательность, представленную на фиг. 1, кодирующую аминокислоты 1-907, и далее включают нуклеотидные замещения, о которых шла речь, для удаления донорных и акцепторных саитов сплайсинга. Такие ДНК последовательности необязательно включают усеченные ДНК последовательности, в которых нуклеотиды, кодирующие целиком или часть трансмембранного домена и С-конца, включающие аминокислоты 861-907, подвергаются делеции, и варианты делеции, в которых нуклеотиды, кодирующие целиком или часть трансмембранного домена, включающего аминокислоты 861-881, подвергаются делеции. ДНК последовательности настоящего изобретения, кодирующие гомогенные gp350 протеины, могут также включать ДНК, способные к гибридизации в условиях соответствующей жесткости, или которые могут быть способны к гибридизации в таких условиях, но без разрушения генетического кода, для выделения ДНК последовательности, представленной на фиг. 1. Соответственно, ДНК последовательности настоящего изобретения могут содержать модификации в некодирующих последовательностях, сигнальные последовательности или кодирующие последовательности, на основе аллельных вариантов или преднамеренных модификаций. Эти нон-сплайсинговые варианты gp350/220 ДНК последовательностей, как здесь раскрыто, можно сконструировать, используя хорошо известные специалистам способы. Модифицированные ДНК последовательности настоящего изобретения можно экспрессировать рекомбинантно, используя известные способы для получения гомогенных gp350 протеинов настоящего изобретения. Такие рекомбинантные протеины можно выделить и включить в фармацевтические композиции для профилактического лечения и предотвращения заболеваний, связанных с EBV. Нон-сплайсинговые варианты gp350/220 ДНК настоящего изобретения можно экспрессировать рекомбинантно в различные типы клеток, используя соответствующие системы контроля за экспрессией, которые известны специалистам. Подходящие клетки, известные и доступные специалистам, включают (но не ограничиваются ими) такие дрожжевые клетки, как Saccharomyces cerevisiae, такие бактериальные клетки, как E. coli и Bacillus subtilis, и такие клетки млекопитающих, как GH3, СНО, NSO, MDCK и С-127 клетки. Векторы, которые используют с этими типами клеток, выбирают на основе их совместимости с типом клеток и используемой системой векторного контроля. Клетки и векторы, которые обеспечивают экспрессию секретированных продуктов gp350/220 гена, являются предпочтительными. Так например, E. coli трансформируют, используя производные pBR322, которая была модифицирована с использованием обычной методики так, чтобы она содержала ДНК последовательности для экспрессии целевого протеина, в этом случае нон-сплайсинговые вариантные последовательности EBV gp350, содержащие или не содержащие последовательности, кодирующие С-концы и/или участок, соединяющий с мембраной. pBR322 содержит гены устойчивости к ампициллину и тетрациклину, которые можно использовать в качестве маркеров. См. Bolivar, Gene 2: 95 (1977). Обычно используемые последовательности контроля экспрессии, то есть промоторы для инициирования транскрипции и необязательно оператор или энхансер, включают бета-лактамазную и lac промоторные системы (см. Chang, Nature 198: 1056 (1977)), триптофановую промоторную систему (см. Goeddel, Nucleic Acids Res. 8: 4057 (1980)) и лямбда-производный PL промотор и N-генный рибосомный сайт связывания (см. Shimatake, Nature 292: 128 (1981)). Однако, можно использовать любую доступную промоторную систему или систему контроля за экспрессией, если только она совместима с клетками прокариотного хозяина. Другие примеры клеток хозяев, плазмид и векторов экспрессии раскрыты в патенте США, выданном Itakura (1982) под 4356270, 4431739, выданном Riggs (1984) и 440859, выданном Rutter (1984). В качестве клеток-хозяев можно также использовать клетки насекомых, используя экспрессию клеток насекомых. В случае экспрессии в клетках насекомых, обычно компоненты системы экспрессии включают вектор переноса, обычно бактериальную плазмиду, которая содержит и фрагмент бакуловирусного генома, и удобный рестрикционный сайт для встраивания гетерологичных генов или генов, которые нужно экспрессировать; дикого типа бакуловирусы с последовательностью, гомологичной бакуловирус-специфичному фрагменту в векторе переноса (это позволяет обеспечить гомологичную рекомбинацию гетерологичного гена в бакуловирусный геном); и соответствующие клетки насекомого-хозяина и ростовую среду. В настоящее время наиболее часто используемым вектором переноса д