Переформатирование кадров вокодера с переменной скоростью для межсистемной передачи

Иллюстрации

Показать все

Изобретение относится к передаче данных, более точно, к переформатированию кадров вокодера с переменной скоростью для системной передачи. Представлены способ и устройство для поддержки передачи кадров вокодера с переменной скоростью через несовместимые коммуникационные каналы. Кадры вокодера с переменной скоростью переформатируют в виде полезной нагрузки многоскоростных кадров вокодера. В приемнике выполняют определение, содержит ли принятый многоскоростной кадр вокодера кадр вокодера с переменной скоростью в качестве полезной нагрузки. Если полезная нагрузка представляет собой кадр вокодера с переменной скоростью, определяют тип кадра. Представлены различные варианты транспортировки информации полезной нагрузки. Технический результат - обеспечение возможности несовместимым системам пропускать кадры вокодера с переменной скоростью без переноса их в форматы кадров вокодера с фиксированной скоростью или многоскоростного вокодера. 23 н. и 9 з.п. ф-лы, 10 ил., 13 табл.

Реферат

Область техники, к которой относится изобретение

[1001] Изобретение относится к передаче данных. Более точно, настоящее изобретение относится к переформатированию кадров вокодера с переменной скоростью для межсистемной передачи.

Уровень техники

[1002] Область беспроводной связи имеет множество приложений, в том числе, например, беспроводная телефония, пейджинг, беспроводные локальные линии, персональные цифровые помощники (ПЦП), интернет телефония и спутниковые системы связи. Особенно важным приложением являются сотовые телефонные системы для удаленных абонентов. Как используется в настоящем описании, термин "сотовая" система включает в себя системы, использующие либо частоты сотовый, либо частоты услуг персональной связи (УПС). Были разработаны различные виды радиоинтерфейсов для таких сотовых телефонных систем, включающие в себя, например, множественный доступ с частотным разделением каналов (FDMA), множественный доступ с временным разделением каналов (TDMA) и множественный доступ с кодовым разделением каналов (CDMA). В этой связи были установлены различные региональные и международные стандарты, включающие в себя, например, Улучшенную Службу Мобильной Телефонии (AMPS), Глобальную систему мобильной связи (GSM) и Промежуточный стандарт 95 (IS-95). IS-95 и его производные, IS-95A IS-95B, ANSI J-STD-008 (часто в настоящем описании обобщенно называемые IS-95) и предлагаемые системы с высокой скоростью передачи данных обнародованы Ассоциацией Телекоммуникационной Индустрии (TIA) и другими хорошо известными органами стандартизации.

[1003] Сотовые телефонные системы, выполненные согласно стандарту IS-95, используют CDMA способы обработки сигнала для обеспечения высокоэффективной и надежной телефонной службы. Иллюстративная сотовая телефонная система, выполненная по существу согласно стандарту IS-95, описана в патентах США №№5,103,459 и 4,901,307, права на которые принадлежат правообладателю настоящего изобретения и которые включены в настоящее описание во всей своей полноте в качестве ссылки. Иллюстративная система, использующая способы CDMA, представляет собой предварительный вариант способа радиопередачи (RTT) cdma2000 ITU-R (называемый в настоящем описании cdma2000), изданный TIA. Стандарт cdma2000 описан предварительной версией IS-2000 и был одобрен TIA. Другой CDMA стандарт представляет собой стандарт W-CDMA, описанный в документах группы 3rd Generation Partnership Project "3GPP", документы № 3G TS 25.211, 3G TS 25.212, 3G TS 25.213 и 3G TS 25.214.

[1004] Каждый стандарт определяет, как различные типы информации обрабатываются для передачи. В обычной коммуникационной системе кодер генерирует поток информационных битов, представляющих собой речевой трафик или трафик данных. Такой поток битов разделяется и группируется, последовательно соединяется с различными управляющими битами и пакетируется в подходящий формат для передачи. Речевой трафик или трафик данных может быть передан в различных форматах, таких как, кадры, пакеты и подпакеты, в соответствии с подходящим стандартом связи. Для простоты с целью иллюстрации термин "кадр" в настоящем описании будет применяться для описания формата передачи, в котором переносится трафик. Однако в настоящем описании термин "кадр" также будет применяться для описания выходного сигнала речевого кодера. Дефиниция слова будет зависеть от контекста, в котором используется слово.

[1005] Речевой кодер представляет собой устройство, которое извлекает параметры, относящиеся к модели генерации человеческой речи, и затем использует эти параметры для сжатия речи для передачи. Обычно речевой кодер содержит кодер и декодер. Речевой кодер делит входной речевой сигнал на блоки по времени и анализирует кадры. Кодер анализирует входной речевой кадр для извлечения некоторых релевантных параметров и затем квантует параметры в двоичное представление. Двоичное представление пакетируют в кадры передачи и передают по каналу связи в приемник с декодером. Декодер обрабатывает кадры передачи, выполняет их обратное квантование для получения параметров и повторно синтезирует речевые кадры, используя неквантованные параметры. Речевой кодер также называется как кодер речи или "вокодер", и данные термины в настоящем описании будут использоваться взаимозаменяемо.

[1006] Функцией речевого кодера является сжатие оцифрованного речевого сигнала в сигнал с низкой битовой скоростью путем удаления всех видов природной избыточности, присущих речи. Цифровое сжатие достигается путем представления входного речевого кадра при помощи набора параметров и выполнением квантования для представления параметров в виде набора битов. Если входной речевой кадр имеет количество битов Ni, и выходной кадр, созданный речевым кодером, имеет количество битов No, то фактор сжатия, достигаемый при помощи речевого кодера, составляет Cr=Ni/No. Проблема заключается в поддержке высокого качества декодированной речи при достижении целевого фактора сжатия. Производительность речевого кодера зависит от того, насколько хороша речевая модель, или комбинация процессов анализа и синтеза, описанных выше, типов исполнения, и насколько хорошо был выполнен процесс квантования параметров при целевой битовой скорости No битов на кадр. Таким образом, целью речевой модели является определение сути речевого сигнала, или целевого качества голоса, с небольшим набором параметров для каждого кадра.

[1007] В различных существующих системах беспроводной связи используются различные типы речевых кодеров, часто с использованием способов совершенно различных способов сжатия речи. Более того, форматы кадров передачи и обработка, которые определяются одним конкретным стандартом, скорее всего отличаются от форматов кадров передачи и обработки в других стандартах. Например, CDMA стандарты поддерживают использование кадров вокодера с переменной скоростью в среде расширенного спектра, в то время как GSM стандарты поддерживают использование кадров вокодера с фиксированной скоростью и кадров многоскоростного вокодера. Подобным образом, стандарты системы всеобщей мобильной связи (UMTS) также поддерживают вокодеры с фиксированной скоростью и многоскоростные вокодеры, но не вокодеры с переменной скоростью. Для совместимости и возможности взаимодействия между такими системами связи чрезвычайно желательным является поддержка кадров вокодера с переменной скоростью системами GSM и UMTS и поддержка кадров вокодера с неизменяемой скоростью системами CDMA. Поддержка кадров вокодера с переменной скоростью в CDMA стандартах рассматривается в совместно рассматриваемой заявке на патент США №09/755,843, озаглавленной "Method and Apparatus for Supporting Adaptive Multi-Rate (AMR) Data in a CDMA Communication System", права на которую принадлежат правообладателю настоящего изобретения и которая включена в настоящее описание во всей своей полноте в качестве ссылки. Однако все еще существует необходимость в поддержке передачи кадров вокодера с переменной скоростью в уже существующих несовместимых системах.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

[1008] В настоящем описании представлены способы и устройства, предоставляющие возможность взаимодействия между несовместимыми системами. В одном из аспектов представлено устройство для поддержки передачи кадров вокодера с переменной скоростью в несовместимой системе, устройство, содержащее инфраструктурный элемент, сконфигурированный для идентификации типа кадра принимаемого кадра вокодера с переменной скоростью, для переупорядочения битов принятого кадра вокодера с переменной скоростью в соответствии с типом кадра и для создания кадра многоскоростного вокодера с использованием переупорядоченных битов.

[1009] В другом аспекте представлено устройство для переформатирования кадров вокодера с переменной скоростью в виде кадров многоскоростного вокодера, причем устройство содержит идентификатор типа кадра для идентификации типа кадра вокодера с переменной скоростью; инфраструктурный элемент, сконфигурированный для переупорядочения битов кадра вокодера с переменной скоростью в соответствии с типом кадра и генератор кадра для создания кадра многоскоростного вокодера, причем нагрузка кадра многоскоростного вокодера содержит переупорядоченные биты кадра вокодера с переменной скоростью.

[1010] В другом аспекте представлено устройство для поддержки кадров вокодера с переменной скоростью в несовместимой системе, причем устройство содержит подсистему демодуляции для демодуляции принятого кадра вокодера с переменной скоростью; дискриминатор системы для определения, несет ли демодулированный кадр многоскоростного вокодера кадр вокодера с переменной скоростью в качестве нагрузки; устройство комбинирования для переупорядочивания нагрузки кадра многоскоростного вокодера в кадр вокодера с переменной скоростью и декодер, выполненный с возможностью декодирования кадра вокодера с переменной скоростью.

[1011] В другом аспекте представлен способ переформатирования кадров вокодера с переменной скоростью в виде кадров многоскоростного вокодера, причем способ содержит идентификацию типа кадра принятого кадра вокодера с переменной скоростью; переупорядочивание битов принятого кадра вокодера с переменной скоростью и создание кадра многоскоростного вокодера, причем переупорядоченные биты содержат нагрузку кадра многоскоростного вокодера.

[1012] В другом аспекте представлен способ поддержки кадров вокодера с переменной скоростью в несовместимых системах, причем способ содержит прием кадра многоскоростного вокодера; определение, несет ли кадр многоскоростного вокодера нагрузку кадра вокодера с переменной скоростью; и, если кадр многоскоростного вокодера несет нагрузку кадра вокодера с переменной скоростью, то идентификацию типа кадра нагрузки кадра вокодера с переменной скоростью; переупорядочивание нагрузки кадра вокодера с переменной скоростью в кадр вокодера с переменной скоростью и декодирование кадра вокодера с переменной скоростью.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[1013] Фиг.1 представляет собой блок-схему системы связи, которая поддерживает несколько пользователей.

[1014] Фиг.2 представляет собой блок-схему структуры AMR кадра.

[1015] Фиг.3А и 3В представляют собой блок-схемы структур кадра вокодера с переменной скоростью для набора 1 скоростей и набора 2 скоростей.

[1016] Фиг.4 представляет собой блок-схему обработки в AMR вокодере для UMTS системы.

[1017] Фиг.5 представляет собой функциональную блок-схему структуры обработки для канала трафика прямой линии в CDMA системе.

[1018] Фиг.6 представляет собой блок-схему устройства выполнения поиска скорости вслепую.

[1019] Фиг.7 представляет собой блок-схему устройства обработки нагрузки кадра с переменной скоростью в многоскоростном кадре.

[1020] Фиг.8А представляет собой блок-схему последовательности операций, описывающую переформатирование кадров вокодера с переменной скоростью в кадры многоскоростного вокодера.

[1021] Фиг.8В представляет собой блок-схему последовательности операций, описывающую извлечение кадров вокодера с переменной скоростью, которые были переданы в кадрах многоскоростного вокодера.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

[1022] Как показано на Фиг.1, сеть 10 беспроводной связи обычно включает в себя множество удаленных станций (также называемых абонентскими станциями или мобильными станциями, или оборудованием пользователя) 12a-12d, множество базовых станций (также называемых базовыми приемопередающими станциями (BTS) или Узлом В) 14a-14c, контроллер базовой станции (BSC) (также называемый контроллером радиосети или функцией 16 управления пакетами), центр коммутации подвижной связи (MSC) или коммутатор 18, узел обслуживания пакетных данных (PDSN) или функцию 20 межсетевого обмена (IWF), телефонную сеть общего пользования (PSTN) 22 (как правило, телефонную компанию) и сеть 24 Интернет протокола (IP), (как правило, Интернет). Для простоты показаны четыре удаленные станции 12a-12d, три базовые станции 14a-14c, один BSC 16, один MSC 18 и один PDSN 20. Специалисты в данной области техники признают, что может быть любое количество уделенных станций 12, базовых станций 14, BSC 16, MSC 18 и PDSN 20.

[1023] В одном из вариантов осуществления сеть 10 беспроводной связи представляет собой сеть обслуживания пакетных данных. Удаленные станции 12a-12d могут быть представлены в любом количестве различных типов устройств беспроводной связи, таких как переносной телефон, сотовый телефон, который связан с портативным компьютером, выполняющим приложения веб-браузера, основанного на IP, сотовый телефон, связанный с комплектами автомобильной гарнитуры громкой связи, персональный цифровой помощник (ПЦП), выполняющий приложения веб-браузера, основанного на IP, модуль беспроводной связи, встроенный в портативный компьютер или модуль связи с фиксированным положением, например в местной беспроводной линии связи или системе снятия результатов измерений. В наиболее общем варианте осуществления удаленные станции могут быть устройством связи любого типа.

[1024] Удаленные станции 12a-12d преимущественно могут быть реализованы с возможностью выполнения одного или нескольких протоколов беспроводных пакетных данных, таких как описано, например, в EIA/TIA/IS-707 стандарте. В конкретном варианте осуществления удаленные станции 12a-12d генерируют IP пакеты, предназначенные для IP сети 24, и инкапсулируют IP пакеты в кадры, используя протокол точка-точка (PPP).

[1025] В одном из вариантов осуществления IP сеть 24 связана с PDSN 20, PDSN 20 связан с MSC 18, MSC связан с BSC 16 и PSTN 22, и BSC 16 связан с базовыми станциями 14a-14c посредством кабельных линий, выполненных с возможностью передачи речевых пакетов и/или пакетов данных в соответствии с любым из некоторых известных протоколов, включающих в себя, например, E1, T1 асинхронный режим передачи (ATM), Интернет протокол (IP), протокол точка-точка (PPP), коммутацию пакетов, высокоскоростную цифровую абонентскую линию (HDSL), асимметричную цифровую абонентскую линию (ADSL), или другое оборудование для цифровых абонентских линий общего назначения (xDSL) и служб. В альтернативном варианте осуществления BSC 16 соединен непосредственно с PDSN 20, а MSC 18 не соединен с PDSN 20.

[1026] Во время обычной работы сети 10 беспроводной связи базовые станции 14a-14c принимают и демодулируют наборы сигналов обратной линии от разных удаленных станций 12a-12d, участвующих в телефонных вызовах, просмотре веб или других типах обмена данными. Как используется в настоящем описании, "обратная линия" включает в себя типы передачи от удаленной станции, направленные к базовой станции. Каждый сигнал обратной линии, принятый данной базовой станцией 14a-14c, обрабатывается такой базовой станцией 14a-14c. Каждая базовая станция 14a-14c может связываться с множеством удаленных станций 12a-12d путем модулирования и передачи набора сигналов прямой линии в удаленные станции 12a-12d. Как используется в настоящем описании, "прямая линия" включает в себя передачи от базовой станции, направленные к удаленной станции. Например, как показано на Фиг.1, базовая станция 14а связывается с первой и второй удаленными станциями 12a, 12b одновременно, а базовая станция 14c связывается с третьей и четвертой удаленными станциями 12c, 12d одновременно. Полученные в результате пакеты направляются в BSC 16, который обеспечивает выделение ресурса для вызовов и функции управления мобильностью, включающие в себя согласование управления мягким переключением обслуживания вызова для конкретной удаленной станции 12a-12d от одной базовой станции 14a-14c в другую базовую станцию 14a-14c. Например, удаленная станция 12c связывается с двумя базовыми станциями 14b, 14c одновременно. В результате, если удаленная станция 12c перемещается достаточно далеко от одной базовой станции 14c, управление вызовом будет передано другой базовой станции 14b.

[1027] Если передача представляет собой обычный телефонный вызов, BSC 16 направляет принятые данные в MSC 18, который обеспечивает дополнительные услуги маршрутизации для интерфейса с PSTN 22. Если передача представляет собой пакетную передачу, такую как вызов данных, предназначенный для IP сети 24, MSC 18 направляет пакеты данных в PDSN 20, который отсылает пакеты в IP сеть 24. В качестве альтернативы, BSC 16 направляет пакеты непосредственно в PDSN 20, который посылает пакеты в IP 24.

[1028] В системе W-CDMA, которую классифицируют как систему UMTS, терминология компонентов системы беспроводной связи отличается, но функционально является такой же. Например, базовая станция рассматривается, как контроллер радиосети (RNC), работающий в UMTS наземной сети радио доступа (U-TRAN). Прямая линия называется "нисходящая линия", и обратная линия называется "восходящая линия". Однако форматирование кадров передачи является очень похожим. В системе CDMA речь кодируется с использованием вокодера с переменной скоростью. В системе GSM или системе UMTS речь кодируется с использованием вокодера с фиксированной скоростью или многоскоростного вокодера. Например, вокодер с переменной скоростью представляет собой вокодер с возможностью выбора режима (SMV), который описан в IS-893, примером многоскоростного вокодера является адаптивный мультискоростной (AMR) вокодер, который описан в "ETSI EN 301 704 Digital Cellular Telecommunications System; Adaptive Multi-Rate (AMR) Speech Transcoding" (AMR стандарт), и примером вокодера с фиксированной скоростью является улучшенный полноскоростной вокодер, который описан в 3GPP TS 46.060: "Digital cellular telecommunications system (Phase 2+); Enhanced Full Rate (EFR) speech transcoding".

[1029] Несмотря на то, что типы вокодеров являются структурно и функционально различными, при описании этих двух типов используется общая терминология. Например, "режим" в AMR вокодере относится к фиксированной скорости данных. Однако "режим" в вокодере SMV относится к средней скорости данных, которая достигается путем смешивания различных типов кадров. (Более подробно этот предмет обсуждается ниже). Значение слова должно быть истолковано из контекста использования данного слова. Для того, чтобы минимизировать путаницу, которая может возникнуть от применения таких обычно совместно используемых терминов, в вариантах осуществления, которые будут описаны ниже, будут использованы конфигурации SMV вокодеров и терминология для представления вокодеров с переменной скоростью, и конфигурации AMR вокодеров и терминология для представления вокодеров с фиксированной скоростью и многоскоростных вокодеров. Однако необходимо отметить, что объем настоящих вариантов осуществления распространяется на другие кодеры с переменной скоростью, такие как улучшенный кодек с переменной скоростью (EVRC) и широкополосные SMV (WB-SMV) кодеры, и другие кодеры с фиксированной скоростью и многоскоростные кодеры, такие как улучшенный полноскоростной (EFR) вокодер и AMR-WB вокодеры.

[1030] Варианты осуществления, которые изложены в настоящем описании, предназначены для перепаковки содержимого кадров вокодера с переменной скоростью для передачи в несовместимой системе. Обратная проблема, заключающаяся в том, как поддержать передачу кадра многоскоростного вокодера в несовместимой системе, раскрыта в вышеупомянутой заявке на патент США №09/755,843.

[1031] AMR вокодер выдает как речевые кадры, так и кадры шума комфортности. Структура кадра AMR показана на Фиг.2. Часть заголовка AMR включает в себя поле Frame Type (тип кадра) и поле Frame Quality Indicator (индикатор качества кадра). Часть вспомогательной информации AMR включает в себя поле Mode Indication (режим индикации), поле Mode Request (режим запроса) и поле Codec CRC (кодек CRC). Часть основного кадра AMR несет биты речевых параметров или биты параметров шума комфортности. Биты речевых параметров подразделены на класс А, класс В и класс С.

[1032] Биты класса А содержат наиболее важные биты, биты класса В представляют собой следующие по важности биты, и биты класса С являются наименее важными битами. В силу заданного различия по важности биты для каждого класса передаются через различные "транспортные" каналы, способные обеспечить разную обработку (например, коррекцию ошибок и распознавание кодирования, подбор скорости и т.д.), которая может быть выбрана таким образом, чтобы быть сопоставимой с уровнем важности для данного класса. Например, для битов класса А могут быть использованы сверточное кодирование и циклический избыточный код (CRC), для битов класса В может быть использовано сверточное кодирование, но не использован CRC, и для битов класса С может не использоваться ни сверточное кодирование, ни CRC.

[1033] В Таблице 1 перечислены AMR режимы, определенные стандартом W-CDMA, и количество битов для классов А, В и С для каждого AMR режима. Подразделение битов на три класса, количество битов для каждого класса и/или общее количество битов для каждого блока данных могут отличаться от таковых, перечисленных в таблице 1.

[1034] Как показано в таблице 1, AMR режимы 0-7 назначены для восьми различных скоростей AMR речевых данных, находящихся в диапазоне от 4,75 Кбит/сек до 12,2 Кбит/сек. AMR режимы 8-11 используются для отправки различных типов информации о дескрипторах информации о паузе (SID), которая используется для создания кадров шума комфортности. AMR режимы 12-14 зарезервированы для будущего использования, и AMR режим 15 не используется для передачи данных.

Таблица 1Режимы AMR
Индекс режима AMR Описание режима Всего битов классов А, В и С Биты класса А Биты класса В Биты класса С
0 (AMR4,75) скорость 4,75 Кбит/сек 95 42 53 0
1 (AMR5,15) скорость 5,15 Кбит/сек 103 49 54 0
2 (AMR5,90) скорость 5,90 Кбит/сек 118 55 63 0
3 (AMR6,70) скорость 6,70 Кбит/сек 134 58 76 0
4 (AMR7,40) скорость 7,40 Кбит/сек 148 61 87 0
5 (AMR7,95) скорость 7,95 Кбит/сек 159 75 84 0
6 (AMR10,2) скорость 10,2 Кбит/сек 204 65 99 40
7 (AMR12,2) скорость 12,2 Кбит/сек 244 81 103 60
8 GSM-AMR SID 39 39 0 0
9 GSM-EFR SID 42 42 0 0
10 IS-641 SID 38 38 0 0
11 PDC-EFR SID 37 37 0 0
12-14 для будущего использования TBD TBD TBD TBD
15 передачи нет 0 0 0 0

[1035] В отличие от 15 различных режимов, каждый из которых представляет данные с фиксированной скоростью, вокодер с переменной скоростью выдает кадры с полной скоростью, половинной скоростью, со скоростью одна четвертая и со скоростью одна восьмая. Структура каждого типа кадра показана на Фиг.3А и Фиг.3В. Фиг.3А представляет собой структуру кадра, когда вокодер с переменной скоростью работает согласно набору 1 скоростей, и Фиг.3В представляет собой структуру кадра, когда вокодер с переменной скоростью работает согласно набору 2 скоростей. Каждый кадр несет бит стирания, множество информационных битов, биты CRC (кроме кадров со скоростью одна четвертая и со скоростью одна восьмая в наборе 1 скоростей) и концевые биты. В общем случае кадры с полной скоростью используются для переноса динамической (или вокализированной) речи, кадры с половинной скоростью используются для переноса вокализированной (или динамической) речи, кадры со скоростью одна четвертая используются для переноса невокализированной речи, и кадры со скоростью одна восьмая используются для переноса фоновых шумов. Необходимо отметить, что фоновые шумы относятся к фоновым звукам окружения говорящего, которые могут включать в себя паузы говорящего и фоновые паузы.

[1036] Следовательно, вокодер с переменной скоростью разделяет типы звуковой активности, происходящие в каждый период анализа, выбирает режим кодирования для извлечения параметров сигнала и выбирает тип кадра, соответственно. Как используется в контексте вокодера с переменной скоростью, "режим кодирования" используется для обозначения параметров в схеме кодирования, таких как код, возбуждаемый линейным прогнозированием (CELP), который используется для извлечения речевых параметров. Как используется в контексте вокодера с фиксированной скоростью, "режим" относится к скорости данных, а не к схеме кодирования. Один из способов использования классификации речи, чтобы выбрать тип кадра вокодера с переменной скоростью для перенесения параметров кадра анализа, представлен в совместно рассматриваемой заявке на патент США №09/733,740, озаглавленной "Method and Apparatus for Robust Speech Classification", которая включена в настоящее описание во всей своей полноте в качестве ссылки и права на которую принадлежат правообладателю настоящего изобретения. В указанной совместно рассматриваемой заявке детектор активности голоса, LPC анализатор и оценщик тона с разомкнутым контуром выполнены с возможностью выдачи информации, которая используется классификатором речи для определения различий прошлых, настоящих и будущих энергетических речевых параметров кадров. Такие энергетические речевых параметры кадров затем используются для более точной и грубой классификации звуковых сигналов в речевых или неречевых кадрах.

[1037] В контексте SMV вокодера термин "режим" также используется для обозначения средней скорости данных, причем различные средние скорости данных достигаются при помощи изменения параметров пороговой энергии уровней речевой активности, которая изменяет тип кадра, который выбирают для переноса речи. Например, SMV вокодер работает в "режиме 0", тогда уровни речевой активности могут быть установлены таким образом, что сегменты более вокализированной речи будут переноситься кадрами с полной скоростью, а не кадрами с половинной скоростью. Следовательно, более 60% выходных кадров являются кадрами с полной скоростью, и приблизительно 5% выходных кадров являются кадрами с половинной скоростью в режиме 0. Если затем SMV вокодер устанавливают для работы в "режиме 2", то энергетические параметры уровней речевой активности могут быть переустановлены таким образом, что меньше динамических речевых сегментов будут переноситься кадрами с полной скоростью. Следовательно, приблизительно 11% выходных кадров являются кадрами с полной скоростью, и приблизительно 47% выходных кадров являются кадрами с половинной скоростью в режиме 2. Режим SMV вокодера может быть установлен при помощи сети, но действующие кадры, используемые для переноса речевой информации, все еще будут определяться уровнями речевой активности, т.е. SMV вокодер и другие вокодеры с переменной скоростью являются "управляемыми источниками".

[1038] Напротив, AMR вокодер использует информацию, относящуюся к качеству физического канала для выбора режима, т.е. скорости, с которой посылается речевой сигнал. Следовательно, скорость устанавливается только сетью, а не уровнями речевой активности. Фиг.4 представляет собой блок-схему обработки, которой подвергается каждый класс в AMR вокодере, работающем в среде W-CDMA. Для битов класса А выполняют CRC кодирование (блок 422а), сверточное кодирование (блок 424а), выбирают скорость (блок 426а) и подвергают перемежению (блок 428а) в процессоре транспортного канала 420а. Для битов класса В выполняют сверточное кодирование (блок 424b), подбирают скорость (блок 426b) и перемежение (блок 428b) в процессоре 420b транспортного канала. И для битов класса С подбирают скорость (блок 426c) и выполняют перемежение (блок 428c) в процессоре 420c транспортного канала. Обработанные биты из процессоров 420a-420c транспортного канала затем мультиплексируют в кодированном составном транспортном канале (CCTrCH) при помощи мультиплексора 430 транспортного канала, и CCTrCH далее мультиплексируют в один или несколько потоков физического канала демультиплексором 432 транспортного канала. Каждый (20 мсек) кадр в каждом потоке физического канала далее подвергают перемежению (блок 434), и полученный в результате поток данных содержит данные для физического канала.

[1039] Как описано выше, выходные кадры AMR вокодера имеют общую структуру, содержащую заголовок AMR, вспомогательную информацию AMR и основной кадр AMR. В основном кадре AMR биты, созданные речевым кодером, переупорядочивают с целью защиты от ошибок. Речевые биты переупорядочивают в соответствии с таблицами, описанными в 3G TS 26.090, озаглавленном "AMR Speech Codec; Speech Transcoding Function". Выходные кодированные речевые биты, которые обозначены, как {s(1), s(2), s(3), …, s(K)}, где К представляет собой количество битов, созданных кодером. Затем выполняют перестановку каждого выходного бита в основном кадре согласно соответствующей таблице. Переупорядоченные биты обозначены как {d(0), d(1), d(2), …, d(K-1)} в порядке уменьшения важности. Следовательно, значение d(i) обозначает позицию i-го бита в основном кадре AMR.

[1040] Например, упорядочивание битов речевого кодера для режима 4,75 Кбит/сек представлено в таблице 2. Верхний левый угол таблицы имеет индекс 0, и таблицу читают слева направо таким образом, чтобы самый правый элемент последнего ряда имел индекс K-1, где K представляет собой общее количество речевых битов в специальном режиме.

Таблица 2Упорядочивание битов речевого кодера для режима 4,75 Кбит/сек: таблица0(j)
0 1 2 3 4 5 6 7 8 9
10 11 12 13 14 15 23 24 25 26
27 28 48 49 61 62 82 83 47 46
45 44 81 80 79 78 17 18 20 22
77 76 75 74 29 30 43 42 41 40
38 39 16 19 21 50 51 59 60 63
64 72 73 84 85 93 94 32 33 35
36 53 54 56 57 66 67 69 70 87
88 90 91 34 55 68 67 69 70 87
92 31 52 65 86

[1041] В данной конкретной таблице 20-й выходной бит, созданный речевым кодером, будет связан со значением позиции 27, т.е. 20-я позиция в таблице, таблице0(20), представляет собой 27.

[1042] В системе CDMA трафик речи и данных может передаваться по одному или нескольким каналам по прямой или обратной линиям. (Канал трафика соответствует физическому каналу в системе W-CDMA). Каждый канал переносит различные типы информации в точку назначения. Обычно, трафик речи переносится по основным каналам, и трафик данных переносится по дополнительным каналам или каналам пакетных данных. Дополнительные каналы обычно имеют длительности порядка секунд, и редко изменяют форматы модуляции и кодирования, тогда как каналы пакетных данных динамически изменяются от одного 20 мсек интервала до другого 20 мсек интервала. Для целей изложения вариантов осуществления настоящего описания дополнительные каналы и каналы пакетных данных в общем случае обозначаются как каналы данных трафика.

[1043] Речевой трафик и трафик данных обычно кодируют, модулируют и выполняют расширение спектра до передачи либо по прямой, либо по обратной линии. Кодирование, модуляция и развертка могут быть реализованы в различных форматах. Заданные форматы передачи, которые соответствуют объединению различных параметров передачи, могут быть использованы для облегчения выбора формата передачи. Формат передачи соответствует объединению любого или всех следующих форматов передачи: схемы модуляции, используемой системой, количества ортогональных или квази-ортогональных кодов, размера полезной информации данных в битах, длительности кадра сообщения и/или деталей, относящихся к схеме кодирования. Некоторыми примерами схем модуляции, используемыми в системах связи, являются многопозиционная фазоразностная модуляция (QPSK), фазовая 8-позиционная модуляция (8-PSK), 16-позиционная квадратурная амплитудная модуляция (16-QAM). Некоторые из различных схем кодирования, которые могут быть избирательно реализованы, являются обычными схемами кодирования, которые реализуются при разных скоростях, или турбокодирования, которая содержит множество этапов кодирования, разделенных этапами перемежения. Для канализации отправки информации в каждую удаленную станцию по прямой линии используют ортогональные или квази-ортогональные коды, такие как последовательности кода Уолша. Другими словами, последовательности кода Уолша используют на прямой линии, чтобы на одной и той же частоте в течение одной и той же длительности предоставлять возможность системе покрывать множество пользователей, каждому из которых назначен отдельный ортогональный или квази-ортогональный код.

[1044] Формат и мощность передачи на прямом канале трафика данных обычно согласуют с элементами сети таким образом, чтобы гарантировать высокую вероятность успешного приема. Успешное декодирование может быть верифицировано объединением одного или нескольких способов, хорошо известных в данной области техники, таких как определение, прошла или нет проверка битов циклического избыточного кода (CRC) пакета данных, вычисление перекодированной скорости ошибок или вычисление метрик Ямамото для декодеров Витерби. Следует отметить, что формат передачи кадра по каналу трафика данных отличается от формата выходных битов вокодера. На Фиг.5 дается объяснение такого различия более подробно.

[1045] Фиг.5 представляет собой блок-схему структуры канала для канала трафика прямой линии. Вокодер с переменной скоростью генерирует биты, которые генерируются в соответствии с выбранным форматом кадра. Биты вокодера кодируют в блок 500 для передачи по каналу. Кодирование может включать в себя сверточное или турбокодирование. Элемент повторения представлен в блоке 510, где кодированные биты повторяются при заданной скорости повторения. Затем в блоке 520 кодированные и повторенные символы выкалывают. Скорости, при которых происходит кодирование, повторение и выкалывание, представляют собой параметры, определяемые системой, которые зависят от требований к скорости передачи (т.е. являются ли выходные биты частью кадра вокодера с полной скоростью, половинной скоростью, со скоростью одна четвертая или со скоростью одна восьмая). Блок 530 представляет собой процесс перемежения. Выходные данные перемежителя в настоящем описании называются символами модуляции.

[1046] Символы модуляции, которые представляют собой выходные данные перемежителя блока 530, подвергают ортогональному расширению при помощи элемента 540а покрытия Уолша. Дополнительно, одновременно выполняют расширение последовательности пилот-сигнала при помощи элемента 540b покрытия Уолша. Затем выходные данные из блоков 540а и 540b объединяют в блоке 550 сумматора и затем выполняют сдвиг на 90° в блоке 560. В блоке 570 полученный в результате поток подвергают расширению с псевдошумовой последовательностью. В блоке 580 полученный в результате поток фильтруют по основной полосе и модулируют в сигнал передачи несущей.

[1047] Варианты осуществления, которые изложены в настоящем описании, предназначены для поддержки переноса содержимого кадров вокодера с переменной скоростью в несовместимые системы связи. Как используется в настоящем описании, несовместимая система является системой, которая сконфигурирована для переноса кадров вокодера с фиксированной скоростью или кадров многоскоростного вокодера. Несовместимая система также может рассматриваться как система, которая использует отличный от CDMA способ доступа, например TDMA или GSM, причем обработка и форматирование кадров вокодера в кадры передачи по каналу отличается от обработки и форматирования по Фиг.5.

[1048] Использование вариантов осуществления, изложенных в настоящем описании, предоставляет возможность несовместимым системам пропускать кадры вокодера с переменной скоростью без выполнения переноса их в форматы кадров вокодера с фиксированной скоростью или многоскоростного вокодера. Перенос может повлечь за собой декодирование кадра вокодера с переменной скоростью для синтеза звуковой речи и кодирование звуковой речи, используя способы для вокодера с фиксированной скоростью или многоскоростного вокодера. Следовательно, процесс переноса может привести к деградации качества звукового сигнала. Вместо этого, кадры вокодера с переменной скоростью переформатируют/перепаковывают в кадр с фиксированной скоростью или кадр многоскоростного вокодера.

[1049] Для переформатирования кадров вокодера с переменной скоростью для передач по несовместимой системе кадры вокодера должны быть извлечены из кадров передачи по каналу. Процедур