Системы и способы для включения идентификатора в пакет, ассоциативно связанный с речевым сигналом
Иллюстрации
Показать всеИзобретение относится к технологии обработки речи. Описан способ для включения идентификатора в пакет, ассоциативно связанный с речевым сигналом. Сигнал принимают, и секционируют на множество кадров. Кадр сигнала кодируют в пакет и определяют, кодирован ли пакет как широкополосный пакет или как узкополосный пакет. Затем пакетируют недопустимое значение N-битового параметра на основе определения, причем недопустимое значение идентифицирует одну схему кодирования. Пакет передают. По меньшей мере, два недопустимых значения предоставляются из N-битового параметра, при этом, по меньшей мере, один бит N-битового параметра используется для того, чтобы переносить информацию. Число битов из N-битового параметра, которые используются для того, чтобы переносить информацию, равно log2(X), при этом Х является числом недопустимых значений, предоставленных из N-битового параметра. Технический результат - обеспечение повышения эффективности кодирования и/или качества речи. 8 н.п. и 18 з.п ф-лы, 54 ил.
Реферат
Заявление о преимуществе 35 U.S.C. §119
Настоящая заявка на патент заявляет преимущество Предварительной заявки №60/834 617, озаглавленной "SPECIAL HALF-RATE IDENTIFIER PACKET GENERATION AND DECODING", зарегистрированной 31 июля 2006 года и назначенной правопреемнику этой заявки, и таким образом явно содержится в данном документе по обращению.
Область техники
Настоящие системы и способы, в общем, относятся к технологии обработки речи. Более конкретно, настоящие системы и способы относятся к включению идентификатора в пакет, ассоциативно связанный с речевым сигналом.
Уровень техники
Передача речи посредством цифровых методик стала повсеместной, в частности, в междугородной и международной телефонной связи, а также в цифровой радиотелефонной связи. Это, в свою очередь, вызвало интерес к определению наименьшего количества объема информации, который можно отправить по каналу при сохранении воспринимаемого восстановленной речи. Устройства для сжатия речи находят применение во многих областях техники передачи данных. Примером передачи данных является беспроводная связь. Область техники беспроводной связи имеет множество вариантов применения, включая, к примеру, беспроводные телефоны, пейджеры, беспроводный абонентский доступ, беспроводную телефонную связь, например, телефонные системы на базе сотовой и подвижной системы связи (PCS), системы телефонной связи по протоколу маршрутизации в среде Интернет (IP) и системы спутниковой связи. Особенно важным вариантом применения является беспроводная телефонная связь для мобильных абонентов.
Краткое описание чертежей
Фиг.1a иллюстрирует блок-схему широкополосного речевого кодера A100 согласно конфигурации.
Фиг.1b иллюстрирует блок-схему реализации A102 широкополосного речевого кодера A100.
Фиг.2a иллюстрирует блок-схему широкополосного речевого декодера B100 согласно конфигурации.
Фиг.2b иллюстрирует блок-схему реализации B102 широкополосного речевого кодера B100.
Фиг.3a иллюстрирует блок-схему реализации A112 гребенки A110 фильтров.
Фиг.3b иллюстрирует блок-схему реализации B122 гребенки B120 фильтров.
Фиг.4a иллюстрирует охват полосы пропускания по полосам низких и высоких частот для одного примера гребенки A110 фильтров.
Фиг.4b иллюстрирует охват полосы частот по полосам низких и высоких частот для другого примера гребенки A110 фильтров.
Фиг.4c иллюстрирует блок-схему реализации A114 гребенки A112 фильтров.
Фиг.4d иллюстрирует блок-схему реализации R124 гребенки B122 фильтров.
Фиг.5a иллюстрирует пример графика частоты и логарифмической амплитуды для речевого сигнала.
Фиг.5b иллюстрирует блок-схему базовой системы кодирования с линейным предсказанием.
Фиг.6 иллюстрирует блок-схему реализации A122 узкополосного кодера A120.
Фиг.7 иллюстрирует блок-схему реализации B112 узкополосного декодера B110.
Фиг.8a иллюстрирует пример графика частоты и логарифмической амплитуды для остаточного сигнала вокализованной речи.
Фиг.8b иллюстрирует пример графика времени и логарифмической амплитуды для остаточного сигнала вокализованной речи.
Фиг.9 иллюстрирует блок-схему базовой системы кодирования с линейным предсказанием, которая также выполняет долгосрочное предсказание.
Фиг.10 иллюстрирует блок-схему реализации A202 высокополосного кодера A200.
Фиг.11 иллюстрирует блок-схему реализации A302 высокополосного генератора A300 возбуждения.
Фиг.12 иллюстрирует блок-схему реализации A402 расширителя A400 спектра.
Фиг.12a иллюстрирует графики спектра сигнала в различных точках в одном примере операции расширения спектра.
Фиг.12b иллюстрирует графики спектра сигнала в различных точках в другом примере операции расширения спектра.
Фиг.13 иллюстрирует блок-схему реализации A304 высокополосного генератора A302 возбуждения.
Фиг.14 иллюстрирует блок-схему реализации A306 высокополосного генератора A302 возбуждения.
Фиг.15 иллюстрирует блок-схему последовательности операций задачи T100 вычисления огибающей.
Фиг.16 иллюстрирует блок-схему реализации 492 объединителя 490.
Фиг.17 иллюстрирует подход к вычислению показателя периодичности высокополосного сигнала S30.
Фиг.18 иллюстрирует блок-схему реализации A312 высокополосного генератора A302 возбуждения.
Фиг.19 иллюстрирует блок-схему реализации A314 высокополосного генератора A302 возбуждения.
Фиг.20 иллюстрирует блок-схему реализации A316 высокополосного генератора A302 возбуждения.
Фиг.21 иллюстрирует блок-схему последовательности операций задачи T200 вычисления усиления.
Фиг.22 иллюстрирует блок-схему последовательности операций для реализации T210 задачи T200 вычисления усиления.
Фиг.23a иллюстрирует схему функции кадрирования.
Фиг.23b иллюстрирует применение функции кадрирования, показанной на фиг.23a, к субкадрам речевого сигнала.
Фиг.24 иллюстрирует блок-схему реализации B202 высокополосного декодера B200.
Фиг.25 иллюстрирует блок-схему реализации AD10 широкополосного речевого кодера A100.
Фиг.26a иллюстрирует схематичное представление реализации D122 линии D120 задержки.
Фиг.26b иллюстрирует схематичное представление реализации D124 линии D120 задержки.
Фиг.27 иллюстрирует схематичное представление реализации D130 линии D120 задержки.
Фиг.28 иллюстрирует блок-схему реализации AD12 широкополосного речевого кодера AD10.
Фиг.29 иллюстрирует схему последовательности операций способа обработки MD100 сигналов согласно конфигурации.
Фиг.30 иллюстрирует схему последовательности операций для способа M100 согласно конфигурации.
Фиг.31 иллюстрирует схему последовательности операций для способа M200 согласно конфигурации.
Фиг.31b иллюстрирует схему последовательности операций для реализации M210 способа M200.
Фиг.32 иллюстрирует схему последовательности операций для способа M300 согласно конфигурации.
Фиг.33 иллюстрирует одну конфигурацию системы беспроводной связи;
Фиг.34 - это блок-схема, иллюстрирующая одну конфигурацию окружения передачи сигналов.
Фиг.35 - это блок-схема последовательности операций, иллюстрирующая одну конфигурацию способа для включения идентификатора в пакет, ассоциативно связанный с речевым сигналом.
Фиг.36 - это блок-схема последовательности операций, иллюстрирующая одну конфигурацию способа декодирования пакета.
Фиг.37 - это блок-схема, иллюстрирующая одну конфигурацию многомодового кодера, поддерживающего связь с многомодовым декодером.
Фиг.38 - это блок-схема последовательности операций, иллюстрирующая одну конфигурацию способа кодирования речи с переменной скоростью.
Фиг.39 - это блок-схема, иллюстрирующая одну конфигурацию обычного узкополосного пакета с половинной скоростью и широкополосного пакета с половинной скоростью.
Фиг.40 - это схема, иллюстрирующая число битов, выделенных различным типам пакетов.
Фиг.41 - это блок-схема определенных компонентов в одной конфигурации устройства связи.
Подробное описание
Описан способ для включения идентификатора в пакет, ассоциативно связанный с речевым сигналом. Сигнал принимается. Сигнал секционируется на множество кадров. Кадр сигнала кодируется в пакет. Выполняется определение в отношении того, закодирован пакет как широкополосный пакет или как узкополосный пакет. Идентификатор пакетируется в пакет на основе определения. Пакет передается. По меньшей мере, предоставляются два недопустимых значения из N-битового параметра, при этом, по меньшей мере, один бит N-битового параметра используется для того, чтобы переносить информацию. Число битов из N-битового параметра, используемых для того, чтобы переносить информацию, равно log2(X), при этом X является числом недопустимых значений, предоставленных из N-битового параметра.
Также описано устройство для включения идентификатора в пакет, ассоциативно связанный с речевым сигналом. Устройство включает в себя процессор и память в электронном соединении с процессором. Инструкции сохраняются в памяти. Инструкции приводятся в исполнение для того, чтобы: принимать сигнал; секционировать сигнал на множество кадров; кодировать кадр сигнала в пакет; определять то, закодирован пакет как широкополосный пакет или как узкополосный пакет; пакетировать идентификатор в пакет на основе определения; и передавать пакет.
Также описана система, которая выполнена с возможностью включать идентификатор в пакет, ассоциативно связанный с речевым сигналом. Система включает в себя средство обработки и средство приема сигнала. Описаны средство секционирования сигнала на множество кадров и средство кодирования кадра сигнала в пакет. Описано средство определения того, закодирован пакет как широкополосный пакет или как узкополосный пакет. Описано средство пакетирования идентификатора в пакет на основе определения и средство передачи пакета.
Также описан машиночитаемый носитель. Носитель выполнен с возможностью хранить набор инструкций, приводимых в исполнение для того, чтобы: принимать сигнал; секционировать сигнал на множество кадров; кодировать кадр сигнала в пакет; определять то, закодирован пакет как широкополосный пакет или как узкополосный пакет; пакетировать идентификатор в пакет на основе определения; и передавать пакет.
Также описан способ для декодирования пакета. Пакет принимается. Анализируется идентификатор, включенный в пакет. Выполняется определение в отношении того, закодирован пакет широкополосным кодером или узкополосным кодером. На основе определения выбирается режим декодирования для пакета.
Также описано устройство для декодирования пакета. Устройство включает в себя процессор и память в электронной связи с процессором. Инструкции сохраняются в памяти. Инструкции приводятся в исполнение для того, чтобы: принимать пакет; анализировать идентификатор, включенный в пакет; определять то, закодирован пакет как широкополосный пакет или как узкополосный пакет; и выбирать режим декодирования для пакета на основе определения.
Также описана система, которая выполнена с возможностью декодировать пакет. Система включает в себя средство обработки и средство приема пакета. Описано средство анализа идентификатора, включенного в пакет, и средство определения того, закодирован пакет широкополосным кодером или узкополосным кодером. Описано средство выбора режима декодирования для пакета на основе определения.
Также описан машиночитаемый носитель. Носитель выполнен с возможностью хранить набор инструкций, приводимых в исполнение для того, чтобы: принимать пакет; анализировать идентификатор, включенный в пакет; определять то, закодирован пакет как широкополосный пакет или как узкополосный пакет; и выбирать режим декодирования для пакета на основе определения.
Различные конфигурации систем и способов раскрыты со ссылками на чертежи, на которых аналогичные номера ссылок указывают идентичные или функционально аналогичные элементы. Признаки настоящих систем и способов, в общем, раскрытые и проиллюстрированные на чертежах в данном документе, могут быть скомпонованы и разработаны во множестве различных конфигураций. Таким образом, подробное описание ниже не предназначено для того, чтобы ограничивать область применения систем и способов, заявленную в формуле изобретения, а является просто примером конфигураций систем и способов.
Многие признаки конфигураций, раскрытых в данном документе, могут быть реализованы как вычислительное программное обеспечение, электронные аппаратные средства или комбинация вышеозначенного. Чтобы четко проиллюстрировать взаимозаменяемость аппаратных средств и программного обеспечения, различные компоненты, в общем, описываются относительно их функциональности. Реализована эта функциональность в качестве аппаратных средств или программного обеспечения, зависит от конкретного варианта применения и структурных ограничений, накладываемых на систему в целом. Высококвалифицированные специалисты могут реализовать описанную функциональность различными способами для каждого конкретного варианта применения, но такие решения по реализации не должны быть интерпретированы как являющиеся отступлением от области применения настоящих систем и способов.
Если описанная функциональность реализована как вычислительное программное обеспечение, это программное обеспечение может включать в себя любой тип вычислительной инструкции или машиноисполняемого кода, размещенного в памяти и/или передаваемого как электронные сигналы по системной шине либо сети. Программное обеспечение, которое реализует функциональность, ассоциативно связанную с компонентами, описанными в данном документе, может содержать одну инструкцию или множество инструкций и может быть распределено по нескольким различным сегментам кода, по различным программам и по различной памяти.
При использовании в данном документе термины "конфигурация", "конфигурация", "конфигурации", "конфигурация", "конфигурации", "одна или более конфигураций", "несколько конфигураций", "определенные конфигурации", "одна конфигурация", "другая конфигурация" и т.п. означают "одну или более (но не обязательно все) конфигурации раскрытых систем и способов", если иное не указано явно.
Термин "определение" (и его грамматические варианты) используются в самом широком смысле. Термин "определение" заключает в себе множество действий, и, следовательно, "определение" может включать в себя расчет, вычисление, обработку, извлечение, исследование, поиск (к примеру, поиск в таблице, базе данных или другой структуре данных), обнаружение и т.п. Также "определение" может включать в себя прием (к примеру, прием информации), осуществление доступа (к примеру, осуществление доступа к данным в памяти) и т.п. Также "определение" может включать в себя разрешение, отбор, выбор, установление и т.п.
Фраза "основан на" не означает "основан только на", если иное не указано явно. Иными словами, фраза "основан на" описывает как "основан только на", так и "основан, по меньшей мере, на".
Сотовая сеть может включать в себя радиосеть, составленную из ряда сот, каждая из которых обслуживается посредством стационарного передающего устройства. Эти несколько передающих устройств могут упоминаться как узлы сотовой связи или базовые станции. Сота может поддерживать связь с другими сотами в сети посредством передачи речевого сигнала в базовую станцию по каналу связи. Сота может разделять речевой сигнал на множество кадров (к примеру, 20 миллисекунд (мс) речевого сигнала). Каждый кадр может быть закодирован в пакет. Пакет может включать в себя определенное количество битов, которые далее передаются через канал связи в принимающую базовую станцию или принимающую соту. Принимающая базовая станция получения или принимающая сота могут распаковать пакет и декодировать различные кадры, чтобы восстановить сигнал.
Пакеты могут быть закодированы как полноскоростной пакет (171 бит), пакет с половинной скоростью (80 битов), пакет с четвертью скорости (40 битов) или пакет с одной восьмой скорости (16 битов). Кроме того, пакеты могут быть закодированы с помощью узкополосного кодера или широкополосного кодера. Пакеты, закодированные широкополосным кодером, могут быть закодированы как полноскоростной пакет, пакет с половинной скоростью или пакет с одной восьмой скорости. Пакеты, закодированные узкополосным кодером, могут быть закодированы как полноскоростной пакет, пакет с половинной скоростью, пакет с четвертью скорости или пакет с одной восьмой скорости. Широкополосные кодеры могут быть реализованы для различных типов пакетов, включая пакеты с линейным прогнозированием с возбуждением по коду (CELP) и пакеты с линейным прогнозированием с возбуждением по шуму (NELP). Узкополосные кодеры могут быть реализованы для пакетов CELP, пакетов периода основного тона прототипа (PPP) и пакетов NELP.
После кодирования пакета идентификатор может быть включен в пакет, чтобы указать декодеру то, закодирован пакет широкополосным кодером или узкополосным кодером. Информация, включенная в идентификатор, может указать декодеру то, должен ли пакет быть декодирован с помощью широкополосного декодера или узкополосного декодера. Например, широкополосный (WB) кодер с вокодером четвертого поколения (4GV) может закодировать пакет с половинной скоростью (на 80 битов). Пакет может не иметь никаких явных битов, чтобы идентифицировать дополнительные типы пакетов. По сути, недопустимая битовая комбинация, включающая в себя 7-битовое запаздывание основного тона, может использоваться для того, чтобы идентифицировать один или более пакетов, которые включают в себя 73 бита (или меньше). Тем не менее, пакету 4GV-WB с половинной скоростью, возможно, требуется 74 бита, и, по сути, использование 7-битового идентификатора запаздывания основного тона для пакета 4GV-WB с половинной скоростью может быть невозможно (так как общее количество битов, доступных для половинной скорости в этом примере, составляет 80). В одном аспекте две недействительных комбинации 7-битового идентификатора запаздывания основного тона, которые отличаются друг от друга на один бит, могут использоваться для того, чтобы идентифицировать пакет 4GV-WB с половинной скоростью. Шесть (из семи) битов могут использоваться в качестве идентификатора, тем самым освобождая один отличающийся бит, который должен быть использован посредством пакета 4GV-WB с половинной скоростью в дополнение к 73 битам, что дает в результате 74 бита для пакета 4GV-WB с половинной скоростью.
Описанные в данном документе конфигурации включают в себя системы, способы и устройства, которые могут быть сконфигурированы так, чтобы предоставлять расширение для узкополосного речевого сигнала, чтобы поддерживать передачу и/или хранения широкополосных речевых сигналов при увеличении пропускной способности до 800-1000 бит/с (битов в секунду). Потенциальные преимущества этих реализаций включают в себя встроенное кодирование, чтобы поддерживать совместимость с узкополосными системами, относительно простое распределение и перераспределение битов между каналами узкополосного и высокополосного кодирования, исключение вычислительно-емкой операции широкополосного синтеза и поддержание низкой частоты дискретизации для сигналов, которые должны обрабатываться посредством вычислительно-емких процедур кодирования формы сигналов.
Если не ограничен в явной форме контекстом, термин "вычисление" используется в данном документе, чтобы обозначать любое из своих обычных значений, например, расчет, формирование и выбор из списка значений. Если термин "содержащий" используется в настоящем описании и формуле изобретения, он не исключает других элементов или операций. Термин "A основан на B" используется для того, чтобы обозначать любое из своих обычных значений, в том числе случаи (i) "A равен B" и (ii) "A основан, по меньшей мере, на B". Термин "Интернет-протокол" включает в себя версию 4, как описано в IETF (Инженерная группа по развитию Интернета) RFC (Рабочие предложения) 791, и последующие версии, такие как версия 6.
Фиг.1a иллюстрирует блок-схему широкополосного речевого кодера A100 согласно конфигурации. Гребенка A110 фильтров сконфигурирована таким образом, чтобы фильтровать широкополосный речевой сигнал S10, чтобы формировать узкополосный сигнал S20 и высокополосный сигнал S30. Узкополосный кодер A120 выполнен с возможностью кодировать узкополосный сигнал S20, чтобы формировать параметры S40 узкополосной (NB) фильтрации и узкополосный остаточный сигнал S50. Как подробнее описано в данном документе, узкополосный кодер A120 в типичном варианте выполнен с возможностью формировать параметры S40 узкополосной фильтрации и кодированный узкополосный сигнал S50 возбуждения в качестве индексов таблицы кодирования или в другой квантованной форме. Высокополосный кодер A200 выполнен с возможностью кодировать высокополосный сигнал S30 согласно информации в кодированном узкополосном сигнале S50 возбуждения, чтобы сформировать параметры S60 высокополосного кодирования. Как подробнее описывается в данном документе, высокополосный кодер A200 в типичном варианте выполнен с возможностью формировать параметры S60 высокополосного кодирования в качестве индексов таблицы кодирования или в другой квантованной форме. Один конкретный пример широкополосного речевого кодера A100 выполнен с возможностью кодировать широкополосный речевой сигнал S10 на скорости примерно 8,55 кбит/с (килобит в секунду), при этом примерно 7,55 кбит/с используются для параметров S40 узкополосной фильтрации и кодированного узкополосного сигнала возбуждения S50, а примерно 1 кбит/с используется для параметров S60 высокополосного кодирования.
Может быть желательным комбинировать кодированные узкополосные и высокополосные сигналы в один поток битов. Например, может быть желательным мультиплексировать кодированные сигналы вместе для передачи (к примеру, по проводному, оптическому или беспроводному каналу передачи) либо для хранения в качестве кодированного широкополосного речевого сигнала. Фиг.1b иллюстрирует блок-схему реализации A102 широкополосного речевого кодера A100, который включает в себя мультиплексор A130, выполненный с возможностью комбинировать параметры S40 узкополосной фильтрации, кодированный узкополосный сигнал S50 возбуждения и параметры S60 высокополосной фильтрации в мультиплексированный сигнал S70.
Устройство, включающее в себя кодер A102, также может включать в себя схему, сконфигурированную так, чтобы передавать мультиплексированный сигнал S70 в канал передачи, такой как проводной, оптический или беспроводной канал. Это устройство также может быть сконфигурировано так, чтобы выполнять одну или более операций канального кодирования с сигналом, таких как кодирование с коррекцией ошибок (к примеру, согласованное по скорости сверточное кодирование) и/или кодирование с обнаружением ошибок (к примеру, кодирование циклическим избыточным кодом), и/или кодирование одного или более уровней сетевых протоколов (к примеру, Ethernet, TCP/IP, cdma2000).
Может быть желательным сконфигурировать мультиплексор A130 так, чтобы встраивать кодированный узкополосный сигнал (включающий в себя параметры S40 узкополосной фильтрации и кодированный узкополосный сигнал S50 возбуждения) в качестве разделяемого субпотока мультиплексированного сигнала S70, с тем чтобы кодированный узкополосный сигнал могут быть восстановлен и декодирован независимо от другой части мультиплексированного сигнала S70, такого как высокополосный и/или низкополосный сигнал. Например, мультиплексированный сигнал S70 может быть скомпонован таким образом, что кодированный узкополосный сигнал может быть восстановлен посредством отсечения параметров S60 высокополосной фильтрации. Одно потенциальное преимущество такого признака состоит в том, чтобы избегать необходимости перекодировки кодированного широкополосного сигнала до передачи его в систему, которая поддерживает декодирование узкополосного сигнала, но не поддерживает декодирование высокополосной части.
Фиг.2a - это блок-схема широкополосного речевого декодера B100 согласно конфигурации. Узкополосный декодер B110 выполнен с возможностью кодировать параметры S40 узкополосной фильтрации и декодированный узкополосный сигнал S50 возбуждения, чтобы формировать узкополосный сигнал S90. Высокополосный декодер B200 выполнен с возможностью декодировать параметры S60 высокополосного кодирования согласно узкополосному сигналу S80 возбуждения на основе кодированного узкополосного сигнала S50 возбуждения, чтобы сформировать высокополосный сигнал S100. В этом примере узкополосный декодер B110 выполнен с возможностью предоставлять узкополосный сигнал S80 возбуждения в высокополосный декодер B200. Гребенка B120 фильтров сконфигурирована так, чтобы комбинировать узкополосный сигнал S90 и высокополосный сигнал S100, чтобы формировать широкополосный речевой сигнал S110.
Фиг.2b - это блок-схема реализации B102 широкополосного речевого декодера B100,
который включает в себя демультиплексор B130, выполненный с возможностью формировать кодированные сигналы S40, S50 и S60 из мультиплексированного сигнала S70. Устройство, включающее в себя декодер B102, может включать в себя схему, сконфигурированную так, чтобы принимать мультиплексированный сигнал S70 из канала передачи, такого как проводной, оптический или беспроводной канал. Это устройство также может быть сконфигурировано так, чтобы выполнять одну или более операций канального декодирования с сигналом, таких как декодирование с коррекцией ошибок (к примеру, согласованное по скорости сверточное декодирование), и/или декодирование с обнаружением ошибок (к примеру, декодирование циклическим избыточным кодом), и/или декодирование одного или более уровней сетевых протоколов (к примеру, Ethernet, TCP/IP, cdma2000).
Гребенка A110 фильтров сконфигурирована так, чтобы фильтровать входной сигнал согласно схеме расщепления полосы, чтобы формировать низкочастотный поддиапазон и высокочастотный поддиапазон. В зависимости от проектных критериев конкретного приложения выходные поддиапазоны могут иметь равные или неравные полосы пропускания и могут быть перекрывающимися или неперекрывающимися. Конфигурация гребенки A110 фильтров, которая формирует более двух поддиапазонов, также возможна. Например, эта гребенка фильтров может быть сконфигурирована так, чтобы формировать один или более низкополосных сигналов, которые включают в себя компоненты в частотном диапазоне ниже частотного диапазона узкополосного сигнала S20 (например, диапазона 50-300 Гц). Также можно сконфигурировать эту гребенку фильтров таким образом, чтобы формировать один или более дополнительных высокополосных сигналов, которые включают в себя компоненты в частотном диапазоне выше частотного диапазона высокополосного сигнала S30 (например, диапазона 14-20, 16-20 или 16-32 кГц). В этом случае широкополосный речевой кодер A100 может быть реализован таким образом, чтобы кодировать этот сигнал или сигналы отдельно, и мультиплексор A130 может быть выполнен с возможностью включать дополнительный кодированный сигнал или сигналы в мультиплексированный сигнал S70 (к примеру, в качестве разделяемой части).
Фиг.3a иллюстрирует блок-схему реализации A112 гребенки A110 фильтров, которая сконфигурирована так, чтобы формировать два поддиапазонных сигнала, имеющих меньшие частоты дискретизации. Гребенка A110 фильтров выполнена с возможностью принимать широкополосный речевой сигнал S10, имеющий высокочастотную (или высокополосную) часть и низкочастотную (или низкополосную) часть. Гребенка A112 фильтров включает в себя путь низкополосной обработки, выполненный с возможностью принимать широкополосный речевой сигнал S10 и формировать узкополосный речевой сигнал S20, и путь высокополосной обработки, выполненный с возможностью принимать широкополосный речевой сигнал S10 и формировать высокополосный речевой сигнал S30. Низкочастотный фильтр 110 фильтрует широкополосный речевой сигнал S10, чтобы пропускать выбранный низкочастотный поддиапазон, а высокочастотный фильтр 130 фильтрует широкополосный речевой сигнал S10, чтобы пропускать выбранный высокочастотный поддиапазон. Поскольку оба поддиапазонных сигнала имеют более узкую полосу пропускания, чем широкополосный речевой сигнал S10, их частоты дискретизации могут быть снижены в некоторой степени без потери информации. Понижающий дискретизатор 120 снижает частоту дискретизации низкочастотного сигнала согласно требуемому коэффициенту прореживания (к примеру, посредством удаления выборок сигнала и/или замены выборок средними значениями), а понижающий дискретизатор 140 аналогично снижает частоту дискретизации сигнала верхних частот согласно другому требуемому коэффициенту прореживания.
Фиг.3b иллюстрирует блок-схему соответствующей реализации B122 гребенки B120 фильтров. Повышающий дискретизатор 150 повышает частоту дискретизации узкополосного сигнала S90 (к примеру, посредством заполнения нулями и/или посредством дублирования выборок), и низкочастотный фильтр 160 фильтрует сигнал с повышенной дискретизацией, чтобы пропускать низкополосную часть (к примеру, чтобы избежать наложения спектров). Аналогично, повышающий дискретизатор 170 увеличивает частоту дискретизации высокополосного сигнала S100, а высокочастотный фильтр 180 фильтрует сигнал с повышенной дискретизацией, чтобы пропускать высокополосную часть. Сигналы двух полос пропускания затем суммируются, чтобы сформировать широкополосный речевой сигнал S110. В некоторых реализациях декодера B100 гребенка B120 фильтров сконфигурирована так, чтобы формировать взвешенную сумму сигналов двух полос пропускания согласно одному или более весовых коэффициентов, принятых и/или вычисленных посредством высокополосного декодера B200. Конфигурация гребенки B120 фильтров, которая комбинирует сигналы более чем двух полос пропускания, также возможна.
Каждый из фильтров 110, 130, 160, 180 может быть реализован как фильтр с конечной импульсной характеристикой (FIR) или как фильтр с бесконечной импульсной характеристикой (IIR). Частотные характеристики фильтров 110 и 130 кодера могут иметь симметричные переходные области или переходные области непохожей формы между полосой режекции и полосой пропускания. Аналогично, частотные характеристики фильтров 160 и 180 декодера могут иметь симметричные переходные области или переходные области непохожей формы между полосой режекции и полосой пропускания. Может быть желательным реализовать фильтр 110 низких частот с такой же характеристикой, как и у фильтра 160 низких частот, и реализовать фильтр 130 высоких частот с такой же характеристикой, как и у фильтра 180 высоких частот. В одном примере две пары 110, 130 и 160, 180 фильтров являются гребенками квадратурных зеркальных фильтров (QMF), при этом пара 110, 130 фильтров имеет такие же коэффициенты, что и пара 160, 180 фильтров.
В типичном примере низкочастотный фильтр 110 имеет полосу пропускания, которая включает в себя ограниченный PSTN-диапазон в 300-3400 Гц (к примеру, полосу от 0 до 4 кГц). Фиг.4a и 4b иллюстрируют относительные полосы пропускания широкополосного речевого сигнала S10, узкополосного сигнала S20 и высокополосного сигнала S30 в двух различных примерах реализации. В обоих из этих примеров широкополосный речевой сигнал S10 имеет частоту дискретизации в 16 кГц (представляя частотные компоненты в диапазоне 0-8 кГц), а узкополосный сигнал S20 имеет частоту дискретизации в 8 кГц (представляя частотные компоненты в диапазоне 0-4 кГц).
В примере на фиг.4a нет существенного перекрывания между двумя поддиапазонами. Высокополосный сигнал S30, как показано в данном примере, может быть получен с помощью высокочастотного фильтра 130 с полосой пропускания в 4-8 кГц. В этом случае может быть желательным снизить частоту дискретизации до 8 кГц посредством снижения дискретизации фильтрованного сигнала на коэффициент два. Эта операция, которая, как ожидается, может существенно снизить вычислительную сложность дополнительных операций обработки сигнала, уменьшает энергию полосы пропускания до диапазона в 0-4 кГц без потери информации.
В альтернативном примере по фиг.4b верхние и нижние поддиапазоны имеют заметное перекрывание, так что область 3,5-4 кГц описывается посредством обоих поддиапазонных сигналов. Высокополосный сигнал S30, как показано в данном примере, может быть получен с помощью высокочастотного фильтра 130 с полосой пропускания в 3,5-7 кГц. В этом случае может быть желательным снизить частоту дискретизации до 7 кГц посредством понижающей дискретизации фильтрованного сигнала на коэффициент 16/7. Эта операция, которая, как ожидается, может существенно снизить вычислительную сложность дополнительных операций обработки сигнала, уменьшает энергию полосы пропускания до диапазона 0-3,5 кГц без потери информации.
В типичной телефонной трубке для телефонной связи один или более преобразователей (т.е. микрофон и наушник или динамик) имеет в значительной степени недостаточную характеристику в частотном диапазоне 7-8 кГц. В примере по фиг.4b часть широкополосного речевого сигнала S10 между 7 и 8 кГц не включена в кодированный сигнал. Другие конкретные примеры высокочастотного фильтра 130 имеют полосы пропускания в 3,5-7,5 кГц и 3,5-8 кГц.
В некоторых реализациях предоставление перекрывания между поддиапазонами, как в примере по фиг.4b, дает возможность использования низкочастотного и/или высокочастотного фильтра, имеющего плавное спадание в перекрывающейся области. Эти фильтры в типичном варианте проще проектировать, они менее вычислительно сложные и/или вносят меньшую задержку, чем фильтры с более резкими или "крутыми" характеристиками. Фильтры, имеющие резкие переходные области, зачастую имеют более высокие боковые лепестки (которые могут приводить к наложению спектров), чем фильтры аналогичного порядка, которые имеют плавное спадание. Фильтры, имеющие резкие переходные области, также могут иметь импульсные характеристики большой длительности, которые могут приводить к реверберирующим помехам. Для реализаций гребенок фильтров, имеющих один или более IIR-фильтров, предоставляющих плавное спадание в перекрывающейся области, можно позволить использование фильтра или фильтров, полюса которых находятся дальше от единичной окружности, что может быть важным для того, чтобы обеспечивать стабильную реализацию с фиксированной запятой.
Перекрывание поддиапазонов предоставляет плавное сопряжение полосы низких частот и полосы высоких частот, что может приводить к меньшим слышимым помехам, снижению наложения спектров и/или менее заметному переходу от одной полосы к другой. Более того, эффективность кодирования узкополосного кодера A120 (например, кодера формы сигналов) может падать с повышением частоты. Например, качество кодирования узкополосного кодера может снижаться при низких скоростях передачи битов, особенно при наличии фонового шума. В этих случаях предоставление перекрывания поддиапазонов позволяет повышать качество воспроизводимых частотных компонентов в перекрывающейся области.
Кроме того, перекрывание поддиапазонов предоставляет плавное сопряжение полосы низких частот и полосы высоких частот, что может приводить к меньшим слышимым помехам, снижению наложения спектров и/или менее заметному переходу от одной полосы к другой. Этот признак может быть особенно желательным для реализации, в которой узкополосный кодер A120 и высокополосный кодер A200 функционируют согласно различным методологиям кодирования. Например, различные методики кодирования могут формировать сигналы, которые звучат немного по-разному. Кодер, который кодирует спектральную огибающую в форме индексов таблицы кодирования, может формировать сигнал, имеющий звук, отличающийся от звука кодера, который кодирует вместо этого амплитудный спектр. Кодер временной области (к примеру, кодер по импульсно-кодовой модуляции, PCM) может формировать сигнал, имеющий звук, отличающийся от звука кодера частотной области. Кодер, который кодирует сигнал с представлением спектральной огибающей и соответствующего остаточного сигнала, может формировать сигнал, имеющий звук, отличающийся от звука кодера, который кодирует сигнал с представлением спектральной огибающей. Кодер, который кодирует сигнал как представление его формы, может формировать вывод, имеющий звук, отличающийся от звука синусоидального кодера. В этих случаях использование фильтров, имеющих резкие переходные области, чтобы задавать неперекрывающиеся поддиапазоны, может приводить к внезапному и перцепционно заметному переходу между поддиапазонами в синтезированном широкополосном сигнале.
Хотя гребенки QMF-фильтров, имеющие дополняющие перекрывающиеся частотные характеристики, зачастую используются в поддиапазонных методиках, такие фильтры не подходят, по меньшей мере, для некоторых реализаций широкополосного кодирования, описанных в данном документе. Гребенка QMF-фильтров в кодере сконфигурирована так, чтобы создавать значительную степень наложения спектров, которое компенсируется в соответствующей гребенке QMF-фильтров в декодере. Такая компоновка может не подходить для варианта применения, в котором сигнал подвергается значительной величине искажения между гребенками фильтров, поскольку искажение может снижать эффективность свойства компенсации наложе