Системы и способы для определения набора коэффициентов интерполяции

Иллюстрации

Показать все

Изобретение относится к системам и способам определения набора коэффициентов интерполяции. Технический результат изобретения заключается в оптимизировании пропускной способности, уравновешивая тем самым желаемую среднюю битовую скорость восстанавливаемого речевого сигнала.  Способ для определения набора коэффициентов интерполяции посредством электронного устройства включает в себя определение значения на основе свойства текущего кадра и свойства предыдущего кадра, определение того, находится или нет значение за пределами диапазона, определение набора коэффициентов интерполяции на основе значения и индикатора режима прогнозирования, если значение находится за пределами диапазона. 4 н. 28 з.п. ф-лы, 16 ил.

Реферат

Перекрестные ссылки на родственные заявки

[0001] Данная заявка относится и испрашивает приоритет предварительной заявки на патент (США) номер 61/767461, поданной 21 февраля 2013 года, озаглавленной "SYSTEMS AND METHODS FOR DETERMINING A SET OF INTERPOLATION FACTORS".

Область техники, к которой относится изобретение

[0002] Настоящее раскрытие, в общем, относится к электронным устройствам. Более конкретно, настоящее раскрытие относится к системам и способам для определения набора коэффициентов интерполяции.

Уровень техники

[0003] В последние несколько десятилетий получили повсеместное распространение электронные устройства. В частности, совершенствование электронных технологий позволяет сокращать стоимость все более сложных и полезных электронных устройств. Снижение стоимости и потребительский спрос приводят к быстрому распространению вариантов применения электронных устройств, так что в современном обществе они применяются фактически повсеместно. По мере роста применения электронных устройств, также растет и спрос на новые и улучшенные признаки электронных устройств. Более конкретно, зачастую требуются электронные устройства, которые выполняют новые функции и/или которые выполняют функции быстрее, эффективнее или с более высоким качеством.

[0004] Некоторые электронные устройства (например, сотовые телефоны, смартфоны, устройства звукозаписи, записывающие видеокамеры, компьютеры и т.д.) используют аудиосигналы. Эти электронные устройства могут кодировать, сохранять и/или передавать аудиосигналы. Например, смартфон может получать, кодировать и передавать речевой сигнал для телефонного вызова, в то время как другой смартфон может принимать и декодировать речевой сигнал.

[0005] Тем не менее, возникают определенные сложности при кодировании, передаче и декодировании аудиосигналов. Например, аудиосигнал может кодироваться, чтобы уменьшать величину полосы пропускания, требуемой для того, чтобы передавать аудиосигнал. Когда часть аудиосигнала потеряна в передаче, может быть затруднительным точно представлять декодированный аудиосигнал. Как можно видеть из этого пояснения, могут быть полезными системы и способы, которые улучшают декодирование.

Сущность изобретения

[0006] Описывается способ для определения набора коэффициентов интерполяции посредством электронного устройства. Способ включает в себя определение значения на основе свойства текущего кадра и свойства предыдущего кадра. Способ также включает в себя определение того, находится или нет значение за пределами диапазона. Способ дополнительно включает в себя определение набора коэффициентов интерполяции на основе значения и индикатора режима прогнозирования, если значение находится за пределами диапазона. Способ дополнительно включает в себя синтезирование речевого сигнала.

[0007] Определение набора коэффициентов интерполяции может быть основано на степени, в которой значение находится за пределами диапазона. Степень, в которой значение находится за пределами диапазона, может определяться на основе одного или более пороговых значений за пределами диапазона.

[0008] Индикатор режима прогнозирования может указывать один из двух режимов прогнозирования. Индикатор режима прогнозирования может указывать один из трех или более режимов прогнозирования.

[0009] Значение может быть отношением энергий на основе энергии импульсной характеристики синтезирующего фильтра текущего кадра и энергии импульсной характеристики синтезирующего фильтра предыдущего кадра. Определение того, находится или нет значение за пределами диапазона, может включать в себя определение того, меньше или нет отношение энергий, чем пороговое значение. Значение может включать в себя первый коэффициент отражения текущего кадра и первый коэффициент отражения предыдущего кадра. Определение того, находится или нет значение за пределами диапазона, может включать в себя определение того, превышает или нет первый коэффициент отражения предыдущего кадра первое пороговое значение, и того, меньше или нет первый коэффициент отражения текущего кадра второго порогового значения.

[0010] Способ может включать в себя интерполяцию векторов частоты спектральной линии (LSF) субкадров на основе набора коэффициентов интерполяции. Интерполяция LSF-векторов субкадров на основе набора коэффициентов интерполяции может включать в себя умножение концевого LSF-вектора текущего кадра на первый коэффициент интерполяции, умножение концевого LSF-вектора предыдущего кадра на второй коэффициент интерполяции и умножение среднего LSF-вектора текущего кадра на разностный коэффициент.

[0011] Набор коэффициентов интерполяции может включать в себя два или более коэффициентов интерполяции. Способ может включать в себя использование набора коэффициентов интерполяции по умолчанию, если значение не находится за пределами диапазона.

[0012] Индикатор режима прогнозирования может указывать режим прогнозирования текущего кадра. Индикатор режима прогнозирования может указывать режим прогнозирования предыдущего кадра.

[0013] Также описывается электронное устройство для определения набора коэффициентов интерполяции. Электронное устройство включает в себя схему определения значений, которая определяет значение на основе свойства текущего кадра и свойства предыдущего кадра. Электронное устройство также включает в себя схему определения наборов коэффициентов интерполяции, соединенную со схемой определения значений. Схема определения наборов коэффициентов интерполяции определяет то, находится или нет значение за пределами диапазона, и определяет набор коэффициентов интерполяции на основе значения и индикатора режима прогнозирования, если значение находится за пределами диапазона. Электронное устройство также включает в себя схему синтезирующих фильтров, которая синтезирует речевой сигнал.

[0014] Также описывается компьютерный программный продукт для определения набора коэффициентов интерполяции. Компьютерный программный продукт включает в себя долговременный материальный считываемый компьютером носитель с инструкциями. Инструкции включают в себя код для инструктирования электронному устройству определять значение на основе свойства текущего кадра и свойства предыдущего кадра. Инструкции также включают в себя код для инструктирования электронному устройству определять то, находится или нет значение за пределами диапазона. Инструкции дополнительно включают в себя код для инструктирования электронному устройству определять набор коэффициентов интерполяции на основе значения и индикатора режима прогнозирования, если значение находится за пределами диапазона. Инструкции дополнительно включают в себя код для инструктирования электронному устройству синтезировать речевой сигнал.

[0015] Также описывается устройство для определения набора коэффициентов интерполяции. Устройство включает в себя средство для определения значения на основе свойства текущего кадра и свойства предыдущего кадра. Устройство также включает в себя средство для определения того, находится или нет значение за пределами диапазона. Устройство дополнительно включает в себя средство для определения набора коэффициентов интерполяции на основе значения и индикатора режима прогнозирования, если значение находится за пределами диапазона. Устройство дополнительно включает в себя средство для синтезирования речевого сигнала.

Краткое описание чертежей

[0016] Фиг. 1 является блок-схемой, иллюстрирующей общий пример кодера и декодера;

[0017] Фиг. 2 является блок-схемой, иллюстрирующей пример базовой реализации кодера и декодера;

[0018] Фиг. 3 является блок-схемой, иллюстрирующей пример широкополосного речевого кодера и широкополосного речевого декодера;

[0019] Фиг. 4 является блок-схемой, иллюстрирующей более конкретный пример кодера;

[0020] Фиг. 5 является схемой, иллюстрирующей пример кадров во времени;

[0021] Фиг. 6 является блок-схемой последовательности операций способа, иллюстрирующей одну конфигурацию способа для кодирования речевого сигнала посредством кодера;

[0022] Фиг. 7 является блок-схемой, иллюстрирующей одну конфигурацию электронного устройства, выполненного с возможностью определения набора коэффициентов интерполяции;

[0023] Фиг. 8 является блок-схемой последовательности операций способа, иллюстрирующей одну конфигурацию способа для определения набора коэффициентов интерполяции посредством электронного устройства;

[0024] Фиг. 9 является блок-схемой, иллюстрирующей примеры модулей определения значений;

[0025] Фиг. 10 является блок-схемой, иллюстрирующей один пример модуля определения наборов коэффициентов интерполяции;

[0026] Фиг. 11 является схемой, иллюстрирующей один пример определения набора коэффициентов интерполяции;

[0027] Фиг. 12 является схемой, иллюстрирующей другой пример определения набора коэффициентов интерполяции;

[0028] Фиг. 13 включает в себя графики примеров форм синтезированного речевого сигнала;

[0029] Фиг. 14 включает в себя графики дополнительных примеров форм синтезированного речевого сигнала;

[0030] Фиг. 15 является блок-схемой, иллюстрирующей одну конфигурацию устройства беспроводной связи, в котором могут реализовываться системы и способы для определения набора коэффициентов интерполяции; и

[0031] Фиг. 16 иллюстрирует различные компоненты, которые могут быть использованы в электронном устройстве.

Подробное описание изобретения

[0032] Далее описываются различные конфигурации со ссылкой на чертежи, на которых аналогичные ссылки с номерами могут указывать функционально аналогичные элементы. Системы и способы, в общем, описанные и проиллюстрированные на чертежах в данном документе, могут приспосабливаться и проектироваться в широком спектре различных конфигураций. Таким образом, нижеприведенное подробное описание нескольких конфигураций, представленных на чертежах, не имеет намерение ограничивать заявленный объем, а просто представляет системы и способы.

[0033] Фиг. 1 является блок-схемой, иллюстрирующей общий пример кодера 104 и декодера 108. Кодер 104 принимает речевой сигнал 102. Речевой сигнал 102 может представлять собой речевой сигнал в любом частотном диапазоне. Например, речевой сигнал 102 может быть дискретизирован при 16 килобитах в секунду (Кбит/с) и может представлять собой сверхширокополосный сигнал с приблизительным частотным диапазоном в 0-16 килогерц (кГц) или 0-14 кГц, широкополосный сигнал с приблизительным частотным диапазоном в 0-8 кГц любо узкополосный сигнал с приблизительным частотным диапазоном в 0-4 кГц. В других примерах, речевой сигнал 102 может представлять собой сигнал полосы низких частот с приблизительным частотным диапазоном в 50-300 герц (Гц) либо сигнал полосы высоких частот с приблизительным частотным диапазоном в 4-8 кГц. Другие возможные частотные диапазоны для речевого сигнала 102 включают в себя 300-3400 Гц (например, частотный диапазон коммутируемой телефонной сети общего пользования (PSTN)), 14-20 кГц, 16-20 кГц и 16-32 кГц.

[0034] Кодер 104 кодирует речевой сигнал 102, чтобы формировать кодированный речевой сигнал 106. В общем, кодированный речевой сигнал 106 включает в себя один или более параметров, которые представляют речевой сигнал 102. Один или более параметров могут квантоваться. Примеры одного или более параметров включают в себя параметры фильтрации (например, весовые коэффициенты, частоты спектральных линий (LSF), индикаторы режима прогнозирования, пары спектральных линий (LSP), частоты спектральных иммитансов (ISF), пары спектральных иммитансов (ISP), коэффициенты частичной корреляции (ParCor), коэффициенты отражения и/или значения логарифмического отношения площадей и т.д.) и параметры, включенные в кодированный сигнал возбуждения (например, коэффициенты усиления, индексы адаптивных таблиц кодирования, усиления адаптивных таблиц кодирования, индексы фиксированных таблиц кодирования и/или усиления фиксированных таблиц кодирования и т.д.). Параметры могут соответствовать одной или более полос частот. Декодер 108 декодирует кодированный речевой сигнал 106, чтобы формировать декодированный речевой сигнал 110. Например, декодер 108 составляет декодированный речевой сигнал 110 на основе одного или более параметров, включенных в кодированный речевой сигнал 106. Декодированный речевой сигнал 110 может представлять собой приблизительное воспроизведение исходного речевого сигнала 102.

[0035] Кодер 104 может реализовываться в аппаратных средствах (например, в схеме), в программном обеспечении или в комбинации вышеозначенного. Например, кодер 104 может быть реализован как специализированная интегральная схема (ASIC) или как процессор с инструкциями. Аналогично, декодер 108 может реализовываться в аппаратных средствах (например, в схеме), в программном обеспечении или в комбинации вышеозначенного. Например, декодер 108 может быть реализован как специализированная интегральная схема (ASIC) или как процессор с инструкциями. Кодер 104 и декодер 108 могут реализовываться на отдельных электронных устройствах или на идентичном электронном устройстве.

[0036] Фиг. 2 является блок-схемой, иллюстрирующей пример базовой реализации кодера 204 и декодера 208. Кодер 204 может быть одним примером кодера 104, описанного в связи с фиг. 1. Кодер 204 может включать в себя модуль 212 анализа, преобразователь 214 коэффициентов, квантователь A 216, обратный квантователь A 218, обратный преобразователь A 220 коэффициентов, аналитический фильтр 222 и квантователь B 224. Один или более компонентов кодера 204 и/или декодера 208 могут реализовываться в аппаратных средствах (например, в схеме), в программном обеспечении или в комбинации вышеозначенного.

[0037] Кодер 204 принимает речевой сигнал 202. Следует отметить, что речевой сигнал 202 может включать в себя любой частотный диапазон, как описано выше в связи с фиг. 1 (например, всю полосу речевых частот или подполосу речевых частот).

[0038] В этом примере, модуль 212 анализа кодирует спектральную огибающую речевого сигнала 202 в качестве набора коэффициентов линейного прогнозирования (LP) (например, коэффициентов A(z) аналитической фильтрации, которые могут применяться для того, чтобы формировать синтезирующий фильтр 1/A(z) со всеми полюсами, где z является комплексным числом). Модуль 212 анализа типично обрабатывает входной сигнал в качестве последовательности неперекрывающихся кадров речевого сигнала 202, при этом новый набор коэффициентов вычисляется для каждого кадра или субкадра. В некоторых конфигурациях, период кадра может быть периодом, в течение которого речевой сигнал 202 предположительно может быть локально стационарным. Один типичный пример периода кадра составляет 20 миллисекунд (мс) (например, эквивалентный 160 выборкам на частоте дискретизации 8 кГц). В одном примере, модуль 212 анализа выполнен с возможностью вычислять набор из десяти коэффициентов линейного прогнозирования, чтобы характеризовать формантную структуру каждого кадра в 20 мс. В другом примере, частота дискретизации в 12,8 кГц может быть использована для кадра в 20 мс. В этом примере, размер кадра составляет 256 выборок, и модуль 212 анализа может вычислять набор из 16 коэффициентов линейного прогнозирования (например, коэффициентов линейного прогнозирования 16-ого порядка). Хотя это примеры инфраструктур, которые могут реализовываться в соответствии с системами и способами, раскрытыми в данном документе, следует отметить, что эти примеры не должны ограничивать объем раскрытых систем и способов, которые могут применяться к любой инфраструктуре. Также можно реализовывать модуль 212 анализа таким образом, чтобы обрабатывать речевой сигнал 202 в качестве последовательности перекрывающихся кадров.

[0039] Модуль 212 анализа может быть выполнен с возможностью непосредственно анализировать выборки каждого кадра, либо выборки могут быть сначала взвешены согласно функции кадрирования (к примеру, окну Хэмминга). Анализ также может выполняться для окна, превышающего кадр, например, 30-миллисекундного окна. Это окно может быть симметричным (к примеру, 5-20-5, так что оно включает в себя 5 мс непосредственно перед и после 20-миллисекундного кадра) или асимметричным (к примеру, 10-20, так что оно включает в себя последние 10 мс предыдущего кадра). Модуль 212 анализа типично выполнен с возможностью вычислять коэффициенты линейного прогнозирования с использованием рекурсии Левинсона-Дурбина или алгоритма Леро-Гугена. В другой реализации, модуль 212 анализа может быть выполнен с возможностью вычислять набор кепстральных коэффициентов для каждого кадра вместо набора коэффициентов линейного прогнозирования.

[0040] Выходная скорость кодера 204 может значительно снижаться, с относительно небольшим эффектом в отношении качества воспроизведения, посредством квантования коэффициентов. Коэффициенты линейного прогнозирования трудно квантовать эффективно, и они обычно преобразуются в другое представление, к примеру, в LSF для квантования и/или энтропийного кодирования. В примере по фиг. 2, преобразователь 214 коэффициентов преобразует набор коэффициентов в соответствующий LSF-вектор (например, набор LSF). Другие представления "один-к-одному" коэффициентов включают в себя LSP, ParCor-коэффициенты, коэффициенты отражения, значения логарифмического отношения площадей, ISP и ISF. Например, ISF могут использоваться в кодеке на основе GSM (глобальной системы мобильной связи) по AMR-WB (стандарту широкополосного адаптивного многоскоростного кодирования). Для удобства, термины "частоты спектральных линий", "LSF", "LSF-векторы" и связанные термины могут использоваться для того, чтобы означать одно или более из LSF, LSP, ISF, ISP, ParCor-коэффициентов, коэффициентов отражения и значений логарифмического отношения площадей. Типично, преобразование между набором коэффициентов и соответствующим LSF-вектором является обратимым, но некоторые конфигурации могут включать в себя реализации кодера 204, в которых преобразование является необратимым без ошибки.

[0041] Квантователь A 216 выполнен с возможностью квантовать LSF-вектор (или другое представление коэффициентами). Кодер 204 может выводить результат этого квантования в качестве параметров 228 фильтрации. Квантователь A 216 типично включает в себя векторный квантователь, который кодирует входной вектор (например, LSF-вектор) в качестве индекса для соответствующей векторной записи в таблице или в таблице кодирования.

[0042] Как видно на фиг. 2, кодер 204 также формирует остаточный сигнал посредством пропускания речевого сигнала 202 через аналитический фильтр 222 (также называемый "отбеливающим фильтром" или "фильтром ошибок прогнозирования"), который сконфигурирован согласно набору коэффициентов. Аналитический фильтр 222 может быть реализован как фильтр с конечной импульсной характеристикой (FIR) или фильтр с бесконечной импульсной характеристикой (IIR). Этот остаточный сигнал должен типично содержать перцепционно важную информацию речевого кадра, к примеру, долговременную структуру, связанную с основным тоном, который не представлен в параметрах 228 фильтрации. Квантователь B 224 выполнен с возможностью вычислять квантованное представление этого остаточного сигнала для вывода в качестве кодированного сигнала 226 возбуждения. В некоторых конфигурациях, квантователь B 224 включает в себя векторный квантователь, который кодирует входной вектор в качестве индекса для соответствующей векторной записи в таблице или в таблице кодирования. Дополнительно или альтернативно, квантователь B 224 может быть выполнен с возможностью отправлять один или более параметров, из которых вектор может формироваться динамически в декодере 208, а не извлекаться устройства хранения данных, как в способе на основе разреженных таблиц кодирования. Этот способ используется в схемах кодирования, таких как алгебраическое CELP (линейное прогнозирование с возбуждением по коду), и в кодеках, таких как EVRC (усовершенствованный кодек с переменной скоростью) по стандарту 3GPP2 (Партнерского проекта третьего поколения 2). В некоторых конфигурациях, кодированный сигнал 226 возбуждения и параметры 228 фильтрации могут быть включены в кодированный речевой сигнал 106.

[0043] Может быть преимущественным, если кодер 204 формирует кодированный сигнал 226 возбуждения согласно идентичным значениям параметра фильтрации, которые доступны в соответствующем декодере 208. Таким образом, результирующий кодированный сигнал 226 возбуждения уже может учитывать в некоторой степени неидеальности в этих значениях параметров, такие как ошибка квантования. Соответственно, может быть преимущественным конфигурировать аналитический фильтр 222 с использованием идентичных значений коэффициентов, которые доступны в декодере 208. В базовом примере кодера 204, как проиллюстрировано на фиг. 2, обратный квантователь A 218 деквантует параметры 228 фильтрации. Обратный преобразователь A 220 коэффициентов преобразует результирующие значения обратно в соответствующий набор коэффициентов. Этот набор коэффициентов используется для того, чтобы конфигурировать аналитический фильтр 222 с возможностью формировать остаточный сигнал, который квантуется посредством квантователя B 224.

[0044] Некоторые реализации кодера 204 выполнены с возможностью вычислять кодированный сигнал 226 возбуждения посредством идентификации одного из набора векторов таблиц кодирования, который имеет наилучшее совпадение с остаточным сигналом. Тем не менее, следует отметить, что кодер 204 также может быть реализован с возможностью вычислять квантованное представление остаточного сигнала без фактического формирования остаточного сигнала. Например, кодер 204 может быть выполнен с возможностью использовать определенное число векторов таблиц кодирования для того, чтобы формировать соответствующие синтезированные сигналы (например, согласно текущему набору параметров фильтрации) и выбирать вектор таблицы кодирования, ассоциированный со сформированным сигналом, который имеет наилучшее совпадение с исходным речевым сигналом 202 в перцепционно взвешенном домене.

[0045] Декодер 208 может включать в себя обратный квантователь B 230, обратный квантователь C 236, обратный преобразователь B 238 коэффициентов и синтезирующий фильтр 234. Обратный квантователь C 236 деквантует параметры 228 фильтрации (например, LSF-вектор), и обратный преобразователь B 238 коэффициентов преобразует LSF-вектор в набор коэффициентов (например, как описано выше в отношении обратного квантователя A 218 и обратного преобразователя A 220 коэффициентов кодера 204). Обратный квантователь B 230 деквантует кодированный сигнал 226 возбуждения для того, чтобы формировать сигнал 232 возбуждения. На основе коэффициентов и сигнала 232 возбуждения, синтезирующий фильтр 234 синтезирует декодированный речевой сигнал 210. Другими словами, синтезирующий фильтр 234 выполнен с возможностью спектрально формировать сигнал 232 возбуждения согласно деквантованным коэффициентам, чтобы формировать декодированный речевой сигнал 210. В некоторых конфигурациях, декодер 208 также может предоставлять сигнал 232 возбуждения в другой декодер, который может использовать сигнал 232 возбуждения для того, чтобы извлекать сигнал возбуждения другой полосы частот (например, полосы высоких частот). В некоторых реализациях, декодер 208 может быть выполнен с возможностью предоставлять в другой декодер дополнительную информацию, которая связана с сигналом 232 возбуждения, такую как наклон спектра, усиление и запаздывание основного тона и речевой режим.

[0046] Система кодера 204 и декодера 208 является базовым примером речевого кодека по методу анализа через синтез. Кодирование на основе линейного прогнозирования с возбуждением по таблице кодирования представляет собой одно популярное семейство кодирования по методу анализа через синтез. Реализации таких кодеров могут выполнять кодирование на основе формы сигналов остатка, включающее в себя такие операции, как выбор записей из фиксированных и адаптивных таблиц кодирования, операции минимизации ошибок и/или операции перцепционного взвешивания. Другие реализации кодирование по методу анализа через синтез включают в себя кодирование на основе линейного прогнозирования со смешанным возбуждением (MELP), на основе алгебраического CELP (ACELP), на основе релаксационного CELP (RCELP), на основе регулярного импульсного возбуждения (RPE), на основе многоимпульсного возбуждения (MPE), на основе многоимпульсного CELP (MPE) и на основе линейного прогнозирования с возбуждением векторной суммой (VSELP). Соответствующие способы кодирования включают в себя кодирование на основе многополосного возбуждения (MBE) и интерполяции формы прототипного сигнала (PWI). Примеры стандартизированных речевых кодеков по методу анализа через синтез включают в себя кодек по стандарту полноскоростного кодирования ETSI (Европейского института стандартизации в области телекоммуникаций)-GSM (GSM 06.10) (который использует линейное прогнозирование с возбуждением по остатку (RELP)); GSM-кодек по стандарту улучшенного полноскоростного кодирования (ETSI-GSM 06.60); кодер по стандарту ITU (Международного союза телекоммуникаций), 11.8 Кбит/с, G.729, приложение E; кодеки согласно IS (промежуточному стандарту)-641 для IS-136 (по схеме множественного доступа с временным разделением каналов); кодеки по стандарту адаптивного многоскоростного кодирования на основе GSM (GSM-AMR); и кодек 4GV™ (вокодер четвертого поколения) (QUALCOMM Incorporated, San Diego, Калифорния). Кодер 204 и соответствующий декодер 208 могут быть реализованы согласно любой из этих технологий либо любой другой технологии кодирования речи (известной или разрабатываемой), которая представляет речевой сигнал как (A) набор параметров, которые описывают фильтр, и (B) сигнал возбуждения, используемый для того, чтобы активировать описанный фильтр с возможностью воспроизводить речевой сигнал.

[0047] Даже после того, как аналитический фильтр 222 удаляет приблизительную спектральную огибающую из речевого сигнала 202, значительная величина точной гармонической структуры может оставаться, особенно для вокализованной речи. Периодическая структура связана с основным тоном, и различные вокализованные звуки, произносимые одним говорящим, могут иметь различные формантные структуры, но аналогичные структуры основного тона.

[0048] Эффективность кодирования и/или качество речи может быть повышено посредством использования одного или более значений параметров для того, чтобы кодировать характеристики структуры основного тона. Одной важной характеристикой структуры основного тона является эффективность первой гармоники (также называемая "собственной частотой"), которая типично находится в диапазоне 60-400 герц (Гц). Эта характеристика типично кодируется как инверсия собственной частоты, также называемая "запаздыванием основного тона". Запаздывание основного тона указывает число выборок в одном периоде основного тона и может кодироваться как один или более индексов таблиц кодирования. Речевые сигналы от мужчин-говорящих зачастую имеют большее запаздывание основного тона, чем речевые сигналы от женщин-говорящих.

[0049] Другой характеристикой сигнала, связанной со структурой основного тона, является периодичность, которая указывает интенсивность гармонической структуры или, другими словами, степень, в которой сигнал является гармоническим или негармоническим. Два типичных индикатора периодичности представляют собой переходы через нуль и нормализованные автокорреляционные функции (NACF). Периодичность также может показываться посредством усиления основного тона, которое, как правило, кодируется как усиление таблицы кодирования (к примеру, квантованное усиление адаптивной таблицы кодирования).

[0050] Кодер 204 может включать в себя один или более модулей, выполненных с возможностью кодировать долговременную гармоническую структуру речевого сигнала 202. В некоторых подходах к CELP-кодированию, кодер 204 включает в себя модуль анализа на основе линейного прогнозирующего кодирования (LPC) с разомкнутым контуром, который кодирует кратковременные характеристики или приблизительную спектральную огибающую, после чего выполняется стадия анализа на основе долговременного прогнозирования с замкнутым контуром, которая кодирует точную структуру основного тона или гармоническую структуру. Кратковременные характеристики кодируются как коэффициенты (к примеру, параметры 228 фильтрации), а долговременные характеристики кодируются как значения для параметров, такие как запаздывание основного тона и усиление основного тона. Например, кодер 204 может быть выполнен с возможностью выводить кодированный сигнал 226 возбуждения в форме, которая включает в себя один или более индексов таблиц кодирования (например, индекс фиксированной таблицы кодирования и индекс адаптивной таблицы кодирования) и соответствующих значений усиления. Вычисление этого квантованного представления остаточного сигнала (к примеру, посредством квантователя B 224) может включать в себя выбор таких индексов и вычисление таких значений. Кодирование структуры основного тона также может включать в себя интерполяцию формы прототипного сигнала основного тона, причем эта операция может включать в себя вычисление разности между последовательными импульсами основного тона. Моделирование долговременной структуры может быть деактивировано для кадров, соответствующих невокализованной речи, которые типично являются шумоподобными и неструктурированными.

[0051] Некоторые реализации декодера 208 могут быть выполнены с возможностью выводить сигнал 232 возбуждения в другой декодер (например, в декодер полосы высоких частот) после того, как долговременная структура (структура основного тона или гармоническая структура) восстановлена. Например, такой декодер может быть выполнен с возможностью выводить сигнал 232 возбуждения в качестве деквантованной версии кодированного сигнала 226 возбуждения. Конечно, также можно реализовывать декодер 208 таким образом, что другой декодер выполняет деквантование кодированного сигнала 226 возбуждения для того, чтобы получать сигнал 232 возбуждения.

[0052] Фиг. 3 является блок-схемой, иллюстрирующей пример широкополосного речевого кодера 342 и широкополосного речевого декодера 358. Один или более компонентов широкополосного речевого кодера 342 и/или широкополосного речевого декодера 358 могут реализовываться в аппаратных средствах (например, в схеме), в программном обеспечении или в комбинации вышеозначенного. Широкополосный речевой кодер 342 и широкополосный речевой декодер 358 могут реализовываться на отдельных электронных устройствах или на идентичном электронном устройстве.

[0053] Широкополосный речевой кодер 342 включает в себя гребенку A 344 фильтров, кодер 348 первой полосы частот и кодер 350 второй полосы частот. Гребенка A 344 фильтров выполнена с возможностью фильтровать широкополосный речевой сигнал 340 для того, чтобы формировать сигнал 346a первой полосы частот (например, узкополосный сигнал) и сигнал 346b второй полосы частот (например, сигнал полосы высоких частот).

[0054] Кодер 348 первой полосы частот выполнен с возможностью кодировать сигнал 346a первой полосы частот для того, чтобы формировать параметры 352 фильтрации (например, параметры узкополосной (NB) фильтрации) и кодированный сигнал 354 возбуждения (например, кодированный узкополосный сигнал возбуждения). В некоторых конфигурациях, кодер 348 первой полосы частот может формировать параметры 352 фильтрации и кодированный сигнал 354 возбуждения в качестве индексов таблиц кодирования или в другой квантованной форме. В некоторых конфигурациях, кодер 348 первой полосы частот может реализовываться в соответствии с кодером 204, описанным в связи с фиг. 2.

[0055] Кодер 350 второй полосы частот выполнен с возможностью кодировать сигнал 346b второй полосы частот (например, сигнал полосы высоких частот) согласно информации в кодированном сигнале 354 возбуждения для того, чтобы формировать параметры 356 кодирования во второй полосе частот (например, параметры кодирования в полосе высоких частот). Кодер 350 второй полосы частот может быть выполнен с возможностью формировать параметры 356 кодирования во второй полосе частот в качестве индексов таблиц кодирования или в другой квантованной форме. Один конкретный пример широкополосного речевого кодера 342 выполнен с возможностью кодировать широкополосный речевой сигнал 340 на скорости приблизительно в 8,55 Кбит/с, при этом приблизительно 7,55 Кбит/с используются для параметров 352 фильтрации и кодированного сигнала 354 возбуждения, и приблизительно 1 Кбит/с используются для параметров 356 кодирования во второй полосе частот. В некоторых реализациях, параметры 352 фильтрации, кодированный сигнал 354 возбуждения и параметры 356 кодирования во второй полосе частот могут быть включены в кодированный речевой сигнал 106.

[0056] В некоторых конфигурациях, кодер 350 второй полосы частот может реализовываться аналогично кодеру 204, описанному в связи с фиг. 2. Например, кодер 350 второй полосы частот может формировать параметры фильтрации второй полосы частот (например, в качестве части параметров 356 кодирования во второй полосе частот), как описано в связи с кодером 204, описанным в связи с фиг. 2. Тем не менее, кодер 350 второй полосы частот может отличаться в некотором отношении. Например, кодер 350 второй полосы частот может включать в себя формирователь возбуждения второй полосы частот, который может формировать сигнал возбуждения второй полосы частот на основе кодированного сигнала 354 возбуждения. Кодер 350 второй полосы частот может использовать сигнал возбуждения второй полосы частот для того, чтобы формировать синтезированный сигнал второй полосы частот и определять коэффициент усиления второй полосы частот. В некоторых конфигурациях, кодер 350 второй полосы частот может квантовать коэффициент усиления второй полосы частот. Соответственно, примеры параметров кодирования во второй полосе частот включают в себя параметры фильтрации второй полосы частот и квантованный коэффициент усиления второй полосы частот.

[0057] Может быть преимущественным комбинировать параметры 352 фильтрации, кодированный сигнал 354 возбуждения и параметры 356 кодирования во второй полосе частот в один поток битов. Например, может быть преимущественным мультиплексировать кодированные сигналы вместе для передачи (к примеру, по проводному, оптическому или беспроводному каналу передачи) либо для хранения в качестве кодированного широкополосного речевого сигнала. В некоторых конфигурациях, широкополосный речевой кодер 342 включает в себя мультиплексор (не показан), выполненный с возможностью комбинировать параметры 352 фильтрации, кодированный сигнал 354 возбуждения и параметры 356 кодирования во второй полосе частот в мультиплексированный сигнал. Параметры 352 фильтрации, кодированный сигнал 354 возбуждения и параметры 356 кодирования во второй полосе частот могут быть примерами параметров, включенных в кодированный речевой сигнал 106, как описано в связи с фиг. 1.

[0058] В некоторых реализациях, электронное устройство, которое включает в себя широкополосный речевой кодер 342, также может включать в себя схему, выполненную с возможностью передавать мультиплексированный сигнал в канал передачи, такой как проводной, оптический или беспроводной канал. Это электронное устройство также может быть выполнено с возможностью осуществлять одну или более операций канального кодирования для сигнала, таких как кодирование с коррекцией ошибок (к примеру, согласованное по скорости сверточное кодирование) и/или кодирование с обнаружением ошибок (к примеру, кодирование с контролем циклическим избыточным кодом), и/или кодирование согласно одному или более уровней сетевых протоколов (к примеру, протокол управления передачей/Интернет-протокол (TCP/IP), CDMA2000).

[0059] Может быть преимущественным, если мультиплексор выполнен с возможностью встраивать параметры 352 фильтрации и кодированный сигнал 354 возбуждения в качестве разделимого субпотока мультиплексированного сигнала, так что параметры 352 фильтрации и кодированный сигнал 354 возбуждения могут восстанавливаться и декодироваться независимо от другой части мультиплексированного сигнала, к примеру, сигнала полосы высоких частот и/или полосы низких частот. Например, мультиплексированный сигнал может компоноваться таким образом, что параметры 3