2665253 - Устройство и способ для улучшенного маскирования адаптивной таблицы кодирования при acelp-образном маскировании с использованием улучшенной оценки запаздывания основного тона

Устройство и способ для улучшенного маскирования адаптивной таблицы кодирования при acelp-образном маскировании с использованием улучшенной оценки запаздывания основного тона

Иллюстрации

Показать все

Изобретение относится к области обработки аудиосигналов. Технический результат заключается в повышении эффективности обработки аудиосигналов. Технический результат достигается за счет оценки запаздывания основного тона в зависимости от множества исходных значений запаздывания основного тона и в зависимости от множества информационных значений, при этом для каждого исходного значения запаздывания основного тона из множества исходных значений запаздывания основного тона, информационное значение из множества информационных значений назначается упомянутому исходному значению запаздывания основного тона, оценки запаздывания основного тона посредством минимизации функции ошибок, которая зависит от множества исходных значений и от множества информационных значений, и восстановления кадра с использованием оцененного запаздывания основного тона. 3 н. и 10 з.п. ф-лы, 15 ил.

Реферат

Настоящее изобретение относится к обработке аудиосигналов, в частности, к обработке речи, а более конкретно, к устройству и способу для улучшенного маскирования адаптивной таблицы кодирования при ACELP-образном маскировании (ACELP - линейное прогнозирование с возбуждением по алгебраическому коду).

Обработка аудиосигналов приобретают все большую важность. В области техники обработки аудиосигналов, важную роль играют технологии маскирования. Когда кадр теряется или повреждается, потерянная информация из потерянного или поврежденного кадра должна быть заменена. В обработке речевых сигналов, в частности, при рассмотрении ACELP- или ACELP-образных речевых кодеков, информация основного тона является очень важной. Требуются технологии прогнозирования основного тона и технологии повторной синхронизации импульсов.

Относительно восстановления основного тона, предусмотрены различные технологии экстраполяции основного тона в предшествующем уровне техники.

Одна из этих технологий представляет собой технологию на основе повторений. Большинство современных кодеков применяет простой подход к маскированию на основе повторений, что означает то, что последний корректно принимаемый период основного тона до потерь пакетов повторяется до тех пор, пока не поступит хороший кадр, и новая информация основного тона может декодироваться из потока битов. Альтернативно, логика обеспечения стабильности основного тона применяется согласно тому, что выбрано значение основного тона, которое принято за некоторое время до потерь пакетов. Кодеки согласно подходу на основе повторений представляют собой, например, G.719 (см. [ITU08b, 8.6]), G.729 (см. [ITU12, 4.4]), AMR (см. [3GP12a, 6.2.3.1], [ITU03]), AMR-WB (см. [3GP12b, 6.2.3.4.2]), и AMR-WB+(ACELP- и TCX20-(ACELP-образное) маскирование) (см. [3GP09]); (AMR - стандарт адаптивного многоскоростного кодирования; AMR-WB - стандарт широкополосного адаптивного многоскоростного кодирования).

Другая технология восстановления основного тона предшествующего уровня техники представляет собой извлечение основного тона из временной области. Для некоторых кодеков, основной тон требуется для маскирования, но не встраивается в поток битов. Следовательно, основной тон вычисляется на основе сигнала временной области предыдущего кадра для того, чтобы вычислять период основного тона, который затем сохраняется постоянным во время маскирования. Кодек согласно этому подходу представляет собой, например, G.722, см., в частности, G.722 Приложение 3 (см. [ITU06a, III.6.6 и III.6.7]), и G.722 Приложение 4 (см. [ITU07, IV.6.1,2.5]).

Дополнительная технология восстановления основного тона предшествующего уровня техники основана на экстраполяции. Некоторые современные кодеки применяют подходы на основе экстраполяции основного тона и выполняют конкретные алгоритмы для того, чтобы изменять основной тон, соответственно, на оценки экстраполированного основного тона во время потерь пакетов. Эти подходы подробнее описываются следующим образом в отношении G.718 и G.729.1.

Сначала рассмотрим G.718 (см. [ITU08a]). Оценка будущего основного тона проводится посредством экстраполяции для того, чтобы поддерживать модуль повторной синхронизации гортанных импульсов. Эта информация относительно возможного будущего значения основного тона используется для того, чтобы синхронизировать гортанные импульсы маскированного возбуждения.

Экстраполяция основного тона проводится только в том случае, если последний хороший кадр не является вокализованным. Экстраполяция основного тона G.718 основана на таком допущении, что кодер имеет плавный контур основного тона. Упомянутая экстраполяция проводится на основе запаздываний основного тона последних семи субкадров перед стиранием.

В G.718, обновление предыстории плавающих значений основного тона проводится после каждого корректно принимаемого кадра. С этой целью, значения основного тона обновляются только в том случае, если базовый режим отличается от невокализованного. В случае потерянного кадра, разность между плавающими запаздываниями основного тона вычисляется согласно формуле:

В формуле (1), обозначает запаздывание основного тона последнего (т.е. четвертого) субкадра предыдущего кадра; обозначает запаздывание основного тона третьего субкадра предыдущего кадра; и т.д.

Согласно G.718, сумма разностей вычисляется следующим образом:

Поскольку значения могут быть положительными или отрицательными, число инверсий знака суммируется, и позиция первой инверсии указывается посредством параметра, сохраненного в запоминающем устройстве.

Параметр f_corr находится следующим образом:

где d_max=231 является максимальным учитываемым запаздыванием основного тона.

В G.718, позиция i_max, указывающая максимальную абсолютную разность, находится согласно определению:

и отношение для этой максимальной разности вычисляется следующим образом:

Если это отношение превышает или равно 5, то основной тон четвертого субкадра последнего корректно принимаемого кадра используется для всех субкадров, которые должны быть маскированы. Если это отношение превышает или равно 5, это означает то, что алгоритм не экстраполирует однозначно основной тон, и повторная синхронизация гортанных импульсов не выполняется.

Если r_max меньше 5, то проводится дополнительная обработка для того, чтобы добиваться самой лучшей экстраполяции. Три различных способа используются для того, чтобы экстраполировать будущий основной тон. Чтобы выбирать между возможными алгоритмами экстраполяции основного тона, вычисляется параметр f_corr2 отклонения, который зависит от коэффициента f_corr и от позиции максимального варьирования i_max основного тона. Тем не менее, сначала средняя плавающая разность основного тона модифицируется, чтобы удалять слишком большие разности основного тона от среднего значения:

Если f_corr<0,98, а если i_max=3, то средняя дробная разность основного тона определяется согласно формуле:

с тем, чтобы удалять разности основного тона, связанные с переходом между двумя кадрами.

Если f_corr≥0,98, или если i_max≠3, средняя дробная разность основного тона вычисляется следующим образом:

и максимальная плавающая разность основного тона заменена этим новым средним значением:

При этом новом среднем значении плавающих разностей основного тона, нормализованное отклонение f_corr2 вычисляется следующим образом:

где I_sf равен 4 в первом случае и равен 6 во втором случае.

В зависимости от этого нового параметра, осуществляется выбор между тремя способами экстраполяции будущего основного тона:

- Если изменяет знак более двух раз (это указывает высокое варьирование основного тона), первая инверсия знака находится в последнем хорошем кадре (для i<3) и f_corr2>0,945, экстраполированный основной тон d_ext (экстраполированный основной тон также обозначается как T_ext), вычисляется следующим образом:

- Если 0,945<f_corr2<0,99, и изменяет знак, по меньшей мере, один раз, взвешенное среднее дробных разностей основного тона используется для того, чтобы экстраполировать основной тон. Взвешивание f_w средней разности связано с нормализованным отклонением f_corr2, и позиция первой инверсии знака задается следующим образом:

Параметр i_mem формулы зависит от позиции первой инверсии знака, так что i_mem=0, если первая инверсия знака возникает между последними двумя субкадрами предыдущего кадра, так что i_mem=1, если первая инверсия знака возникает между вторым и третьим субкадрами предыдущего кадра, и т.д. Если первая инверсия знака находится близко к концу последнего кадра, это означает то, что варьирование основного тона является менее стабильным рядом с потерянным кадром. Таким образом, весовой коэффициент, примененный к среднему значению, должен иметь значение около 0, и экстраполированный основной тон d_ext должен иметь значение близко к основному тону четвертого субкадра последнего хорошего кадра:

- В противном случае, постепенное изменение основного тона считается стабильным, и экстраполированный основной тон d_ext определяется следующим образом:

После этой обработки, запаздывание основного тона ограничено между 34 и 231 (значения обозначают минимальное и максимальное разрешенные запаздывания основного тона).

Далее, для иллюстрации другого примера технологий восстановления основного тона на основе экстраполяции, рассмотрим G.729.1 (см. [ITU06b]).

G.729.1 показывает подход на основе экстраполяции основного тона (см. [Gao]), в случае если информация прямого маскирования ошибок (например, информация фазы) не является декодируемой. Это происходит, например, если два последовательных кадра теряются (один суперкадр состоит из четырех кадров, которые могут быть или ACELP или TCX20). Также возможны TCX40- или TCX80-кадры и практически все их комбинации.

Когда один или более кадров теряются в вокализованной области, предыдущая информация основного тона всегда используется для того, чтобы восстанавливать текущий потерянный кадр. Точность текущего оцененного основного тона может оказывать непосредственное влияние на фазовое совмещение с исходным сигналом, и это критически важно для качества восстановления текущего потерянного кадра и принимаемого кадра после потерянного кадра. Использование нескольких предыдущих запаздываний основного тона вместо простого копирования предыдущего запаздывания основного тона должно приводить к статистически лучшей оценке основного тона. В G.729.1-кодере, экстраполяция основного тона для FEC (FEC - прямая коррекция ошибок) состоит из линейной экстраполяции на основе предыдущих пяти значений основного тона. Предыдущие пять значений основного тона представляют собой P(i), для i=0, 1, 2, 3, 4, где P(4) является последним значением основного тона. Модель экстраполяции задается согласно следующему:

Значение экстраполированного основного тона для первого субкадра в потерянном кадре затем задается следующим образом:

Чтобы определять коэффициенты a и b, ошибка E минимизируется, при этом ошибка E задается согласно следующему:

Посредством задания:

a и b получаются в результате следующим образом:

Далее описывается принцип маскирования стирания кадров предшествующего уровня техники для AMR-WB-кодека, как представлено в [MCZ11]. Этот принцип маскирования стирания кадров основан на линейном прогнозировании основного тона и усиления. Упомянутая работа представляет подход на основе линейной интер/экстраполяции основного тона в случае потерь кадров, на основе критерия минимальной среднеквадратической ошибки.

Согласно этому принципу маскирования стирания кадров, в декодере, когда тип последнего допустимого кадра до стертого кадра (предыдущего кадра) является идентичным стертому кадру самого раннего после стертого кадра (будущего кадра), задается основной тон P(i), где i=-N,-N+1, ..., 0, 1, ..., N+4, N+5, и где N является числом предыдущих и будущих субкадров стертого кадра. P(1), P(2), P(3), P(4) являются четырьмя основными тонами четырех субкадров в стертом кадре, P(0), P(-1), ..., P(-N) являются основными тонами предыдущих субкадров, и P(5), P(6), ..., P(N+5) являются основными тонами будущих субкадров. Используется модель линейного прогнозирования P'(i)=a+b*i. Для i=1, 2, 3, 4; P'(1), P'(2), P'(3), P'(4) являются прогнозными основными тонами для стертого кадра. MMS-критерий (MMS - минимальное среднеквадратическое значение) учитывается для того, чтобы извлекать значения двух прогнозных коэффициентов a и b согласно подходу на основе интерполяции. Согласно этому подходу, ошибка E задается следующим образом:

Затем коэффициенты a и b могут получаться посредством вычисления:

Запаздывания основного тона для последних четырех субкадров стертого кадра могут вычисляться согласно следующему:

Обнаружено, что N=4 предоставляет наилучший результат. N=4 означает, что пять предыдущих субкадров и пять будущих субкадров используются для интерполяции.

Тем не менее, когда тип предыдущих кадров отличается от типа будущих кадров, например, когда предыдущий кадр является вокализованным, но будущий кадр является невокализованным, просто вокализованные основные тона предыдущих или будущих кадров используются для того, чтобы прогнозировать основные тона стертого кадра с использованием вышеуказанного подхода на основе экстраполяции.

Далее рассмотрим повторную синхронизацию импульсов в предшествующем уровне техники, в частности, в отношении G.718 и G.729.1. Подход для повторной синхронизации импульсов описывается в [VJGS12].

Сначала описывается составление периодической части возбуждения.

Для маскирования стертых кадров после корректно принимаемого кадра, отличного от невокализованного, периодическая часть возбуждения составляется посредством повторения фильтрованного по нижним частотам последнего периода основного тона предыдущего кадра.

Составление периодической части выполняется с использованием простой копии фильтрованного по нижним частотам сегмента сигнала возбуждения из конца предыдущего кадра.

Длина периода основного тона округляется до ближайшего целого числа:

С учетом того, что длина последнего периода основного тона составляет T_p, то длина сегмента, который копируется, T_r, например, может задаваться согласно следующему:

Периодическая часть составляется для одного кадра и одного дополнительного субкадра.

Например, для M субкадров в кадре, длина субкадра составляет ,

где L является длиной кадра, также обозначаемой как L_frame: L=L_frame.

Фиг. 3 иллюстрирует составленную периодическую часть речевого сигнала.

T[0] является местоположением первого максимального импульса в составленной периодической части возбуждения. Позиции других импульсов задаются следующим образом:

согласно следующему:

После составления периодической части возбуждения, повторная синхронизация гортанных импульсов выполняется для того, чтобы корректировать разность между оцененной целевой позицией (P) последнего импульса в потерянном кадре и его фактической позицией (T[k]) в составленной периодической части возбуждения.

Постепенное изменение запаздывания основного тона экстраполировано на основе запаздываний основного тона последних семи субкадров перед потерянным кадром. Постепенно изменяющиеся запаздывания основного тона в каждом субкадре следующие:

где:

и T_ext (также обозначается как d_ext) является экстраполированным основным тоном, как описано выше для d_ext.

Разность, обозначаемая как d, между суммой общего числа (T_c) выборок в пределах циклов основного тона с постоянным основным тоном и суммой общего числа p[i] выборок в пределах циклов основного тона с постепенно изменяющимся основным тоном, находится в длине кадра. В документации отсутствует описание касательно того, как находить d.

В исходном коде G.718 (см. [ITU08a]), d находится с использованием следующего алгоритма (где M является числом субкадров в кадре):

Число импульсов в составленной периодической части в длине кадра плюс первый импульс в будущем кадре составляет N. В документации отсутствует описание касательно того, как находить N.

В исходном коде G.718 (см. [ITU08a]), N находится согласно следующему:

Позиция T[n] последнего импульса в составленной периодической части возбуждения, которая принадлежит потерянному кадру, определяется следующим образом:

Оцененная позиция P последнего импульса следующая:

Фактическая позиция T[k] для позиции последнего импульса представляет собой позицию импульса в составленной периодической части возбуждения (в том числе в поиске первого импульса после текущего кадра), ближайшую к оцененной целевой позиции P:

Повторная синхронизация гортанных импульсов проводится посредством добавления или удаления выборок в областях минимальной энергии полных циклов основного тона. Число выборок, которые должны быть добавлены или удалены, определяется посредством разности:

Области минимальной энергии определяются с использованием скользящего окна в 5 выборок. Позиция минимальной энергии задается в середине окна, в котором энергия является минимальной. Поиск выполняется между двумя импульсами основного тона от T[i]+T_c/8 до T[i+1]-T_c/4. Имеется N_min=n-1 областей минимальной энергии.

Если N_min=1, то имеется только одна область минимальной энергии, и dif f выборок вставляются или удаляются в этой позиции.

Для N_min>1, меньшее число выборок добавляется или удаляется в начале и большее - к концу кадра. Число выборок, которые должны быть удалены или добавлены, между импульсами T[i] и T[i+1], находится с использованием следующего рекурсивного отношения:

Если R[i]<R[i-1], то значения R[i] и R[i-1] меняются местами.

Цель настоящего изобретения заключается в том, чтобы предоставлять усовершенствованные принципы для обработки аудиосигналов, в частности, предоставлять усовершенствованные принципы для обработки речи, а более конкретно, предоставлять улучшенные принципы маскирования.

Цель настоящего изобретения достигается посредством устройства по п. 1, посредством способа по п. 15 и посредством компьютерной программы по п. 16.

Предусмотрено устройство для определения оцененного запаздывания основного тона. Устройство содержит входной интерфейс для приема множества исходных значений запаздывания основного тона и модуль оценки запаздывания основного тона для оценки оцененного запаздывания основного тона. Модуль оценки запаздывания основного тона выполнен с возможностью оценивать оцененное запаздывание основного тона в зависимости от множества исходных значений запаздывания основного тона и в зависимости от множества информационных значений, при этом для каждого исходного значения запаздывания основного тона из множества исходных значений запаздывания основного тона, информационное значение из множества информационных значений назначается упомянутому исходному значению запаздывания основного тона.

Согласно варианту осуществления, модуль оценки запаздывания основного тона, например, может быть выполнен с возможностью оценивать оцененное запаздывание основного тона в зависимости от множества исходных значений запаздывания основного тона и в зависимости от множества значений усиления основного тона в качестве множества информационных значений, при этом для каждого исходного значения запаздывания основного тона из множества исходных значений запаздывания основного тона, значение усиления основного тона из множества значений усиления основного тона назначается упомянутому исходному значению запаздывания основного тона.

В конкретном варианте осуществления, каждое из множества значений усиления основного тона, например, может представлять собой усиление адаптивной таблицы кодирования.

В варианте осуществления, модуль оценки запаздывания основного тона, например, может быть выполнен с возможностью оценивать оцененное запаздывание основного тона посредством минимизации функции ошибок.

где a является действительным числом, где b является действительным числом, где k является целым числом с k≥2, и где P(i) является i-ым исходным значением запаздывания основного тона, где g_p(i) является i-ым значением усиления основного тона, назначаемым i-ому значению P(i) запаздывания основного тона.

где a является действительным числом, где b является действительным числом, где P(i) является i-ым исходным значением запаздывания основного тона, где g_p(i) является i-ым значением усиления основного тона, назначаемым i-ому значению P(i) запаздывания основного тона.

Согласно варианту осуществления, модуль оценки запаздывания основного тона, например, может быть выполнен с возможностью определять оцененное запаздывание p основного тона согласно p=a*i+b.

В варианте осуществления, модуль оценки запаздывания основного тона, например, может быть выполнен с возможностью оценивать оцененное запаздывание основного тона в зависимости от множества исходных значений запаздывания основного тона и в зависимости от множества значений времени в качестве множества информационных значений, при этом для каждого исходного значения запаздывания основного тона из множества исходных значений запаздывания основного тона, значение времени из множества значений времени назначается упомянутому исходному значению запаздывания основного тона.

где a является действительным числом, где b является действительным числом, где k является целым числом с k≥2, и где P(i) является i-ым исходным значением запаздывания основного тона, где time_passed(i) является i-ым значением времени, назначаемым i-ому значению P(i) запаздывания основного тона.

где a является действительным числом, где b является действительным числом, где P(i) является i-ым исходным значением запаздывания основного тона, где time_passed(i) является i-ым значением времени, назначаемым i-ому значению P(i) запаздывания основного тона.

В варианте осуществления, модуль оценки запаздывания основного тона выполнен с возможностью определять оцененное запаздывание p основного тона согласно p=a*i+b.

Кроме того, предусмотрен способ для определения оцененного запаздывания основного тона. Способ содержит:

- прием множества исходных значений запаздывания основного тона; и

- оценку оцененного запаздывания основного тона.

Оценка оцененного запаздывания основного тона проводится в зависимости от множества исходных значений запаздывания основного тона и в зависимости от множества информационных значений, при этом для каждого исходного значения запаздывания основного тона из множества исходных значений запаздывания основного тона, информационное значение из множества информационных значений назначается упомянутому исходному значению запаздывания основного тона.

Кроме того, предусмотрена компьютерная программа для реализации вышеописанного способа при выполнении на компьютере или в процессоре сигналов.

Кроме того, предусмотрено устройство для восстановления кадра, содержащего речевой сигнал в качестве восстановленного кадра, причем восстановленный кадр ассоциирован с одним или более доступных кадров, причем упомянутые один или более доступных кадров представляют собой, по меньшей мере, один из одного или более предшествующих кадров восстановленного кадра и одного или более последующих кадров восстановленного кадра, при этом один или более доступных кадров содержат один или более циклов основного тона в качестве одного или более доступных циклов основного тона. Устройство содержит модуль определения для определения разности числа выборок, указывающей разность между числом выборок одного из одного или более доступных циклов основного тона и числом выборок первого цикла основного тона, который должен быть восстановлен. Кроме того, устройство содержит модуль восстановления кадров для восстановления восстановленного кадра посредством восстановления, в зависимости от разности числа выборок и в зависимости от выборок упомянутого одного из одного или более доступных циклов основного тона, первого цикла основного тона, который должен быть восстановлен в качестве первого восстановленного цикла основного тона. Модуль восстановления кадров выполнен с возможностью восстанавливать восстановленный кадр таким образом, что восстановленный кадр полностью или частично содержит первый восстановленный цикл основного тона, таким образом, что восстановленный кадр полностью или частично содержит второй восстановленный цикл основного тона, и таким образом, что число выборок первого восстановленного цикла основного тона отличается от числа выборок второго восстановленного цикла основного тона.

Согласно варианту осуществления, модуль определения, например, может быть выполнен с возможностью определять разность числа выборок для каждого из множества циклов основного тона, которые должны быть восстановлены, таким образом, что разность числа выборок каждого из циклов основного тона указывает разность между числом выборок упомянутого одного из или более доступных циклов основного тона и числом выборок упомянутого цикла основного тона, который должен быть восстановлен. Модуль восстановления кадров, например, может быть выполнен с возможностью восстанавливать каждый цикл основного тона из множества циклов основного тона, которые должны быть восстановлены, в зависимости от разности числа выборок упомянутого цикла основного тона, который должен быть восстановлен, и в зависимости от выборок упомянутого одного из одного или более доступных циклов основного тона, для того чтобы восстанавливать восстановленный кадр.

Согласно варианту осуществления, модуль определения, например, может быть выполнен с возможностью определять разностное значение (d; s) кадра, указывающее то, сколько выборок должно удаляться из промежуточного кадра или сколько выборок должно добавляться в промежуточный кадр. Кроме того, модуль восстановления кадров, например, может быть выполнен с возможностью удалять первые выборки из промежуточного кадра, с тем чтобы получать восстановленный кадр, когда разностное значение кадра указывает то, что первые выборки должны удаляться из кадра. Кроме того, модуль восстановления кадров, например, может быть выполнен с возможностью добавлять вторые выборки в промежуточный кадр, с тем чтобы получать восстановленный кадр, когда разностное значение (d; s) кадра указывает то, что вторые выборки должны добавляться в кадр.

В варианте осуществления, модуль восстановления кадров, например, может быть выполнен с возможностью удалять первые выборки из промежуточного кадра, когда разностное значение кадра указывает то, что первые выборки должны удаляться из кадра таким образом, что число первых выборок, которые удаляются из промежуточного кадра, указывается посредством разностного значения кадра. Кроме того, модуль восстановления кадров, например, может быть выполнен с возможностью добавлять вторые выборки в промежуточный кадр, когда разностное значение кадра указывает то, что вторые выборки должны добавляться в кадр таким образом, что число вторых выборок, которые добавляются в промежуточный кадр, указывается посредством разностного значения кадра.

Согласно варианту осуществления, модуль определения, например, может быть выполнен с возможностью определять разностное число s кадра таким образом, что формула:

является справедливой, где L указывает число выборок восстановленного кадра, где M указывает число субкадров восстановленного кадра, где T_r указывает округленную длину периода основного тона упомянутого одного из одного или более доступных циклов основного тона, и где P[i] указывает длину периода основного тона восстановленного цикла основного тона i-ого субкадра восстановленного кадра.

В варианте осуществления, модуль восстановления кадров, например, может быть выполнен с возможностью формировать промежуточный кадр в зависимости от упомянутого одного из одного или более доступных циклов основного тона. Кроме того, модуль восстановления кадров, например, может быть выполнен с возможностью формировать промежуточный кадр таким образом, что промежуточный кадр содержит первый частичный промежуточный цикл основного тона, один или более дополнительных промежуточных циклов основного тона и второй частичный промежуточный цикл основного тона. Кроме того, первый частичный промежуточный цикл основного тона, например, может зависеть от одной или более выборок упомянутого одного из одного или более доступных циклов основного тона, при этом каждый из одного или более дополнительных промежуточных циклов основного тона зависит от всех выборок упомянутого одного из одного или более доступных циклов основного тона, при этом второй частичный промежуточный цикл основного тона зависит от одной или более выборок упомянутого одного из одного или более доступных циклов основного тона. Кроме того, модуль определения, например, может быть выполнен с возможностью определять разностное число начальной части, указывающее то, сколько выборок должно удаляться или добавляться из первого частичного промежуточного цикла основного тона, при этом модуль восстановления кадров выполнен с возможностью удалять одну или более первых выборок из первого частичного промежуточного цикла основного тона или выполнен с возможностью добавлять одну или более первых выборок в первый частичный промежуточный цикл основного тона в зависимости от разностного числа начальной части. Кроме того, модуль определения, например, может быть выполнен с возможностью определять, для каждого из дополнительных промежуточных циклов основного тона, разностное число цикла основного тона, указывающее то, сколько выборок должно удаляться или добавляться из упомянутого одного из дополнительных промежуточных циклов основного тона. Кроме того, модуль восстановления кадров, например, может быть выполнен с возможностью удалять одну или более вторых выборок из упомянутого одного из дополнительных промежуточных циклов основного тона или выполнен с возможностью добавлять одну или более вторых выборок в упомянутый один из дополнительных промежуточных циклов основного тона в зависимости от упомянутого разностного числа цикла основного тона. Кроме того, модуль определения, например, может быть выполнен с возможностью определять разностное число конечной части, указывающее то, сколько выборок должно удаляться или добавляться из второго частичного промежуточного цикла основного тона, при этом модуль восстановления кадров выполнен с возможностью удалять одну или более третьих выборок из второго частичного промежуточного цикла основного тона или выполнен с возможностью добавлять одну или более третьих выборок во второй частичный промежуточный цикл основного тона в зависимости от разностного числа конечной части.

Согласно варианту осуществления, модуль восстановления кадров, например, может быть выполнен с возможностью формировать промежуточный кадр в зависимости от упомянутого одного из одного или более доступных циклов основного тона. Кроме того, модуль определения, например, может быть выполнен с возможностью определять одну или более низкоэнергетических частей сигнала для речевого сигнала, состоящего из промежуточного кадра, при этом каждая из одной или более низкоэнергетических частей сигнала является первой частью сигнала для речевого сигнала в промежуточном кадре, причем энергия речевого сигнала ниже во второй части сигнала для речевого сигнала, состоящего из промежуточного кадра. Кроме того, модуль восстановления кадров, например, может быть выполнен с возможностью удалять одну или более выборок, по меньшей мере, из одной из одной или более низкоэнергетических частей сигнала для речевого сигнала или добавлять одну или более выборок, по меньшей мере, в одну из одной или более низкоэнергетических частей сигнала для речевого сигнала, с тем чтобы получать восстановленный кадр.

В конкретном варианте осуществления, модуль восстановления кадров, например, может быть выполнен с возможностью формировать промежуточный кадр таким образом, что промежуточный

Патент 2665253