Способ обработки речевого/звукового сигнала и устройство
Иллюстрации
Показать всеИзобретение относится к технике связи. Технический результат – улучшение акустического качества сигнала, полученного после восстановления шумовой составляющей. Данный способ включает в себя этапы, на которых: принимают битовый поток и декодируют битовый поток, чтобы получить речевой/звуковой сигнал; определяют первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяют символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяют длину адаптивной нормализации; определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения и определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. 2 н. и 20 з.п. ф-лы, 7 ил.
Реферат
[0001] Настоящее изобретение имеет отношение к области связи, и в частности, к способу для обработки речевого/звукового сигнала, и устройству.
УРОВЕНЬ ТЕХНИКИ
[0002] В настоящее время, для достижения лучшего акустического качества, при декодировании закодированной информации речевого/звукового сигнала, электронное устройство восстанавливает шумовую составляющую речевого/звукового сигнала, полученного посредством декодирования.
[0003] В настоящее время, электронное устройство восстанавливает шумовую составляющую речевого/звукового сигнала, как правило, путем добавления случайного шумового сигнала в речевой/звуковой сигнал. Конкретнее, выполняется взвешенное сложение на речевом/звуковом сигнале и случайном шумовом сигнале, чтобы получить сигнал после восстановления шумовой составляющей речевого/звукового сигнала. Речевой/звуковой сигнал может быть сигналом во временной области, сигналом в частотной области или сигналом возбуждения, или может быть низкочастотным сигналом, высокочастотным сигналом, или тому подобным.
[0004] Однако, было установлено, что если речевой/звуковой сигнал является сигналом, имеющим момент возникновения или сдвиг, этот способ для восстановления шумовой составляющей речевого/звукового сигнала в результате приводит к тому, что сигнал, полученный после восстановления шумовой составляющей речевого/звукового сигнала, имеет эхо-сигнал, что влияет на акустическое качество сигнала, полученного после восстановления шумовой составляющей.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
[0005] Варианты осуществления настоящего изобретения предоставляют способ для обработки речевого/звукового сигнала, и устройство, такие, что для речевого/звукового сигнала, имеющего момент возникновения или сдвиг, когда восстанавливается шумовая составляющая речевого/звукового сигнала, сигнал, полученный после восстановления шумовой составляющей речевого/звукового сигнала, не имеет эхо-сигнала, тем самым улучшая акустическое качество сигнала, полученного после восстановления шумовой составляющей.
[0006] В соответствии с первым аспектом, один из вариантов осуществления настоящего изобретения предоставляет способ для обработки речевого/звукового сигнала, причем способ включает в себя этапы, на которых:
принимают битовый поток, и декодируют этот битовый поток, чтобы получить речевой/звуковой сигнал;
определяют первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале;
определяют символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале;
определяют длину адаптивной нормализации;
определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и
определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.
[0007] С учетом первого аспекта, в первой возможной форме реализации первого аспекта этап, на котором определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения, включает в себя этапы, на которых:
вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, и определяют, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значение возмущения амплитуды, соответствующее каждому выборочному значению; и
вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.
[0008] С учетом первой возможной формы реализации первого аспекта, во второй возможной форме реализации первого аспекта этап, на котором вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, включает в себя этапы, на которых:
определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение; и
вычисляют среднее значение значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и используют среднее значение, полученное посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.
[0009] С учетом второй возможной формы реализации первого аспекта, в третьей возможной форме реализации первого аспекта этап, на котором, определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение, включает в себя этапы, на которых:
выполняют группировку поддиапазонов на всех выборочных значениях в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и, для каждого выборочного значения, определяют поддиапазон, включающий в себя выборочное значение, как поддиапазон, которому принадлежит выборочное значение; или
для каждого выборочного значения, определяют поддиапазон, вмещающий m выборочных значений перед выборочным значением, выборочное значение и n выборочных значений после выборочного значения, как поддиапазон, которому принадлежит выборочное значение, где m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0, и n является целым числом не меньше 0.
[0010] С учетом первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, в четвертой возможной форме реализации первого аспекта этап, на котором вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению, включает в себя этапы, на которых:
вычитают значение возмущения амплитуды, соответствующее каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и используют полученную разность в качестве скорректированного значения амплитуды каждого выборочного значения.
[0011] С учетом первого аспекта, и/или первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, и/или четвертой возможной формы реализации первого аспекта, в пятой возможной форме реализации первого аспекта этап, на котором определяют длину адаптивной нормализации, включает в себя этапы, на которых:
разделяют сигнал низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;
вычисляют отношение пиковой и средней мощностей каждого поддиапазона и определяют количество поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и
вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.
[0012] С учетом пятой возможной формы реализации первого аспекта, в шестой возможной форме реализации первого аспекта этап, на котором вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов, включает в себя этап, на котором:
вычисляют длину адаптивной нормализации по формуле L=K+α×M, где
L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и α является константой меньше 1.
[0013] С учетом первого аспекта, и/или первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, и/или четвертой возможной формы реализации первого аспекта, в седьмой возможной форме реализации первого аспекта этап, на котором определяют длину адаптивной нормализации, включает в себя этапы, на которых:
вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное второе значение длины, при этом первое значение длины больше, чем второе значение длины; или
вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное второе значение длины; или
определяют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, при этом разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным длинам адаптивной нормализации.
[0014] С учетом первого аспекта, и/или первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, и/или четвертой возможной формы реализации первого аспекта, и/или пятой возможной формы реализации первого аспекта, и/или шестой возможной формы реализации первого аспекта, и/или седьмой возможной формы реализации первого аспекта, в восьмой возможной форме реализации первого аспекта этап, на котором определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, включает в себя этапы, на которых:
определяют новое значение каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал; или
вычисляют коэффициент модификации; выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определяют новое значение каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.
[0015] С учетом восьмой возможной формы реализации первого аспекта, в девятой возможной форме реализации первого аспекта этап, на котором вычисляют коэффициент модификации, включает в себя этап, на котором:
вычисляют коэффициент модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.
[0016] С учетом восьмой возможной формы реализации первого аспекта и/или девятой возможной формы реализации первого аспекта, в десятой возможной форме реализации первого аспекта этап, на котором выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации, включает в себя этап, на котором:
выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:
Y=y×(b-β);
где Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.
[0017] В соответствии со вторым аспектом, вариант осуществления настоящего изобретения предоставляет устройство для восстановления шумовой составляющей речевого/звукового сигнала, включающее в себя:
блок обработки битового потока, выполненный с возможностью приема битового потока и декодирования битового потока, чтобы получить речевой/звуковой сигнал;
блок определения сигнала, выполненный с возможностью определения первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, полученным блоком обработки битового потока, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале, полученном посредством декодирования;
первый блок определения, выполненный с возможностью определения символа каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком определения сигнала, и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком определения сигнала;
второй блок определения, выполненный с возможностью определения длины адаптивной нормализации;
третий блок определения, выполненный с возможностью определения скорректированного значения амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации, определенной вторым блоком определения, и значением амплитуды каждого выборочного значения, которое определяется первым блоком определения; и
четвертый блок определения, выполненный с возможностью определения второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения, который определяется первым блоком определения, и скорректированным значением амплитуды каждого выборочного значения, которое определяется третьим блоком определения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.
[0018] С учетом второго аспекта, в первой возможной форме реализации второго аспекта третий блок определения включает в себя:
подблок определения, выполненный с возможностью вычисления, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднего значения амплитуды, соответствующего каждому выборочному значению, и определения, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значения возмущения амплитуды, соответствующего каждому выборочному значению; и
блок вычисления скорректированного значения амплитуды, выполненный с возможностью вычисления скорректированного значения амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.
[0019] С учетом первой возможной формы реализации второго аспекта, во второй возможной форме реализации второго аспекта подблок определения включает в себя:
модуль определения, выполненный с возможностью определения, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазона, которому принадлежит выборочное значение; и
модуль вычисления, выполненный с возможностью вычисления среднего значения значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и использования среднего значения, полученного посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.
[0020] С учетом второй возможной формы реализации второго аспекта, в третьей возможной форме реализации второго аспекта модуль определения выполняется с особой возможностью:
выполнения группировки поддиапазонов на всех выборочных значениях в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и, для каждого выборочного значения, определения поддиапазона, включающего в себя выборочное значение, как поддиапазона, которому принадлежит выборочное значение; или
для каждого выборочного значения, определения поддиапазона, вмещающего m выборочных значений перед выборочным значением, выборочное значение и n выборочных значений после выборочного значения, как поддиапазона, которому принадлежит выборочное значение, где m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0, и n является целым числом не меньше 0.
[0021] С учетом первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта, в четвертой возможной форме реализации второго аспекта подблок вычисления скорректированного значения амплитуды выполняется с особой возможностью:
вычитания значения возмущения амплитуды, соответствующего каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и использования полученной разности в качестве скорректированного значения амплитуды каждого выборочного значения.
[0022] С учетом второго аспекта, и/или первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта и/или четвертой возможной формы реализации второго аспекта, в пятой возможной форме реализации второго аспекта второй блок определения включает в себя:
подблок разделения, выполненный с возможностью разделения сигнала низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;
подблок количественного определения, выполненный с возможностью вычисления отношения пиковой и средней мощностей каждого поддиапазона, и определения количества поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и
подблок вычисления длины, выполненный с возможностью вычисления длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.
[0023] С учетом пятой возможной формы реализации второго аспекта, в шестой возможной форме реализации второго аспекта подблок вычисления длины выполняется с особой возможностью:
вычисления длины адаптивной нормализации по формуле L=K+α×M, где
L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и α является константой меньше 1.
[0024] С учетом второго аспекта, и/или первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта, и/или четвертой возможной формы реализации второго аспекта, в седьмой возможной форме реализации второго аспекта второй блок выполняется с особой возможностью:
вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного второго значения длины, при этом первое значение длины больше, чем второе значение длины; или
вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного второго значения длины; или
определения длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, при этом разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным длинам адаптивной нормализации.
[0025] С учетом второго аспекта, и/или первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта, и/или четвертой возможной формы реализации второго аспекта, и/или пятой возможной формы реализации второго аспекта, и/или шестой возможной формы реализации второго аспекта, и/или седьмой возможной формы реализации второго аспекта, в восьмой возможной форме реализации второго аспекта четвертый блок определения выполняется с особой возможностью:
определения нового значения каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал; или
вычисления коэффициента модификации; выполнения модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определения нового значения каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.
[0026] С учетом восьмой возможной формы реализации второго аспекта, в девятой возможной форме реализации второго аспекта четвертый блок определения выполняется с особой возможностью вычисления коэффициента модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.
[0027] С учетом восьмой возможной формы реализации второго аспекта и/или девятой возможной формы реализации второго аспекта, в десятой возможной форме реализации второго аспекта четвертый блок определения выполняется с особой возможностью:
выполнения модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:
Y=y×(b-β);
где Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.
[0028] В этих вариантах осуществления принимается битовый поток, и декодируется битовый поток, чтобы получить речевой/звуковой сигнал; определяется первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяются символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяется длина адаптивной нормализации; определяется скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определяется второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. В этом технологическом процессе, обрабатывается только исходный сигнал, а именно, первый речевой/звуковой сигнал, и никакой новый сигнал не добавляется к первому речевому/звуковому сигналу, так что никакая новая энергия не добавляется ко второму речевому/звуковому сигналу, полученному после восстановления шумовой составляющей. Следовательно, если первый речевой/звуковой сигнал имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала.
[0029] Следует понимать, что, приведенное выше общее описание и последующие подробное описание являются лишь иллюстративными, и не предполагают ограничения объема охраны настоящего изобретения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0030] Для более наглядного описания технических решений в вариантах осуществления настоящего изобретения, нижеследующее кратко представляет прилагаемые чертежи, необходимые для описания вариантов осуществления. Очевидно, что прилагаемые чертежи в последующем описании демонстрируют лишь некоторые варианты осуществления настоящего изобретения, и средний специалист в данной области техники может произвести еще и другие чертежи на основании этих прилагаемых чертежей без творческих усилий.
[0031] Фиг. 1 является упрощенной блок-схемой последовательности операций способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения;
[0032] Фиг. 1A является упрощенной схемой примера группировки выборочных значений в соответствии с одним из вариантов осуществления настоящего изобретения;
[0033] Фиг. 1B является другой упрощенной схемой примера группировки выборочных значений в соответствии с одним из вариантов осуществления настоящего изобретения;
[0034] Фиг. 2 является упрощенной блок-схемой последовательности операций другого способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения;
[0035] Фиг. 3 является упрощенной блок-схемой последовательности операций другого способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения;
[0036] Фиг. 4 является упрощенной структурной схемой устройства для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения; и
[0037] Фиг. 5 является упрощенной структурной схемой электронного устройства в соответствии с одним из вариантов осуществления настоящего изобретения.
[0038] Вышеуказанные прилагаемые чертежи демонстрируют конкретные варианты осуществления настоящего изобретения, и ниже приводится более подробное описание. Прилагаемые чертежи и текстовое описание не предназначены для ограничения объема замысла настоящего изобретения каким-либо образом, а предназначены для описания идеи настоящего изобретения для специалиста в данной области техники со ссылкой на конкретные варианты осуществления.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
[0039] Ниже ясно описываются технические решения в вариантах осуществления настоящего изобретения со ссылкой на прилагаемые чертежи в вариантах осуществления настоящего изобретения. Очевидно, что описываемые варианты осуществления являются всего лишь частью, а не всеми вариантами осуществления настоящего изобретения. Все другие варианты осуществления, полученные средним специалистом в данной области техники на основе вариантов осуществления настоящего изобретения без творческих усилий, должны попадать в объем охраны настоящего изобретения.
[0040] В последующем подробном описании упоминаются многочисленные конкретные детали, чтобы обеспечить полное понимание настоящего изобретения. Тем не менее, специалист в данной области техники должен понимать, что настоящее изобретение может быть реализовано без этих конкретных деталей. В других вариантах осуществления способ, технологический процесс, компонент, а также схемы, которые являются общеизвестными, не описываются подробно, чтобы излишне не затруднять понимание этих вариантов осуществления.
[0041] Обратимся к Фиг. 1, Фиг. 1 является блок-схемой последовательности операций способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения. Способ включает в себя:
[0042] Этап 101: Прием битового потока, и декодирование битового потока, чтобы получить речевой/звуковой сигнал.
[0043] Подробности того, как декодировать битовый поток, чтобы получить речевой/звуковой сигнал, не описываются в данном документе.
[0044] Этап 102: Определение первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале, полученном посредством декодирования.
[0045] Первый речевой/звуковой сигнал может быть сигналом низкочастотного диапазона, сигналом высокочастотного диапазона, сигналом полного диапазона, или тому подобным, в речевом/звуковом сигнале, полученном посредством декодирования.
[0046] Речевой/звуковой сигнал, полученный посредством декодирования, может включать в себя сигнал низкочастотного диапазона и сигнал высокочастотного диапазона, или может включать в себя сигнал полного диапазона.
[0047] Этап 103: Определение символа каждого выборочного значения в первом речевом/звуковом сигнале и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале.
[0048] Когда первый речевой/звуковой сигнала имеет разные формы реализации, формы реализации выборочного значения тоже могут быть разными. Например, если первый речевой/звуковой сигнал является сигналом в частотной области, выборочное значение может быть спектральным коэффициентом; если речевой/звуковой сигнал является сигналом во временной области, выборочное значение может быть значением момента дискретизации.
[0049] Этап 104: Определение длины адаптивной нормализации.
[0050] Длина адаптивной нормализации может быть определена в соответствии со связанным параметром сигнала низкочастотного диапазона и/или сигнала высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования. Конкретнее, связанный параметр может включать в себя тип сигнала, отношение пиковой и средней мощностей, и тому подобное. Например, в одной из возможных форм реализации, этап, на котором определяют длину адаптивной нормализации, может включать в себя этапы, на которых:
разделяют сигнал низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;
вычисляют отношение пиковой и средней мощностей каждого поддиапазона, и определяют количество поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и
вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.
[0051] В некоторых случаях этап, на котором вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов, может включать в себя этап, на котором:
вычисляют длину адаптивной нормализации по формуле L=K+α×M, где
L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и α является константой меньше 1.
[0052] В другой возможной форме реализации длина адаптивной нормализации может быть вычислена в соответствии с типом сигнала для сигнала низкочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов. Что касается конкретной формулы вычисления, обратимся к формуле L=K+α×M. Различие заключается только в том, что в этом случае K является численным значением, соответствующим типу сигнала для сигнала низкочастотного