2667380 - Способ и устройство кодирования аудио

Способ и устройство кодирования аудио

Иллюстрации

Показать все

Изобретение относится к области технологий обработки сигналов и предназначено для кодирования аудиосигналов. Технический результат – уменьшение сложности кодирования и повышение точности кодирования. Способ включает в себя: определение разреженности распределения, по спектрам, энергии N входных аудиокадров, где N аудиокадров включают в себя текущий аудиокадр и N представляет собой положительное целое число; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый или второй способ кодирования для кодирования текущего аудиокадра, где первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания. 2 н. и 28 з.п. ф-лы, 3 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0001] Варианты осуществления настоящего изобретения относятся к области технологий обработки сигналов и, более конкретно, к способу и устройству кодирования аудио.

УРОВЕНЬ ТЕХНИКИ

[0002] В известном уровне техники обычно используется гибридный кодер для кодирования аудиосигнала в системах передачи речи. Конкретно, гибридный кодер обычно включает в себя два подкодера. Один подкодер подходит для кодирования речевого сигнала, и другой кодер подходит для кодирования неречевого сигнала. Для принимаемого аудиосигнала каждый подкодер гибридного кодера кодирует аудиосигнал. Гибридный кодер непосредственно сравнивает качество кодированных аудиосигналов для выбора оптимального подкодера. Однако такой способ кодирования с обратной связью имеет высокую сложность эксплуатации.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0003] Варианты осуществления настоящего изобретения обеспечивают способ и устройство кодирования аудио, которые могут уменьшить сложность кодирования и гарантировать, что кодирование выполняется с относительно высокой точностью.

[0004] Согласно первому аспекту, обеспечивается способ кодирования аудио, в котором способ включает в себя: определение разреженности распределения, по спектрам, энергии N входных аудиокадров, где N аудиокадров включает в себя текущий аудиокадр, и N представляет собой положительное целое число; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, где первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования, и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания.

[0005] С ссылкой на первый аспект, в первом возможном методе реализации первого аспекта, определение разреженности распределения, по спектрам, энергии N входных аудиокадров включает в себя: деление спектра каждого из N аудиокадров на P огибающих спектра, где P представляет собой положительное целое число; и определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.

[0006] С ссылкой на первый возможный метод реализации первого аспекта, во втором возможном методе реализации первого аспекта, параметр общей разреженности включает в себя первую минимальную ширину полосы; определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда первая минимальная ширина полосы меньше первого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда первая минимальная ширина полосы больше первого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.

[0007] С ссылкой на второй возможный метод реализации первого аспекта, в третьем возможном методе реализации первого аспекта, определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: сортировку энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров.

[0008] С ссылкой на первый возможный метод реализации первого аспекта, в четвертом возможном методе реализации первого аспекта, параметр общей разреженности включает в себя первую пропорцию энергии; определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: выбор P₁ огибающих спектра из P огибающих спектра каждого из N аудиокадров; и определение первой пропорции энергии в соответствии с энергией P₁ огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P₁ представляет собой положительное целое число меньше P; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда первая пропорция энергии больше второго заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда первая пропорция энергии меньше второго заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.

[0009] С ссылкой на четвертый возможный метод реализации первого аспекта, в пятом возможном методе реализации первого аспекта, энергия любой одной из P₁ огибающих спектра больше энергии любой одной из других огибающих спектра в P огибающих спектра, за исключением P₁ огибающих спектра.

[0010] С ссылкой на первый возможный метод реализации первого аспекта, в шестом возможном методе реализации первого аспекта, параметр общей разреженности включает в себя вторую минимальную ширину полосы и третью минимальную ширину полосы; определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы, и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра включает в себя: когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда третья минимальная ширина полосы больше шестого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра, где четвертое заранее заданное значение больше или равно третьему заранее заданному значению, пятое заранее заданное значение меньше четвертого заранее заданного значения, и шестое заранее заданное значение больше четвертого заранее заданного значения.

[0011] С ссылкой на шестой возможный метод реализации первого аспекта, в седьмом возможном методе реализации первого аспекта, определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: сортировку энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров; определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров; определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров.

[0012] С ссылкой на первый возможный метод реализации первого аспекта, в восьмом возможном методе реализации первого аспекта, параметр общей разреженности включает в себя вторую пропорцию энергии и третью пропорцию энергии; определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: выбор P₂ огибающих спектра из P огибающих спектра каждого из N аудиокадров; определение второй пропорции энергии в соответствии с энергией P₂ огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров; выбор P₃ огибающих спектра из P огибающих спектра каждого из N аудиокадров; и определение третьей пропорции энергии в соответствии с энергией P₃ огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P₂ и P₃ представляют собой положительные целые числа меньше P, и P₂ меньше P₃; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; когда вторая пропорция энергии больше девятого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда третья пропорция энергии меньше десятого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.

[0013] С ссылкой на восьмой возможный метод реализации первого аспекта, в девятом возможном методе реализации первого аспекта, P₂ огибающих спектра представляют собой P₂ огибающих спектра, имеющих максимальную энергию в P огибающих спектра; и P₃ огибающих спектра представляют собой P₃ огибающих спектра, имеющих максимальную энергию в P огибающих спектра.

[0014] С ссылкой на первый аспект, в десятом возможном методе реализации первого аспекта, разреженность распределения энергии по спектрам включает в себя глобальную разреженность, локальную разреженность и кратковременный всплеск распределения энергии по спектрам.

[0015] С ссылкой на десятый возможный метод реализации первого аспекта, в одиннадцатом возможном методе реализации первого аспекта, N равно 1, и N аудиокадров представляют собой текущий аудиокадр; и определение разреженности распределения, по спектрам, энергии N входных аудиокадров включает в себя: деление спектра текущего аудиокадра на Q подполос; и определение параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, где параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра.

[0016] С ссылкой на одиннадцатый возможный метод реализации первого аспекта, в двенадцатом возможном методе реализации первого аспекта, параметр разреженности всплесков включает в себя: глобальную пропорцию пиковой энергии к средней каждой из Q подполос, локальную пропорцию пиковой энергии к средней каждой из Q подполос и кратковременное отклонение энергии каждой из Q подполос, где глобальная пропорция пиковой энергии к средней определяется в соответствии с пиковой энергией в подполосе и средней энергией во всех подполосах текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется в соответствии с пиковой энергией и подполосе и средней энергией в подполосе, и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: определение, имеется ли первая подполоса в Q подполосах, где локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения, и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и, когда имеется первая подполоса в Q подполосах, определение использования первого способа кодирования для кодирования текущего аудиокадра.

[0017] С ссылкой на первый аспект, в тринадцатом возможном методе реализации первого аспекта, разреженность распределения энергии по спектрам включает в себя ограниченные полосой характеристики распределения энергии по спектрам.

[0018] С ссылкой на тринадцатый возможный метод реализации первого аспекта, в четырнадцатом возможном методе реализации первого аспекта, определение разреженности распределения, по спектрам, энергии N входных аудиокадров включает в себя: определение разграничительной частоты каждого из N аудиокадров; и определение параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров.

[0019] С ссылкой на четырнадцатый возможный метод реализации первого аспекта, в пятнадцатом возможном методе реализации первого аспекта, параметр ограниченной полосой разреженности представляет собой среднее значение разграничительных частот N аудиокадров; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра.

[0020] Согласно второму аспекту, вариант осуществления настоящего изобретения обеспечивает устройство, где устройство включает в себя: блок получения, выполненный с возможностью получения N аудиокадров, где N аудиокадров включает в себя текущий аудиокадр, и N представляет собой положительное целое число; и блок определения, выполненный с возможностью определения разреженности распределения, по спектрам, энергии N аудиокадров, полученных блоком получения; и блок определения дополнительно выполнен с возможностью определения, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, где первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования, и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания.

[0021] С ссылкой на второй аспект, в первом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью деления спектра каждого из N аудиокадров на P огибающих спектра, и определения параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где P представляет собой положительное целое число, и параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.

[0022] С ссылкой на первый возможный метод реализации второго аспекта, во втором возможном методе реализации второго аспекта, параметр общей разреженности включает в себя первую минимальную ширину полосы; блок определения конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы; и блок определения конкретно выполнен с возможностью: когда первая минимальная ширина полосы меньше первого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая минимальная ширина полосы больше первого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

[0023] С ссылкой на второй возможный метод реализации второго аспекта, в третьем возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью: сортировки энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров.

[0024] С ссылкой на первый возможный метод реализации второго аспекта, в четвертом возможном методе реализации второго аспекта, параметр общей разреженности включает в себя первую пропорцию энергии; блок определения конкретно выполнен с возможностью выбора P₁ огибающих спектра из P огибающих спектра каждого из N аудиокадров, и определения первой пропорции энергии в соответствии с энергией P₁ огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P₁ представляет собой положительное целое число меньше P; и блок определения конкретно выполнен с возможностью: когда первая пропорция энергии больше второго заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая пропорция энергии меньше второго заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

[0025] С ссылкой на четвертый возможный метод реализации второго аспекта, в пятом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью определения P₁ огибающих спектра в соответствии с энергией P огибающих спектра, где энергия любой одной из P₁ огибающих спектра больше энергии любой одной из других огибающих спектра в P огибающих спектра, за исключением P₁ огибающих спектра.

[0026] С ссылкой на первый возможный метод реализации второго аспекта, в шестом возможном методе реализации второго аспекта, параметр общей разреженности включает в себя вторую минимальную ширину полосы и третью минимальную ширину полосы; блок определения конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы, и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции; и блок определения конкретно выполнен с возможностью: когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья минимальная ширина полосы больше шестого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра, где четвертое заранее заданное значение больше или равно третьему заранее заданному значению, пятое заранее заданное значение меньше четвертого заранее заданного значения, и шестое заранее заданное значение больше четвертого заранее заданного значения.

[0027] С ссылкой на шестой возможный метод реализации второго аспекта, в седьмом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью: сортировки энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров; определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров.

[0028] С ссылкой на первый возможный метод реализации второго аспекта, в восьмом возможном методе реализации второго аспекта, параметр общей разреженности включает в себя вторую пропорцию энергии и третью пропорцию энергии; блок определения конкретно выполнен с возможностью: выбора P₂ огибающих спектра из P огибающих спектра каждого из N аудиокадров, определения второй пропорции энергии в соответствии с энергией P₂ огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, выбора P₃ огибающих спектра из P огибающих спектра каждого из N аудиокадров, и определения третьей пропорции энергии в соответствии с энергией P₃ огибающих спектра каждого из N аудиокадров и полной энергий соответствующих N аудиокадров, где P₂ и P₃ представляют собой положительные целые числа меньше P, и P₂ меньше P₃; и блок определения конкретно выполнен с возможностью: когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда вторая пропорция энергии больше девятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья пропорция энергии меньше десятого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

[0029] С ссылкой на восьмой возможный метод реализации второго аспекта, в девятом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью определения, из P огибающих спектра каждого из N аудиокадров, P₂ огибающих спектра, имеющих максимальную энергию, и определения, из P огибающих спектра каждого из N аудиокадров, P₃ огибающих спектра, имеющих максимальную энергию.

[0030] С ссылкой на второй аспект, в десятом возможном методе реализации второго аспекта, N равно 1, и N аудиокадров представляют собой текущий аудиокадр; и блок определения конкретно выполнен с возможностью деления спектра текущего аудиокадра на Q подполос и определения параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, где параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра.

[0031] С ссылкой на десятый возможный метод реализации второго аспекта, в одиннадцатом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью определения глобальной пропорции пиковой энергии к средней каждой из Q подполос, локальной пропорции пиковой энергии к средней каждой из Q подполос и кратковременного отклонения энергии каждой из Q подполос, где глобальная пропорция пиковой энергии к средней определяется блоком определения в соответствии с пиковой энергией в подполосе и средней энергией во всех подполосах текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется блоком определения в соответствии с пиковой энергией в подполосе и средней энергией в подполосе, и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром; и блок определения конкретно выполнен с возможностью: определения, имеется ли первая подполоса в Q подполосах, где локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения, и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и, когда имеется первая подполоса в Q подполосах, определения использования первого способа кодирования для кодирования текущего аудиокадра.

[0032] С ссылкой на второй аспект, в двенадцатом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью определения разграничительной частоты каждого из N аудиокадров; и блок определения конкретно выполнен с возможностью определения параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров.

[0033] С ссылкой на двенадцатый возможный метод реализации второго аспекта, в тринадцатом возможном методе реализации второго аспекта, параметр ограниченной полосой разреженности представляет собой среднее значение разграничительных частот N аудиокадров; и блок определения конкретно выполнен с возможностью: когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра.

[0034] Согласно вышеупомянутым техническим решениям, когда кодируется аудиокадр, учитывается разреженность распределения, по спектру, энергии аудиокадра, что может уменьшить сложность кодирования и гарантировать, что кодирование выполняется с относительно высокой точностью.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0035] Чтобы более ясно описать технические решения в вариантах осуществления настоящего изобретения, нижеследующее кратко описывает прилагаемые чертежи, требуемые для описания вариантов осуществления настоящего изобретения. Очевидно, что прилагаемые чертежи в нижеследующем описании изображают просто некоторые варианты осуществления настоящего изобретения, и специалист в данной области техники может получить еще другие чертежи из этих прилагаемых чертежей без творческих усилий.

[0036] Фиг.1 представляет собой схематическую блок-схему последовательности операций способа кодирования аудио согласно варианту осуществления настоящего изобретения;

[0037] фиг.2 представляет собой конструктивную блок-схему устройства согласно варианту осуществления настоящего изобретения; и

[0038] фиг.3 представляет собой конструктивную блок-схему устройства согласно варианту осуществления настоящего изобретения.

ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0039] Нижеследующее ясно и полностью описывает технические решения в вариантах осуществления настоящего изобретения с ссылкой на прилагаемые чертежи в вариантах осуществления настоящего изобретения. Очевидно, что описанные варианты осуществления представляют собой просто часть, а не все варианты осуществления настоящего изобретения. Все другие варианты осуществления, получаемые специалистом в данной области техники, основываясь на вариантах осуществления настоящего изобретения без творческих усилий, должны подпадать под объем защиты настоящего изобретения.

[0040] Фиг.1 представляет собой схематическую блок-схему последовательности операций способа кодирования аудио согласно варианту осуществления настоящего изобретения.

[0041] 101: Определить разреженность распределения, по спектрам, энергии N входных аудиокадров, где N аудиокадров включают в себя текущий аудиокадр, и N представляет собой положительное целое число.

[0042] 102: Определить, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, где первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования, и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания.

[0043] Согласно способу, показанному на фиг.1, когда кодируется аудиокадр, учитывается разреженность распределения, по спектру, энергии аудиокадра, что может уменьшить сложность кодирования и гарантировать, что кодирование выполняется с относительно высокой точностью.

[0044] Во время выбора подходящего способа кодирования для аудиокадра, может учитываться разреженность распределения, по спектру, энергии аудиокадра. Может быть три типа разреженности распределения, по спектру, энергии аудиокадра: общая разреженность, разреженность всплесков и ограниченная полосой разреженность.

[0045] Необязательно, что в варианте осуществления, подходящий способ кодирования может выбираться для текущего аудиокадра посредством использования общей разреженности. В этом случае, определение разреженности распределения, по спектрам, энергии N входных аудиокадров включает в себя: деление спектра каждого из N аудиокадров на P огибающих спектра, где P представляет собой положительное целое число; и определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.

[0046] Конкретно, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с конкретной пропорцией N входных последовательных аудиокадров может определяться как общая разреженность. Меньшая ширина полосы указывает более сильную общую разреженность, и большая ширина полосы указывает более слабую общую разреженность. Другими словами, более сильная общая разреженность указывает, что энергия аудиокадра более централизована, и более слабая общая разреженность указывает, что энергия аудиокадра более рассредоточена. Эффективность является высокой, когда используется первый способ кодирования для кодирования аудиокадра, общая разреженность которого является относительно сильной. Поэтому, подходящий способ кодирования может выбираться посредством определения общей разреженности аудиокадра для кодирования аудиокадра. Чтобы способствовать определению общей разреженности аудиокадра, общая разреженность может квантоваться для получения параметра общей разреженности. Необязательно, что, когда N равно 1, общая разреженность представляет собой минимальную ширину полосы, распределенную по спектру, энергии с конкретной пропорцией текущего аудиокадра.

[0047] Необязательно, что в варианте осуществления параметр общей разреженности включает в себя первую минимальную ширину полосы. В этом случае, определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее знач

Способ и устройство кодирования аудио

Патент 2667380