Устройство и способ для оценки уровня кодированных аудио кадров в области битового потока
Иллюстрации
Показать всеИзобретение относится к средствам оценки аудио сигнала. Техническим результатом является повышение эффективности кодирования аудио сигнала. Устройство содержит модуль определения кодовой книги из множества кодовых книг в качестве идентифицированной кодовой книги. В устройстве аудио сигнал кодируется, используя идентифицированную кодовую книгу, и модуль оценки, сконфигурированный для получения значения уровня, ассоциированного с идентифицированной кодовой книгой, в качестве полученного значения уровня и для оценивания оценки уровня аудио сигнала, используя полученное значение уровня. 8 н. и 11 з.п. ф-лы, 11 ил.
Реферат
Настоящее изобретение относится к обработке аудио и, в частности, к устройству и способу для оценки уровня кодируемых аудио сигналов в области битового потока.
Обработка аудио развивается многими способами и она была подвергнута многим исследованиям, как эффективно кодировать и декодировать сигналы данных аудио. Эффективное кодирование, например, обеспечено посредством MPEG AAC (MPEG = группа экспертов по движущимся изображениям; AAC = усовершенствованное кодирование аудио).
Согласно MPEG AAC, спектральные значения аудио сигнала кодируют, используя коэффициенты масштабирования, квантование и кодовые книги, в частности кодовые книги Хаффмана.
Прежде, чем будет выполнено кодирование по Хаффману, кодер группирует множество спектральных коэффициентов, которые должны быть закодированы в различные секции. Для каждой секции спектральных коэффициентов кодер выбирает кодовую книгу Хаффмана для кодирования по Хаффману. MPEG AAC обеспечивает одиннадцать различных Спектральных кодовых книг Хаффмана для кодирования спектральных данных, из которых кодер выбирает кодовую книгу, лучше всего подходящую для кодирования спектральных коэффициентов секции. Кодер выдает идентификатор кодовой книги, идентифицирующий кодовую книгу, используемую для кодирования по Хаффману спектральных коэффициентов секции к декодеру, в качестве побочной информации.
На стороне декодера декодер анализирует принятую побочную информацию, чтобы определить, какой множества Кодовых книг Хаффмана Спектра использовался для кодирования спектральных значений секции. Декодер проводит Хаффмана, Декодирующего на основании информации стороны о Кодовой книге Хаффмана, используемой для кодирования спектральных коэффициентов секции, которая должна быть декодирована декодером.
После декодирования по Хаффману множество квантованных спектральных значений получают в декодере. Декодер может затем выполнить обратное квантование, чтобы инвертировать неоднородное квантование, которое могло быть проведено кодером. Посредством этого обратно квантованные спектральные значения получают в декодере.
Однако, эти обратно квантованные спектральные значения могут все еще быть немасштабированы. Выведенные немасштабированные спектральные значения группируют в диапазоны коэффициентов масштабирования, каждый диапазон коэффициентов масштабирования имеет общий коэффициент масштабирования. Коэффициент масштабирования для каждого диапазона коэффициентов масштабирования доступен для декодера в качестве побочной информации, которая предоставлена кодером. Используя эту информацию, декодер умножает немасштабированные спектральные значения диапазона коэффициентов масштабирования на их коэффициент масштабирования. Этим масштабированные спектральные значения получают.
Кодирование и декодирование спектральных значений согласно состоянию уровня техники описаны со ссылками на фиг. 7-10.
Фиг. 7 иллюстрирует кодер согласно состоянию уровня техники. Кодер содержит банк фильтров T/F 710 для преобразования аудио сигналов AS, которые должны быть кодированы, из временной области в частотную область, чтобы получить сигнал аудио частотной области. Сигнал аудио частотной области подается в модуль 720 коэффициентов масштабирования для определения коэффициентов масштабирования. Модуль 720 коэффициентов масштабирования приспособлен, чтобы разделить спектральные коэффициенты аудио сигнала частотной области в несколько групп спектральных коэффициентов, называемых диапазонами коэффициентов масштабирования, которые совместно используют один коэффициент масштабирования. Коэффициент масштабирования представляет значение усиления, используемое для изменения амплитуды всех спектральных коэффициентов в соответствующем диапазоне коэффициентов масштабирования. Модуль 720 коэффициентов масштабирования, кроме того, приспособлен, чтобы генерировать и вывести немасштабированные спектральные коэффициенты аудио сигнала частотной области.
Кроме того, кодер на Фиг. 7 содержит квантователь для квантования немасштабированных спектральных коэффициентов аудио сигнала частотной области. Квантователь 730 может быть неоднородным квантователем.
После квантования квантованные немасштабированные спектры аудио сигнала подаются в кодер 740 Хаффмана для того, чтобы быть закодированными по Хаффману. Кодирование по Хаффману используется для уменьшенной избыточности квантованного спектра аудио сигнала. Множество немасштабированных квантованных спектральных коэффициентов группируется в секции. В то время как в MPEG-AAC обеспечены одиннадцать возможных кодовых книг, все спектральные коэффициенты секции закодированы посредством одной и той же кодовой книги Хаффмана.
Кодер выберет одну из одиннадцати возможных кодовых книг Хаффмана, которая особенно подходит для кодирования спектральных коэффициентов секции. Посредством этого выбор кодовой книги Хаффмана кодера для конкретной секции зависит от спектральных значений конкретной секции. Закодированные по Хаффману спектральные коэффициенты могут затем быть переданы к декодеру вместе с побочной информацией, содержащей например, информацию о кодовой книге Хаффмана, которая использовалась для кодирования секции спектральных коэффициентов, коэффициент масштабирования, который использовался для конкретного диапазона коэффициентов масштабирования, и т.д.
Два или четыре спектральных коэффициента закодированы кодовым словом кодовой книги Хаффмана, используемой для кодирования по Хаффману спектральных коэффициентов секции. Кодер передает кодовые слова, представляющие закодированные спектральные коэффициенты, к декодеру вместе с побочной информацией, содержащей длину секции, а также информацию о кодовой книге Хаффмана, используемой для кодирования спектральных коэффициентов секции.
В MPEG AAC, одиннадцать Спектральных кодовых книг Хаффмана предоставлены для кодирования спектральных данных аудио сигнала. Различная спектральная кодовая книга Хаффмана может быть идентифицирована посредством ее индекса кодовой книги (значение между 1 и 11). Размерность кодовой книги Хаффмана указывает, сколько спектральных коэффициентов закодировано кодовым словом рассматриваемой кодовой книги Хаффмана. В MPEG AAC, размерность кодовой книги Хаффмана равна или 2 или 4, указывающие, что кодовое слово кодирует или два или четыре спектральных значения аудио сигнала.
Однако различные кодовые книги Хаффмана также отличаются относительно других свойств. Например, максимальное абсолютное значение спектрального коэффициента, которое может быть закодировано кодовой книгой Хаффмана, изменяется от кодовой книги к кодовой книги и может, например, быть равно 1, 2, 4, 7, 12 или больше. Кроме того, рассмотренная кодовая книга Хаффмана может быть приспособлена, чтобы кодировать значения со знаком или без.
Используя кодирование по Хаффману, спектральные коэффициенты кодируются кодовыми словами различных длин. MPEG AAC обеспечивает две различных кодовых книги Хаффмана, имеющие максимальное абсолютное значение 1, две различные кодовые книги Хаффмана, имеющие максимальное абсолютное значение 2, две различные кодовые книги Хаффмана, имеющие максимальное абсолютное значение 4, две различные кодовые книги Хаффмана, имеющие максимальное абсолютное значение 7 и две различные кодовые книги Хаффмана, имеющие максимальное абсолютное значение 12, в котором каждая кодовая книга Хаффмана представляет отличную функцию распределения вероятности. Кодер Хаффмана будет всегда выбирать кодовую книгу Хаффмана, которая подходит лучше всего для кодирования спектральных коэффициентов.
Фиг. 8 иллюстрирует декодер согласно состоянию уровня техники. Закодированные по Хаффману спектральные значения принимаются декодером 750 Хаффмана. Декодер 750 Хаффмана также принимает, в качестве побочной информации, информацию о кодовой книге Хаффмана, используемой для кодирования спектральных значений для каждой секции спектральных значений. Декодер 750 Хаффмана затем выполняет декодирование по Хаффману для получения немасштабированных квантованных спектральных значений. Немасштабированные квантованные спектральные значения подаются в обратный квантователь 760. Обратный квантователь выполняет обратное квантование, чтобы получить обратно квантованные немасштабированные спектральные значения, которые подаются в блок 770 масштабирования. Блок 770 масштабирования также принимает коэффициенты масштабирования в качестве побочной информации для каждого диапазона коэффициентов масштабирования. На основании принятых коэффициентов масштабирования, блок 770 масштабирования взвешивает немасштабированные обратно квантованные спектральные значения, чтобы получить масштабированные обратно квантованные спектральные значения. Банк фильтров F/T 780 затем преобразовывает масштабированные обратно квантованные спектральные значения аудио сигнала частотной области из частотной области во временную область, чтобы получить значения выборок аудио сигнала временной области.
Фиг. 9 иллюстрирует кодер согласно состоянию уровня техники, отличающийся от кодера согласно Фиг. 7 тем, что кодер согласно Фиг. 9 также содержит блок TNS (TNS = временное формирование шума) стороны кодера. Временное формирование шума может использоваться, чтобы управлять временной формой шума квантования посредством проведения процесса фильтрования относительно частей спектральных данных аудио сигнала. Блок TNS 715 стороны кодера определяет, выполняет вычисление с линейным прогнозирующим кодированием (LPC) относительно спектральных коэффициентов аудио сигнала частотной области, который должен быть закодирован. Среди прочего, получают из вычисления LPC коэффициентов отражения, также называемые коэффициентами PARCOR. Временное формирование шума не используется, если коэффициент предсказания, который также получают посредством вычисления LPC, не превышает некоторое пороговое значение. Однако, если коэффициент предсказания больше чем пороговое значение, временное формирование шума используется. Блок TNS стороны кодера удаляет все коэффициенты отражения, которые меньше чем некоторое пороговое значение. Оставшиеся коэффициенты отражения преобразуются в коэффициенты линейного предсказания и используются как коэффициенты фильтра формирования шума в кодере. Блок TNS стороны кодера затем выполняет операцию фильтрования в отношении тех спектральных коэффициентов, для которых используется TNS, чтобы получить обработанные спектральные коэффициенты аудио сигнала. Побочная информация, указывающая информацию TNS, например, коэффициенты отражения (коэффициенты PARCOR), передается к декодеру.
Фиг. 10 иллюстрирует декодер согласно состоянию уровня техники, который отличается от декодера, иллюстрированного на Фиг. 8, поскольку декодер согласно Фиг. 10, кроме того, содержит блок TNS 775 стороны декодера. Блок TNS стороны декодера принимает обратно квантованные масштабированные спектры аудио сигнала и также принятую информацию TNS, например, информацию, указывающую коэффициенты отражения (коэффициенты PARCOR). Блок TNS 775 стороны декодера обрабатывает обратно квантованные спектры аудио сигнала, чтобы получить обработанный обратно квантованный спектр аудио сигнала.
Для множества приложений важно определить или оценить уровень, например, энергию, амплитуду или громкость, кодируемого аудио сигнала. Это особенно верно для систем телеконференции. Телеконференции с несколькими участниками в различных местоположениях обрабатываются блоками управления многими точками (MCU). Их цель состоит в том, чтобы смешать различные входные и выходные потоки, где аудио данные представлены в кодированном формате.
Согласно состоянию уровня техники, все входные потоки декодируются в MCU, и аудио данные затем далее анализируют, чтобы идентифицировать наиболее доминирующие потоки, которые примешаны к выходному потоку. Это означает, что, согласно состоянию уровня техники, все входные потоки являются декодированными по Хаффману обратно квантованными и масштабированными для дальнейшего анализа входных потоков после этого, чтобы идентифицировать наиболее доминирующие потоки, например, потоки, показывающие самый высокий уровень, например, показывающие наибольшую энергию. Современный подход для оценки уровня, например, энергии, одного диапазона коэффициентов масштабирования должен был бы выполнить декодирование по Хаффману и обратное квантование для всех спектральных значений и вычислить энергию, суммируя квадраты всех обратно квантованных спектральных значений.
Задача настоящего изобретения состоит в том, чтобы обеспечить улучшенные концепции для оценки уровня кодируемого аудио сигнала. Задача настоящего изобретения решается устройством по п. 1, способом по п. 12, способом по п. 14 и компьютерной программой по п. 15.
Устройство для оценки уровня кодируемого аудио сигнала обеспечено. Устройство содержит модуль определения кодовой книги для определения кодовой книги для множества кодовых книг в качестве идентифицированной кодовой книги, в котором аудио сигнал кодирован, используя идентифицированную кодовую книгу. Устройство, кроме того, содержит модуль оценки, сконфигурированный для получения значения уровня, ассоциированного с идентифицированной кодовой книгой в качестве полученного значения уровня. Кроме того, модуль оценки приспособлен для оценивания оценки уровня аудио сигнала, используя полученное значение уровня.
В варианте осуществления полученное значение уровня может быть полученным значением энергии, и устройство для оценки уровня может быть приспособлено для выполнения оценки энергии в качестве оценки уровня. В другом варианте осуществления полученное значение уровня может быть полученным значением амплитуды, и устройство для оценки уровня может быть приспособлено для выполнения оценки амплитуды в качестве оценки уровня. В следующем варианте осуществления полученное значение уровня может быть полученным значением громкости, и устройство для оценки уровня может быть приспособлено для выполнения оценки громкости в качестве оценки уровня.
Настоящее изобретение основано на обнаружении, что, для того, чтобы уменьшить сложность для всех этапов декодирования, уровень, например, энергия, амплитуда или громкость, может быть оценен непосредственно из параметров битового потока для идентификационной информации наиболее доминирующих потоков. Оценка уровня, например, оценка энергии, оценка амплитуды или оценка громкости, может быть основана на информации битового потока, например, элементах битового потока, например, кодовой книге Хаффмана, коэффициенте масштабирования и, например, коэффициентах фильтра TNS. Эти элементы битового потока могут использоваться, чтобы оценить уровень согласно потоку AAC-ELD (AAC-ELD; Усовершенствованное кодирование аудио с расширенной малой задержкой). Таким образом, согласно настоящему изобретению, не является необходимым полностью декодировать битовый поток аудио, но вместо этого обеспечить оценку уровня, на основании определении кодовой книги, которая использовалась для кодирования аудио сигналов, посредством получения значения уровня, ассоциированного с идентифицированной кодовой книгой, и посредством оценки уровня аудио сигнала, используя это значение уровня.
В варианте осуществления модуль оценки содержит модуль масштабирования. Модуль масштабирования может быть приспособлен, чтобы получить коэффициент масштабирования, относящийся к кодируемому аудио сигналу или части кодируемого аудио сигнала в качестве полученного коэффициента масштабирования. Модуль масштабирования может быть приспособлен для получения масштабированного значения уровня, например, масштабированное значение энергии, амплитуды или громкости, на основании коэффициента масштабирования и полученного значения уровня. Кроме того, модуль оценки может быть приспособлен для оценивания оценки уровня аудио сигнала, используя масштабированное значение уровня. Согласно этому варианту осуществления, оценка уровня обеспечивается на основании информации о кодовой книге, которая использовалась для кодирования аудио сигналов, значении уровня, которое ассоциировано с идентифицированной кодовой книгой и коэффициента масштабирования.
В варианте осуществления полученное значение уровня является значением энергии, и модуль масштабирования приспособлен, чтобы применить полученный коэффициент масштабирования к полученному значению энергии, чтобы получить масштабированное значение энергии, посредством умножения полученного значения энергии на квадрат полученного коэффициента масштабирования. Посредством этого полученный коэффициент масштабирования применяется к полученной энергии аналогичным образом тому, как коэффициент масштабирования применяется к немасштабированным обратно квантованным спектральным коэффициентам в декодере согласно MPEG-2 AAC, но без необходимости декодировать спектральные коэффициенты.
В другом варианте осуществления полученное значение уровня является значением амплитуды, и модуль масштабирования приспособлен, чтобы применить полученный коэффициент масштабирования к полученному значению амплитуды, чтобы получить масштабированное значение амплитуды, посредством умножения полученного значения амплитуды на полученный коэффициент масштабирования.
В другом варианте осуществления полученное значение уровня является значением громкости, и модуль масштабирования приспособлен, чтобы применить полученный коэффициент масштабирования к полученному значению громкости, чтобы получить масштабированное значение громкости, посредством умножения полученного значения громкости на куб полученного коэффициента масштабирования. Существуют альтернативные способы вычислить громкость, такие как, на степень 3/2. Обычно коэффициенты масштабирования должны быть преобразованы в область громкости, когда полученное значение уровня является значением громкости.
В другом варианте осуществления модуль оценки конфигурируется для оценивания оценки уровня аудио сигнала, используя конкретное значение уровня в качестве полученного значения уровня. Таким образом, модуль оценки специально конфигурируется для того, чтобы выполнить оценку уровня, на основании конкретного вида значения уровня.
В варианте осуществления полученное значение уровня является полученным значением энергии, и модуль оценки конфигурируется для оценивания оценки энергии в качестве оценки уровня аудио сигнала, используя в качестве полученного значения энергии значение энергии кодовой книги, которое указывает сумму усредненных взвешенных по вероятности значений суммы энергии всех кодовых слов идентифицированной кодовой книги. Каждое среднее взвешенное по вероятности суммарное значение указывает отношение взвешенного по вероятности суммарного значения энергии кодового слова идентифицированной кодовой книги к значению размерности, ассоциированному с кодовой книгой. Каждое взвешенное по вероятности суммарное значение энергии указывает произведение суммарного значения энергии рассматриваемого кодового слова идентифицированной кодовой книги на значение вероятности, ассоциированное с рассматриваемым кодовым словом идентифицированной кодовой книги. Каждое суммарное значение энергии указывает числовые значения последовательности значений энергии кодового слова идентифицированной кодовой книги. Каждая последовательность значений энергии указывает значение квадрата для каждого значения последовательности обратно квантованных числовых значений последовательности числовых значений кодового слова для каждого кодового слова кодовой книги. Каждая последовательность числовых значений является последовательностью числовых значений, закодированных кодовым словом кодовой книги.
В другом варианте осуществления модуль оценки также содержит модуль получения значения уровня. Модуль получения значения уровня приспособлен для получения полученного значения уровня посредством поиска значения уровня, ассоциированного с идентифицированной кодовой книгой, в памяти. В альтернативном варианте осуществления модуль получения значения уровня приспособлен запрашивать значение уровня, ассоциированного с идентифицированной кодовой книгой, из локальной базы данных. В другом дополнительном варианте осуществления модуль получения значения уровня приспособлен запрашивать значение уровня, ассоциированного с идентифицированной кодовой книгой, от удаленного компьютера.
В другом варианте осуществления устройство дополнительно содержит память или базу данных, имеющую сохраненные множество значений хранения уровня кодовой книги, указывающих значение уровня, ассоциированного с кодовой книгой, при этом каждая из множества кодовых книг имеет значение хранения уровня кодовой книги, ассоциированной с ней и сохраненное в памяти или базе данных. Модуль получения значения уровня конфигурируется для получения значения уровня, ассоциированного с идентифицированной кодовой книгой, посредством получения значения хранения уровня кодовой книги, ассоциированного с идентифицированной кодовой книгой, из памяти или из базы данных.
В варианте осуществления память или база данных имеют сохраненные множество значений хранения энергии кодовой книги в качестве значений уровня памяти кодовой книги, при этом каждое значение хранения энергии кодовой книги указывает сумму усредненной взвешенных по вероятности значений суммы энергии всех кодовых слов идентифицированной кодовой книги. Каждое суммарное значение энергии указывает числовые значения последовательности значений энергии кодового слова идентифицированной кодовой книги. Кроме того, каждая последовательность значений энергии указывает значение квадрата для каждого значения последовательности обратно квантованных числовых значений последовательности числовых значений кодового слова для каждого кодового слова кодовой книги. Каждая последовательность числовых значений является последовательностью числовых значений, сохраненных посредством кодового слова кодовой книги. Этот вариант осуществления обеспечивает память или базу данных, имеющие сохраненные множество значений хранения энергии кодовой книги, ассоциированных с конкретной кодовой книгой, причем сохраненные значения хранения энергии кодовой книги имеют специальные свойства, которые являются особенно подходящими для использования для оценки энергии.
В другом варианте осуществления память или база данных имеют сохраненные множество значений амплитуды в качестве значений уровня памяти кодовой книги. В другом варианте осуществления память или база данных имеют сохраненные множество значений громкости в качестве значений уровня памяти кодовой книги.
В другом варианте осуществления модуль оценки дополнительно содержит модуль настройки фильтра предсказания. Модуль настройки фильтра предсказания приспособлен для получения одного или более коэффициентов фильтра предсказания, относящихся к кодируемому аудио сигналу или к части кодируемого аудио сигнала в качестве полученных коэффициентов фильтра предсказания. Модуль настройки фильтра предсказания, кроме того, приспособлен, чтобы получить настроенное фильтром предсказания значение уровня на основании коэффициентов фильтра предсказания и полученного значения уровня. Кроме того, модуль оценки приспособлен для оценивания оценки уровня аудио сигнала, используя настроенное фильтром предсказания значение уровня.
Согласно другому варианту осуществления, предоставлено устройство для генерирования обратного потока данных для множества участников системы организации телеконференций. Устройство содержит интерфейс приемника для приема множества потоков данных участников, содержащих аудио сигналы от множества участников. Кроме того, устройство для генерирования обратного потока данных содержит устройство для оценки уровня кодируемого аудио сигнала согласно одному из вышеописанных вариантов осуществления. Устройство для оценки уровня скомпоновано для выполнения оценки уровня для каждого потока данных участников, без полного декодирования потока данных. Кроме того, устройство для генерирования обратного потока данных содержит модуль принятия решения для принятия решения, должен ли поток данных участников быть включен в обратный поток данных, на основании оценки уровня. Кроме того, устройство для генерирования обратного потока данных содержит смеситель для смешивания только потоков данных участников, которые должны быть включены в обратный поток данных, и для не включения потоков данных участников, для которых принято решение не включать. Устройство для генерирования обратного потока данных сконфигурировано для не полностью декодирования потоков данных участников, для которых принято решение не включать в обратный поток данных. В варианте осуществления модуль принятия решения приспособлен, для принятия решения, что рассматриваемый поток данных участников не включен в обратный поток данных, когда оценка уровня рассматриваемого потока данных участников ниже порогового значения. В другом варианте осуществления модуль принятия решения приспособлен для принятия решения, что только поток данных, который включен в обратный поток данных, является потоком данных, имеющим самую высокую оценку уровня из оценок уровня всех потоков данных участников относительно конкретного диапазона коэффициентов масштабирования.
Согласно варианту осуществления предоставлен способ для генерирования значения уровня, ассоциированного с кодовой книгой. Способ содержит: определение последовательности числовых значений, ассоциированных с кодовым словом кодовой книги для каждого кодового слова кодовой книги. Определение обратно квантованной последовательности числовых значений для каждого кодового слова кодовой книги посредством применения обратного квантователя к числовым значениям последовательности числовых значений кодового слова для каждого кодового слова этой кодовой книги. Вычисление последовательности значений уровня для каждого кодового слова кодовой книги посредством возведения в квадрат каждого значения обратно квантованной последовательности числовых значений кодового слова для каждого кодового слова кодовой книги. Вычисление суммарного значения уровня для каждого кодового слова кодовой книги посредством суммирования значений последовательности значений уровня для каждого кодового слова кодовой книги. Определение взвешенного по вероятности суммарного значения уровня для каждого кодового слова кодовой книги посредством умножения суммарного значения уровня кодового слова на значение вероятности, ассоциированное с кодовым словом для каждого кодового слова кодовой книги. Определение среднего взвешенного по вероятности суммарного значения уровня для каждого кодового слова кодовой книги посредством деления взвешенного по вероятности суммарного значения уровня кодового слова на значение размерности, ассоциированное с этой кодовой книгой, для каждого кодового слова кодовой книги, и вычисления значения уровня кодовой книги посредством суммирования среднего взвешенного по вероятности суммарного значения уровня всех кодовых слов.
Предпочтительные варианты осуществления описаны со ссылками на чертежи, на которых:
Фиг. 1 изображает устройство для оценки уровня согласно варианту осуществления,
Фиг. 2 иллюстрирует модуль оценки согласно варианту осуществления,
Фиг. 3 показывает модуль оценки согласно другому варианту осуществления,
Фиг. 4a и 4b иллюстрируют способ для генерирования значения уровня,
Фиг. 5 изображает модуль оценки согласно дополнительному варианту осуществления, содержащему модуль настройки фильтра предсказания,
Фиг. 6 иллюстрирует устройство для генерирования обратного потока данных,
Фиг. 7 иллюстрирует кодер согласно состоянию уровня техники,
Фиг. 8 изображает декодер согласно состоянию уровня техники,
Фиг. 9 иллюстрирует другой кодер согласно состоянию уровня техники, и
Фиг. 10 изображает дополнительный кодер согласно состоянию уровня техники.
Фиг. 1 иллюстрирует устройство согласно варианту осуществления. Устройство содержит модуль 110 определения кодовой книги и модуль 120 оценки. Модуль 110 определения кодовой книги приспособлен для определения кодовой книги из множества кодовых книг в качестве идентифицированной кодовой книги, при этом аудио сигналы кодированы, используя идентифицированную кодовую книгу. Модуль 120 оценки приспособлен для получения значения уровня, например, значения энергии, значения амплитуды или значения громкости, ассоциированного с идентифицированной кодовой книгой, в качестве полученного значения уровня. Кроме того, модуль 120 оценки приспособлен для оценивания оценки уровня, например, оценки энергии, оценки амплитуды или оценки громкости, аудио сигнала, используя полученное значение уровня. Например, модуль 110 определения кодовой книги может определить кодовую книгу, которая использовалась кодером для кодирования аудио сигнала, посредством приема побочной информации, переданной вместе с кодированным аудио сигналом. В частности, побочная информация может содержать информацию, идентифицирующую кодовую книгу, используемую для кодирования рассматриваемой секции аудио сигнала. Такая информация может, например, быть передана от кодера к декодеру в качестве числа, идентифицирующего кодовую книгу Хаффмана, используемую для кодирования рассматриваемой секции аудио сигнала.
Фиг. 2 иллюстрирует модуль оценки согласно варианту осуществления. Модуль оценки содержит модуль 210 получения значения уровня и модуль 220 масштабирования. Модуль получения значения уровня приспособлен для получения значения уровня, ассоциированного с идентифицированной кодовой книгой, то есть, кодовой книгой, которая использовалась для кодирования спектральных данных кодером, посредством поиска значения уровня в памяти, запрашивая значение уровня из локальной базы данных, или запрашивая значение уровня, ассоциированное с идентифицированной кодовой книгой, из удаленного компьютера. В варианте осуществления значение уровня, которое найдено или запрошено блоком получения значения уровня, может быть средним значением уровня, которое указывает средний уровень закодированного немасштабированного спектрального значения, закодированного посредством использования идентифицированной кодовой книги.
Посредством этого полученное значение уровня не вычисляется из фактических спектральных значений, но вместо этого используется среднее значение уровня, который зависит только от используемой кодовой книги. Как был описано выше, кодер обычно приспособлен, чтобы выбрать кодовую книгу из множества кодовых книг, которые подходят лучше всего для кодирования соответствующих спектральных данных секции аудио сигнала. Поскольку кодовые книги отличаются, например, относительно их максимального абсолютного значения, которое может быть закодировано, среднее значение, которое закодировано с помощью кодовой книги Хаффмана, отличается от кодовой книги к кодовой книге и, поэтому среднее значение уровня закодированного спектрального коэффициента, закодированного конкретной кодовой книгой, также отличается от кодовой книги к кодовой книге.
Таким образом, согласно варианту осуществления, среднее значение уровня для кодирования спектрального коэффициента аудио сигнала, используя конкретную кодовую книгу Хаффмана, может быть определено для каждой кодовой книги Хаффмана, и может, например, может быть сохранено в памяти, базе данных или на удаленном компьютере. Модуль получения значения уровня затем просто должен искать или запросить значение уровня, ассоциированное с идентифицированной кодовой книгой, которая использовалась для кодирования спектральных данных, чтобы получить полученное (выведенное) значение уровня, ассоциированное с идентифицированной кодовой книгой.
Однако, нужно учесть, что кодовые книги Хаффмана часто используются, чтобы закодировать немасштабированные спектральные значения, как это имеет место для MPEG AAC. Затем, однако, масштабирование должно быть принято во внимание, когда проводится оценка уровня. Поэтому, модуль оценки согласно Фиг. 2 также содержит модуль 220 масштабирования. Модуль масштабирования приспособлен, чтобы получить коэффициент масштабирования, относящийся к кодируемому аудио сигналу или к части кодируемого аудио сигнала, в качестве полученного коэффициента масштабирования. Например, относительно декодера, модуль 220 масштабирования будет определять коэффициент масштабирования для каждого диапазона коэффициентов масштабирования. Например, модуль 220 масштабирования может принять информацию о коэффициенте масштабирования диапазона коэффициентов масштабирования посредством приема побочной информации, переданной от кодера к декодеру. Модуль 220 масштабирования, кроме того, приспособлен, чтобы определить масштабированное значение уровня на основании коэффициента масштабирования и полученного значения уровня.
В варианте осуществления, в котором полученное значение уровня является полученным значением энергии, модуль масштабирования приспособлен, чтобы применить полученный коэффициент масштабирования к полученному значению энергии, чтобы получить масштабированное значение уровня, посредством умножения полученного значения энергии на квадрат полученного коэффициента масштабирования.
В другом варианте осуществления, в котором полученное (выведенное) значение уровня является полученным (выведенным) значением амплитуды, и модуль масштабирования приспособлен для применения полученного коэффициента масштабирования к полученному значению амплитуды, чтобы получить масштабированное значение уровня, умножая полученное значение амплитуды на полученный коэффициент масштабирования.
В другом варианте осуществления, в котором полученное значение уровня является полученным значением громкости, и модуль (220) масштабирования приспособлен для применения полученного коэффициента масштабирования к полученному значению громкости, чтобы получить масштабированное значение уровня, посредством умножения полученного значения громкости на куб полученного коэффициента масштабирования. Существуют альтернативные способы, чтобы вычислить громкость, например, посредством степени 3/2. В общем случае коэффициенты масштабирования должны быть преобразованы к области громкости, когда полученное значение уровня является значением громкости.
Эти варианты осуществления принимают во внимание, что значение энергии определено на основании квадрата спектральных коэффициентов аудио сигнала, что значение амплитуды определено на основании абсолютных значений спектральных коэффициентов аудио сигнала, и что значение громкости определено на основании спектральных коэффициентов аудио сигнала, которые были преобразованы к области громкости.
Модуль оценки приспособлен для оценивания оценки уровня аудио сигнала, используя масштабированное значение уровня. В варианте осуществления согласно Фиг. 2 модуль оценки приспособлен, чтобы вывести масштабированное значение уровня в качестве оценки уровня. В этом случае постобработка масштабированного значения уровня не проводится. Однако, как иллюстрировано в варианте осуществления согласно Фиг. 3, модуль оценки может также быть приспособлен, чтобы выполнить постобработку. Поэтому, модуль оценки согласно Фиг. 3 содержит постпроцессор 230 для постобработки одного или более масштабированных значений уровня для оценивания оценки уровня. Например, оценка уровня блока оценки может быть определена постпроцессором 230 посредством определения среднего значения множества масштабированных значений уровня. Это усредненное значение может быть выведено блоком оценки в качестве оценки уровня.
В отличие от представленных вариантов осуществления современный подход