Устройство и способ декодирования и программа
Иллюстрации
Показать всеИзобретение относится к обработке аудиосигналов. Технический результат – повышение качества звука. Устройство содержит схему демультиплексирования, которая демультиплексирует входную кодовую строку в кодовую строку коэффициентов усиления и кодовую строку сигнала, схему декодирования сигнала, которая декодирует кодовую строку сигнала, чтобы вывести сигнал во временной последовательности, схему декодирования коэффициента усиления, которая декодирует кодовую строку коэффициентов усиления, при этом схема декодирования коэффициента усиления считывает значения коэффициента усиления и значения наклона графика коэффициента усиления в заданных позициях выборок коэффициентов усиления сигнала во временной последовательности и информацию о режиме интерполяции, блок обработки интерполяции, который получает значение коэффициента усиления в каждой позиции выборки между двумя позициями выборок коэффициентов усиления путем линейной интерполяции или нелинейной интерполяции согласно режиму интерполяции на основании значений коэффициентов усиления и значений наклона графика коэффициента усиления, и схему применения коэффициента усиления, которая регулирует усиление сигнала во временной последовательности на основании значений коэффициентов усиления. 6 н. и 4 з.п. ф-лы, 19 ил.
Реферат
Область техники, к которой относится изобретение
Настоящая технология относится к устройству декодирования, способу декодирования и программе и, в частности, к устройству декодирования, способу декодирования и программе, которые позволяют получить звук с более высоким качеством.
Уровень техники
В предшествующем уровне техники при использовании технологии кодирования аудиосигналов усовершенствованного кодирования аудиосигналов (ААС) экспертной группы по вопросам движущегося изображения (MPEG) (ISO/IEC 14496-3:2001) можно записывать вспомогательную информацию о понижающем микшировании или сжатии динамического диапазона (DRC) в битовом потоке и использовать вспомогательную информацию на стороне воспроизведения согласно окружающей среде на стороне воспроизведения (смотри, например, непатентную литературу 1).
Использование такой вспомогательной информации позволяет обеспечить понижающее микширование аудиосигнала на стороне воспроизведения или управлять громкостью соответствующим образом через DRC.
Перечень цитируемой литературы
Непатентная литература
Непатентная литература 1: Information technology Coding of audiovisual objects Part 3: Audio (ISO/IEC 14496-3:2001)
Раскрытие изобретения
Техническая задача
Например, с помощью вышеописанной технологии кодирования можно назначать информацию о коэффициенте усиления DRC для регулировки громкости в качестве вспомогательной информации DRC в блоках кадра аудиосигнала, и на стороне воспроизведения можно получить звук с соответствующей громкостью путем коррекции громкости аудиосигнала на основании указанной информации о коэффициенте усиления DRC.
Однако коэффициент усиления, указанный с помощью такой информации о коэффициенте усиления DRC, принимает одинаковое значение для каждой выборки в пределах одного кадра аудиосигнала, который является временным сигналом. То есть все выборки, включенные в один кадр, корректируются с учетом одинакового коэффициента усиления.
Поэтому, например, когда величина коэффициента усиления, указанного в информации о коэффициенте усиления DRC изменяется главным образом между кадрами, участки временных форм аудиосигнала становятся прерывистыми между кадрами, что может вызвать ухудшение с точки зрения слухового восприятия.
Настоящая технология была разработана с учетом таких обстоятельств и направлена на то, чтобы сделать возможным получение звука с более высоким качеством.
Решение технической задачи
Устройство декодирования согласно первому аспекту настоящей технологии включает в себя: блок считывания коэффициентов усиления, выполненный с возможностью считывания кодированных значений коэффициентов усиления по меньшей мере в двух позициях выборок коэффициента усиления сигнала в виде временной последовательности; блок считывания информации интерполяции, выполненный с возможностью считывания информации интерполяции, показывающей, получается ли значение коэффициента усиления в каждой позиции выборки сигнала в виде временной последовательности путем линейной интерполяции или путем нелинейной интерполяции; и блок обработки интерполяции, выполненный с возможностью получения значения коэффициента усиления в каждой позиции выборки, расположенной между двумя позициями выборок коэффициента усиления сигнала в виде временной последовательности на основании значений коэффициентов усиления в позициях выборок коэффициента усиления, путем линейной интерполяции или нелинейной интерполяции согласно информации интерполяции.
Блок считывания коэффициентов усиления можно заставить дополнительно считывать значения наклона графика коэффициента усиления, показывающие наклон значений коэффициентов усиления в позициях выборок коэффициента усиления. Когда значение коэффициента усиления получается путем нелинейной интерполяции, блок обработки интерполяции можно заставить получить значение коэффициента усиления в каждой позиции выборки, расположенной между двумя позициями выборок коэффициента усиления на основании значений коэффициентов усиления и значений наклона графика коэффициента усиления в позициях выборок коэффициента усиления.
Устройство декодирования может дополнительно включать в себя: блок ограничения, выполненный с возможностью выполнения процесса ограничения в отношении значения коэффициента усиления, полученного путем нелинейной интерполяции так, что значение коэффициента усиления принимает значение, большее или равное заданному нижнему пределу, или значение, меньшее или равное заданному верхнему пределу.
Блок ограничения можно заставить выполнять процесс ограничения, используя ноль в качестве нижнего предела, процесс ограничения использует единицу в качестве нижнего предела, или процесс ограничения, используя единицу в качестве верхнего предела.
Устройство декодирования может дополнительно включать в себя: операционный блок, выполненный с возможностью получения в позициях выборок коэффициента усиления прямых линий, имеющих значения коэффициента усиления в позициях выборок коэффициента усиления и имеющих наклон, указанный значениями наклона графика коэффициента усиления в позициях выборок коэффициентов усиления, и получения различий между значением коэффициента усиления в точке пересечения прямых линий, полученным для двух позиций выборок коэффициентов усиления, и значениями коэффициента усиления в двух позициях выборок коэффициента усиления. Когда информация интерполяции представляет собой информацию, показывающую, что значение коэффициента усиления получается путем линейной интерполяции, блок обработки интерполяции можно заставить получить значение коэффициента усиления путем линейной интерполяции, и, когда информация интерполяции представляет собой информацию, показывающую, что значение коэффициента усиления получается путем нелинейной интерполяции, блок обработки интерполяции можно заставить получить значение коэффициента усиления путем нелинейной интерполяции или линейной интерполяции в соответствии с различиями.
Способ декодирования или программа согласно первому аспекту настоящей технологии включает в себя этапы, на которых: считывают кодированные значения коэффициентов усиления по меньшей мере в двух позициях выборок коэффициента усиления сигнала в виде временной последовательности; считывают информацию интерполяции, показывающую, получается ли значение коэффициента усиления в каждой позиции выборки сигнала в виде временной последовательности путем линейной интерполяции или путем нелинейной интерполяции; и получают значения коэффициента усиления в каждой позиции выборки, расположенной между двумя позициями выборок коэффициента усиления сигнала в виде временной последовательности на основании значений коэффициентов усиления в позициях выборок коэффициента усиления, путем линейной интерполяции или нелинейной интерполяции согласно информации интерполяции.
Согласно первому аспекту настоящей технологии считываются кодированные значения коэффициента усиления по меньшей мере в двух позициях выборок коэффициента усиления сигнала в виде временной последовательности. Считывается информация интерполяции, показывающая, получается ли значение коэффициента усиления в каждой позиции выборки сигнала в виде временной последовательности путем линейной интерполяции или путем нелинейной интерполяции. Значение коэффициента усиления в каждой позиции выборки, расположенной между двумя позициями выборок коэффициента усиления сигнала в виде временной последовательности на основании значений коэффициентов усиления в позициях выборок коэффициента усиления, получается путем линейной интерполяции или нелинейной интерполяции согласно информации интерполяции.
Устройство декодирования согласно второму аспекту настоящей технологии включает в себя: блок считывания коэффициентов усиления, выполненный с возможностью считывания кодированных значений коэффициентов усиления по меньшей мере в двух позициях выборок коэффициента усиления сигнала в виде временной последовательности и значений наклона графика коэффициента усиления, показывающих наклон значений коэффициентов усиления; операционный блок, выполненный с возможностью получения в позициях выборок коэффициента усиления прямых линий, имеющих значения коэффициента усиления в позициях выборок коэффициента усиления и имеющих наклон, указанный значениями наклона графика коэффициента усиления в позициях выборок коэффициента усиления, и получения различий между значением коэффициента усиления в точке пересечения прямых линий, полученных для двух позиций выборок коэффициентов усиления, и значениями коэффициента усиления в двух позициях выборок коэффициента усиления; и блок обработки интерполяции, выполненный с возможностью получения значения коэффициента усиления в каждой позиции выборки, расположенной между двумя позициями выборок коэффициента усиления сигнала в виде временной последовательности, путем линейной интерполяции или нелинейной интерполяции в соответствии с различиями.
Способ декодирования или программа согласно второму аспекту настоящей технологии включает в себя этапы, на которых: считывают кодированные значения коэффициентов усиления по меньшей мере в двух позициях выборок коэффициента усиления сигнала в виде временной последовательности и значений наклона графика коэффициента усиления, показывающих наклон значений коэффициентов усиления; получают в позициях выборок коэффициента усиления прямые линии, имеющие значения коэффициента усиления в позиции выборки коэффициента усиления и имеющие наклон, указанный значениями наклона графика коэффициента усиления в позициях выборок коэффициента усиления, и получают различия между значением коэффициента усиления в точке пересечения прямых линий, полученных для двух позиций выборок коэффициентов усиления, и значениями коэффициента усиления в двух позициях выборок коэффициента усиления; и получение значения коэффициента усиления в каждой позиции выборки, расположенной между двумя позициями выборок коэффициента усиления сигнала в виде временной последовательности, путем линейной интерполяции или нелинейной интерполяции в соответствии с различиями.
Согласно второму аспекту настоящей технологии считываются кодированные значения коэффициента усиления по меньшей мере в двух позициях выборок коэффициента усиления сигнала в виде временной последовательности и значения наклона графика коэффициента усиления, показывающие наклон значений коэффициентов усиления. Получены, в позициях выборок коэффициента усиления, прямые линии, имеющие значения коэффициента усиления в позициях выборок коэффициента усиления и имеющие наклон, указанный значениями наклона графика коэффициента усиления в позициях выборок коэффициента усиления, и получены различия между значением коэффициента усиления в точке пересечения прямых линий, полученным для двух позиций выборок коэффициентов усиления, и значениями коэффициента усиления в двух позициях выборок коэффициента усиления. Значение коэффициента усиления в каждой позиции выборки, расположенной между двумя позициями выборок коэффициента усиления сигнала в виде временной последовательности, получено путем линейной интерполяции или нелинейной интерполяции в соответствии с различиями.
Преимущественные эффекты изобретения
Согласно первому аспекту и второму аспекту настоящей технологии можно получить звук с более высоким качеством.
Следует отметить, что полезные эффекты не ограничены полезным эффектом, описанным здесь, и могут представлять собой любые полезные эффекты, описанные в настоящем раскрытии.
Краткое описание чертежей
На фиг. 1 показана схема, поясняющая линейную интерполяцию коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 2 показана схема, иллюстрирующая пример графика коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 3 показана схема, поясняющая нелинейную интерполяцию коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 4 показана схема, иллюстрирующая пример конфигурации устройства кодирования согласно варианту осуществления настоящей технологии.
На фиг. 5 показана блок-схема последовательности операций, поясняющая процесс Обработки согласно варианту осуществления настоящей технологии.
На фиг. 6 показана схема, иллюстрирующая характеристики DRC согласно варианту осуществления настоящей технологии.
На фиг. 7 показана схема, иллюстрирующая пример конфигурации устройства декодирования согласно варианту осуществления настоящей технологии.
На фиг. 8 показана блок-схема последовательности операций, поясняющая процесс декодирования согласно варианту осуществления настоящей технологии.
На фиг. 9 показана блок-схема последовательности операций, поясняющая процесс декодирования коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 10 показана схема, иллюстрирующая пример конфигурации устройства декодирования согласно варианту осуществления настоящей технологии.
На фиг. 11 показана блок-схема последовательности операций, поясняющая процесс декодирования коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 12 показана схема, поясняющая интерполяцию графика коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 13 показана схема, поясняющая интерполяцию графика коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 14 показана схема, поясняющая интерполяцию графика коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 15 показана схема, иллюстрирующая пример конфигурации устройства декодирования согласно варианту осуществления настоящей технологии.
На фиг. 16 показана блок-схема последовательности операций, поясняющая процесс декодирования коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 17 показана схема, поясняющая интерполяцию графика коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 18 показана блок-схема последовательности операций, поясняющая процесс декодирования коэффициента усиления согласно варианту осуществления настоящей технологии.
На фиг. 19 показана схема, иллюстрирующая пример конфигурации компьютера согласно варианту осуществления настоящей технологии.
Осуществление изобретения
Ниже, со ссылкой на чертежи, будет описан вариант осуществления, в котором применяется настоящая технология.
Первый вариант осуществления
Краткий обзор настоящей технологии
Настоящая технология относится к технологии кодирования значения коэффициента усиления, когда громкость аудиосигнала корректируется на стороне воспроизведения, мультиплексирования кодовой строки коэффициентов усиления, полученной путем кодирования значения коэффициента усиления, и кодовой строки сигнала, полученной путем кодирования аудиосигнала, и передачи мультиплексированной кодовой строки и к технологии декодирования упомянутой кодовой строки коэффициентов усиления и упомянутой кодовой строки сигнала и коррекции громкости аудиосигнала.
В настоящей технологии, назначая произвольное значение для каждой выборки в пределах кадра аудиосигнала в качестве значения коэффициента усиления для коррекции громкости, можно получить звук с более гладкой временной формой сигнала. Это означает, что можно получить звук с более высоким качеством, которое не вызывает странного ощущения. В данном документе, хотя значение коэффициента усиления для коррекции громкости может иметь значение, выраженное в дБ, или линейное значение, в приведенном ниже описании предполагается, что значение коэффициента усиления представляет собой линейное значение.
Кроме того, после кодирования значения коэффициента усиления, если кодовая строка коэффициентов усиления получается путем кодирования только значений коэффициентов усиления в части позиций выборок, таких, например, как характерные позиции такие как точки перегиба графика коэффициента усиления, и значений коэффициентов усиления, которые располагаются с заданными интервалами среди значений коэффициентов усиления в соответствующих позициях выборок в пределах кадра, можно также уменьшить величину кода кодовой строки коэффициентов усиления.
В этом случае, сторона декодирования кодовой строки коэффициентов усиления должна получать первоначальный график коэффициента усиления, основываясь на значениях коэффициентов усиления в некоторых позициях выборок, полученных путем декодирования кодовой строки коэффициентов усиления.
В данном случае, в качестве способа получения первоначального графика коэффициента усиления, например, имеется возможный способ получения значений коэффициентов усиления в позициях выборок, которые не включены в кодовую строку коэффициентов усиления, путем выполнения линейной интерполяции, как иллюстрировано на фиг. 1.
Следует отметить, что на фиг. 1 значение коэффициента усиления отложено по вертикальной оси, и позиция выборки в пределах кадра аудиосигнала отложена по горизонтальной оси.
Кроме того, в дальнейшем позиция выборки кодированного значения коэффициента усиления, которое включено в кодовую строку коэффициентов усиления, будет также специально упоминаться как позиция выборки коэффициента усиления. Более того, в дальнейшем точка на графике коэффициента усиления, выраженная кодированной позицией выборки и значением коэффициента усиления, включенного в кодовую строку коэффициентов усиления, будет также упоминаться просто как позиция выборки коэффициента усиления.
В примере, показанном на фиг. 1, информация о позиции G11 выборки коэффициента усиления и позиции G12 выборки коэффициента усиления получается путем декодирования кодовой строки коэффициентов усиления.
В данном случае значение коэффициента усиления в k-ой позиции выборки коэффициента усиления в пределах кадра устанавливается в виде g[k], и длина выборки (число выборок) в направлении оси выборки от k-ой позиции выборки коэффициента усиления до k+1-ой позиции выборки коэффициента усиления будет выражаться в виде Т[k].
В случае, когда предполагается, что позиция выборки k-ой позиции G11 выборки коэффициента усиления составляет n=0, позиция G11 выборки коэффициента усиления представляет собой точку, выраженную координатой (0, g[k]), и позиция G12 выборки коэффициента усиления представляет собой точку, выраженную координатой (Т[k], g[k+1]). В данном случае n представляет собой индекс, показывающий n-ую позицию выборки из части заголовка кадра.
Кроме того, график коэффициента усиления между позицией G11 выборки коэффициента усиления и позицией G12 выборки коэффициента усиления, полученной путем линейной интерполяции, принимает форму сигнала, показанную прямой линией L11. То есть между позицией G11 выборки коэффициента усиления и позицией G12 выборки коэффициента усиления значение коэффициента усиления в каждой позиции выборки получается путем интерполяции при условии, что значение коэффициента усиления изменяется по линейному закону.
Однако, если график коэффициента усиления оценивается с помощью линейной интерполяции, например, как показано кривой C11 на фиг. 2, то при кодировании гладкого графика коэффициента усиления увеличивается число точек, подлежащих кодированию, на графике коэффициента усиления, то есть число позиций выборок коэффициентов усиления. Следует отметить, что на фиг. 2 по вертикальной оси отложено значение коэффициента усиления, и по горизонтальной оси отложена позиция выборки в пределах кадра аудиосигнала.
В этом примере, так как график коэффициента усиления, показанный кривой C11, представляет собой гладкий график, если сторона декодирования пытается воспроизводить график коэффициента усиления с определенным уровнем точности, необходимо кодировать значения коэффициентов усиления во многих позициях выборок коэффициентов усиления. Это позволяет увеличить величину кода битового потока, полученного путем мультиплексирования кодовой строки коэффициентов усиления и кодовой строки сигнала, то есть увеличить скорость передачи битов.
Поэтому в настоящей технологии для того, чтобы можно было получить звук с более высоким качеством при меньшей величине кода, в дополнение к линейной интерполяции при необходимости вновь выполняется нелинейная интерполяция. То есть график коэффициента усиления вырабатывается путем выполнения процесса интерполяции с использованием более подходящего способа, выбранного между линейной интерполяцией и нелинейной интерполяцией. Следует отметить, что нелинейная интерполяция может представлять собой, например, интерполяцию, использующую квадратичную функцию или кубическую функцию.
Например, когда выполняется нелинейная интерполяция с использованием кубической функции, график, показанный кривой С21 на фиг. 3, можно получить в виде графика коэффициента усиления между позицией G11 выборки коэффициента усиления и позицией G12 выборки коэффициента усиления, как показано на фиг. 1. Следует отметить, что на фиг. 3 по вертикальной оси отложено значение коэффициента усиления, и по горизонтальной оси отложена позиция выборки в пределах кадра аудиосигнала. Кроме того, на фиг. 3 такие же ссылочные позиции, как и на фиг. 1, обозначают части, соответствующие частям на фиг. 1, и при необходимости их объяснение будет опущено.
В этом примере кодовая строка коэффициентов усиления включает в себя информацию, показывающую позицию выборки, значение коэффициента усиления и значение наклона графика коэффициента усиления в позиции G11 выборки коэффициента усиления, и информацию, показывающую позицию выборки, значение коэффициента усиления и значение наклона графика коэффициента усиления в позиции G12 выборки коэффициента усиления.
В данном случае значение наклона графика коэффициента усиления представляет собой информацию, показывающую наклон первоначального графика коэффициента усиления в позиции выборки коэффициента усиления. В дальнейшем значение наклона графика коэффициента усиления в k-ой позиции выборки коэффициента усиления будет выражено в виде s[k].
На фиг. 3 стрелка D11 показывает значение s[k] наклона характеристики коэффициента усиления в позиции G11 выборки коэффициента усиления, и стрелка D12 показывает значение наклона характеристики коэффициента усиления s[k+1] в позиции G12 выборки коэффициента усиления.
На стороне декодирования график коэффициента усиления между позицией G11 выборки коэффициента усиления и позицией G12 выборки коэффициента усиления получается путем нелинейной интерполяции с использованием кубической функции, и в результате получается график коэффициента усиления, показанный кривой С21.
График коэффициента усиления, показанный кривой С21, представляет собой, например, кривую кубической функции, которая проходит через позицию G11 выборки коэффициента усиления и позицию G12 выборки коэффициента усиления, и чей наклон в позиции G11 выборки коэффициента усиления и позиции G12 выборки коэффициента усиления представляет собой соответственно s[k] и s[k+1].
Таким образом, используя при необходимости нелинейную интерполяцию даже в том случае, когда график коэффициента усиления представляет собой гладкий график, можно воспроизвести график коэффициента усиления с высокой точностью за счет кодирования меньшего количества позиций выборок коэффициентов усиления, то есть с меньшей величиной кода.
В настоящей технологии, например, в качестве параметра для переключения между линейной интерполяцией и нелинейной интерполяцией, в кодовую строку коэффициентов усиления включена информация о режиме интерполяции, показывающая схему интерполяции, использующую линейную интерполяцию, или схему интерполяции, использующую нелинейную интерполяцию. Сторона декодирования осуществляет переключение между линейной интерполяцией и нелинейной интерполяцией согласно этой информации о режиме интерполяции.
В данном случае информация о режиме интерполяции может представлять собой, например, индекс из двух битов для переключения среди линейной интерполяции, интерполяции, использующей квадратичную функцию, и интерполяции, использующей кубическую функцию, или может представлять собой флаг из одного бита для переключения между линейной интерполяцией и интерполяцией, использующей кубическую функцию, которая представляет собой нелинейную интерполяцию. То есть в качестве информации о режиме интерполяции можно использовать любую информацию, если информация показывает способ интерполяции графика коэффициента усиления.
Кроме того, в настоящей технологии, когда информация о режиме интерполяции представляет собой информацию, показывающую схему интерполяции, использующей нелинейную интерполяцию, в дополнение к значению коэффициента усиления в кодовую строку коэффициентов усиления для каждой позиции выборки коэффициента усиления включено значение наклона графика коэффициента усиления.
В данном случае значение s[k] наклона графика коэффициента усиления показывает изменение значения коэффициента усиления в расчете на одну выборку. Например, значение s[k] наклона графика коэффициента усиления в k-ой позиции выборки коэффициента усиления представляет собой наклон прямой линии, которая соединяет точку на графике коэффициента усиления в k-ой позиции выборки коэффициента усиления и точку на графике коэффициента усиления в следующей позиции выборки k-ой позиции выборки коэффициента усиления. Следует отметить, что значение наклона графика коэффициента усиления можно получить, используя любой способ, если значение наклона графика коэффициента усиления показывает наклон в позиции выборки коэффициента усиления на графике коэффициента усиления.
Следует отметить, что в кодовой строке коэффициентов усиления может храниться значение наклона графика коэффициента усиления, или в кодовой строке коэффициентов усиления может храниться значение квантования для значения наклона графика коэффициента усиления или кодированное значение энтропии, такое как кодированное значение Хаффмана, для значения наклона графика коэффициента усиления.
Линейная интерполяция
Кроме того, ниже будут описаны конкретные примеры способа выполнения линейной интерполяции и способа выполнения нелинейной интерполяции в отношении значения коэффициента усиления в каждой позиции выборки между двумя позициями выборок коэффициентов усиления. Сначала будет описан способ выполнения линейной интерполяции.
Когда линейная интерполяция выполняется с использованием информации о режиме интерполяции, на стороне декодирования считывается значение коэффициента усиления для каждой позиции выборки коэффициента усиления из кодовой строки коэффициентов усиления.
В данном случае индекс в k-ой позиции выборки коэффициента усиления устанавливается в виде k, и значение коэффициента усиления в k-ой позиции выборки коэффициента усиления, считанной из кодовой строки коэффициентов усиления, устанавливается в виде g[k]. Кроме того, длина выборки между k-ой позицией выборки коэффициента усиления и k+1-ой позицией выборки коэффициента усиления устанавливается в виде Т[k], и предполагается, что длина выборки Т[k] включена в кодовую строку коэффициентов усиления в качестве информации, показывающей позицию выборки k+1-ой позиции выборки коэффициента усиления.
Теперь предположим, что k-ая позиция выборки коэффициента усиления представляет собой позицию заголовка кадра, то есть позицию выборки n=0. В таком случае значение g_interpolated[n] коэффициента усиления выборки n, которая располагается между k-ой позицией выборки коэффициента усиления и k+1-ой позицией выборки коэффициента усиления и которая представляет собой n-ую (где 0≤n<Т[k]) выборку из части заголовка, вычисляется с использованием следующего уравнения (1).
Математическое выражение 1
Следует отметить, что в уравнении (1) а[k] и b[k] представляют собой значения, полученные соответственно с использованием уравнения (2) и уравнения (3), которые приведены ниже.
Математическое выражение 2
Математическое выражение 3
То есть а[k] и b[k] показывают наклон и точку пересечения прямой линии, соединяющей k-ую позицию выборки коэффициента усиления и k+1-ую позицию выборки коэффициента усиления. Поэтому в этом примере, как описано со ссылкой на фиг. 1, определяется, что значение коэффициента усиления изменяется по линейному закону между k-ой позицией выборки коэффициента усиления и k+1-ой позицией выборки коэффициента усиления, и значение коэффициента усиления каждой выборки n получается путем линейной интерполяции.
Нелинейная интерполяция
Далее будет описан случай, где значение коэффициента усиления выборки n между k-ой позицией выборки коэффициента усиления и k+1-ой позицией выборки коэффициента усиления получается путем нелинейной интерполяции. Далее описание продолжится для случая, где интерполяция, использующая кубическую функцию, выполняется в качестве примера нелинейной интерполяции.
Когда нелинейная интерполяция выполняется согласно информации о режиме интерполяции, на стороне декодирования значение коэффициента усиления и значение наклона графика коэффициента усиления считываются из кодовой строки коэффициентов усиления для каждой позиции выборки коэффициента усиления.
Здесь, таким же образом, как и в случае линейной интерполяции, значение коэффициента усиления в k-ой позиции выборки коэффициента усиления устанавливается в виде g[k], и длина выборки между k-ой позицией выборки коэффициента усиления и k+1-ой позицией выборки коэффициента усиления устанавливается в виде Т[k]. Кроме того, значение наклона графика коэффициента усиления в k-ой позиции выборки коэффициента усиления устанавливается в виде s[k].
Теперь предположим, что k-ая позиция выборки коэффициента усиления представляет собой позицию заголовка кадра, то есть позицию выборки n=0. В таком случае значение g_interpolated[n] коэффициента усиления выборки n, которая располагается между k-ой позицией выборки коэффициента усиления и k+1-ой позицией выборки коэффициента усиления и которая представляет собой n-ую (где 0≤n<Т[k]) выборку из части заголовка, вычисляется с использованием следующего уравнения (4).
Математическое выражение 4
Следует отметить, что в уравнении (4) c[k], d[k], е[k] и f[k] представляют собой значения, полученные соответственно с использованием следующих уравнений (5)-(8).
Математическое выражение 5
Математическое выражение 6
Математическое выражение 7
Математическое выражение 8
В этом примере, как описано со ссылкой на фиг. 3, значение коэффициента усиления каждой выборки n получается путем нелинейной интерполяции, то есть интерполяции, использующей кубическую функцию при условии, что значение коэффициента усиления изменяется согласно кубической функции, показанной в уравнении (4) между k-ой позицией выборки коэффициента усиления и k+1-ой позицией выборки коэффициента усиления.
Как описано выше, получая при необходимости значение коэффициента усиления путем нелинейной интерполяции, гладкий график коэффициента усиления, который иллюстрирован, например, на фиг. 2, можно кодировать с более низкой скоростью передачи битов, поэтому можно повысить эффективность кодирования.
Пример конфигурации устройства кодирования
Далее будет описан конкретный вариант осуществления, в котором применяется настоящая технология, описанная выше.
На фиг. 4 показана схема, иллюстрирующая пример конфигурации варианта осуществления устройства кодирования, в котором применяется настоящая технология.
Устройство 11 кодирования имеет схему 21 вычисления уровня звукового давления, схему 22 вычисления коэффициента усиления, схему 23 кодирования коэффициента усиления, схему 24 кодирования сигнала и схему 25 мультиплексирования.
Схема 21 вычисления уровней звукового давления вычисляет уровни звукового давления каналов, образующих входной сигнал в виде временной последовательности на основании входного сигнала в виде временной последовательности, который представляет собой подаваемый многоканальный аудиосигнал, и получает репрезентативное значение уровней звукового давления для каждого из каналов в качестве репрезентативного уровня звукового давления.
Следует отметить, что репрезентативное значение уровней звукового давления получается для каждого кадра входного сигнала в виде временной последовательности. Кроме того, кадр, который используется в качестве блока обработки в схеме 21 вычисления уровней звукового давления, синхронизирован с кадром входного сигнала в виде временной последовательности, который подлежит обработке в схеме 24 кодирования сигнала, которая будет описана позже, и вырабатывает кадр, имеющий длину короче, чем длина кадра в схеме 24 кодирования сигнала.
Схема 21 вычисления уровней звукового давления подает полученный репрезентативный уровень звукового давления в схему 22 вычисления коэффициента усиления. Репрезентативный уровень звукового давления, полученный таким образом, показывает репрезентативный уровень звукового давления каналов входного сигнала в виде временной последовательности, который образован с помощью аудиосигнала с заданным числом каналов, такого, например, как канал 11.1 ch.
Схема 22 вычисления коэффициента усиления вычисляет значение коэффициента усиления на основании репрезентативного уровня звукового давления, подаваемого из схемы 21 вычисления уровней звукового давления, и подает значение коэффициента усиления в схему 23 кодирования коэффициента усиления.
В данном случае значение коэффициента усиления показывает значение коэффициента усиления для коррекции громкости входного сигнала в виде временной последовательности для того, чтобы можно было получить звук с подходящей громкостью в случае, когда входной сигнал в виде временной последовательности воспроизводится на стороне декодирования, и значение коэффициента усиления вычисляется для каждой позиции выборки в пределах кадра в схеме 22 вычисления коэффициента усиления.
Схема 23 кодирования коэффициента усиления кодирует значение коэффициента усиления, поданное из схемы 22 вычисления коэффициента усиления, и подает кодовую строку коэффициентов усиления, полученную в результате кодирования, в схему 25 мультиплексирования.
В данном случае кодовая строка коэффициентов усиления включает в себя информацию о коэффициенте усиления для получения значения коэффициента усиления каждой позиции выборки коэффициента усиления и информацию о режиме интерполяции.
Схема 24 кодирования сигнала кодирует подаваемый входной сигнал в виде временной последовательности, используя заданную схему кодирования, например, способ кодирования, типичным примером которого служит способ кодирования, использующий AAC MPEG, и подает кодовую строку сигнала, полученную в результате кодирования в схеме 25 мультиплексирования.
Схема 25 мультиплексирования мультиплексирует кодовую строку коэффициентов усиления, которая подается из схемы 23 кодирования коэффициента усиления, и кодовую строку сигнала, которая подается из схемы 24 кодирования сигнала, и выводит выходную кодовую строку, полученную в результате мультиплексирования.
Описание процесса кодирования
Далее будет описана конкретная работа устройства 11 кодирования.
Когда подается входной сигнал в виде временн