Кодер
Иллюстрации
Показать всеИзобретение относится к устройствам кодирования. Технический результат заключается в повышении эффективности и точности кодирования сигналов. Такой результат достигается тем, что устройство содержит вход для приема аудиосигнала; кодер низкочастотной области для кодирования низкочастотной области аудиосигнала; кодер высокочастотной области для кодирования высокочастотной области аудиосигнала путем выполнения операции вставки и кодирования одночастотных компонент, когда контроллер тонального выбора указывает, что аудиосигнал тональный, и выполнения выбора копии полосы, масштабирования копии полосы и вставки одночастотных компонент, когда контроллер тонального выбора указывает, что аудиосигнал нормальный; и контроллер для выбора по меньшей мере двух из упомянутых одночастотных компонент и для формирования индикатора, при этом индикатор сконфигурирован для представления упомянутых по меньшей мере двух одночастотных компонент, а также сконфигурирован зависимым от частотного интервала между двумя одночастотными компонентами. 8 н. и 14 з.п. ф-лы, 9 ил.
Реферат
Область техники
Настоящее изобретение относится к кодированию и, в частности, но не исключительно, к кодированию речи или звука.
Уровень техники
Аудиосигналы, такие как речь или музыка, кодируют, к примеру, для обеспечения возможности их эффективной передачи или хранения.
Для представления аудиосигналов, таких как музыка и фоновый шум, используются кодеры и декодеры. Эти типы кодеров обычно не используют для процесса кодирования речевую модель, а используют процессы для представления всех типов аудиосигналов, включая речь.
Речевые кодеры и декодеры (кодеки) обычно оптимизированы для речевых сигналов и могут работать как с постоянным, так и с переменным битрейтом.
Аудиокодек также может быть сконфигурирован для работы с варьируемыми битрейтами. На низких битрейтах такой аудиокодек может работать с речевыми сигналами на скорости кодирования, эквивалентной чисто речевому кодеку. На более высоких битрейтах аудиокодек может кодировать любой сигнал, включая музыку, фоновый шум и речь, с более высоким качеством и характеристиками.
В некоторых аудиокодеках входной сигнал делится на ограниченное количество полос. Каждая из полос может квантоваться. Из теории психоакустики известно, что самые высокие частоты спектра менее важны для восприятия, чем низкие. В некоторых аудиокодеках это отражается битовым распределением, где высокочастотным сигналам назначается меньшее количество битов, нежели низкочастотным.
Помимо этого некоторые кодеки для улучшения эффективности кодирования используют корреляцию между низкочастотными и высокочастотными полосами или областями аудиосигнала.
Обычно высокочастотные полосы достаточно похожи на низкочастотные, и некоторые кодеки могут кодировать только низкочастотные полосы и воспроизводить полосы высоких частот в виде масштабированной копии низкочастотных полос. Таким образом, используя лишь небольшое количество дополнительной управляющей информации, можно достичь значительного сокращения суммарного битрейта кодека.
Один такой кодек для кодирования высокочастотной области известен как кодирование высокочастотной области (HFR - higher frequency region). Одним из способов кодирования высокочастотной области является копирование спектральной полосы (SBR - spectral-band-replication), разработанное компанией Coding Technologies. В случае SBR известный аудиокодер, такой как Moving Pictures Expert Group MPEG-4 Advanced Audio Coding (AAC) или MPEG-1 Layer III (МР3), кодирует низкочастотную область. Высокочастотная область формируется отдельно при помощи кодированной низкочастотной области.
При кодировании SBR высокочастотная область получается переносом низкочастотной области в сторону высоких частот. Перенос основан на блоке квадратурных зеркальных фильтров (QMF - Quadrature Mirror Filter) с 32 полосами и осуществляется так, что заранее задано, из каких отсчетов полосы сформирован каждый отсчет высокочастотной полосы. Это выполняется независимо от характеристик входного сигнала.
Высокочастотные полосы модифицируют, исходя из дополнительной информации. Для того чтобы сделать отдельные свойства синтезированной высокочастотной области более похожими на исходные, осуществляется фильтрация. Для увеличения схожести с оригинальной высокочастотной областью в высокочастотную область вносятся дополнительные компоненты, такие как синусоиды или шум. В конце концов, огибающая настраивается для соответствия огибающей исходного высокочастотного спектра.
Тем не менее, кодирование высокочастотной области не создает идентичной копии оригинальной высокочастотной области. Говоря конкретнее, известные механизмы кодирования высокочастотной области выполняются относительно несовершенно, если входной сигнал тональный, другими словами, не имеет шумоподобного спектра.
Сущность изобретения
Настоящее изобретение исходит из того, что известным кодекам не хватает гибкости в возможности эффективного и точного кодирования аппроксимаций сигналов.
Варианты настоящего изобретения предназначены для решения указанной проблемы.
В соответствии с первым аспектом изобретения предлагается кодер для кодирования аудиосигнала, при этом кодер сконфигурирован для:
определения множества одночастотных компонент; выбора по меньшей мере одной одночастотной компоненты из первого подмножества множества одночастотных компонент.
Кодер также может быть сконфигурирован для формирования по меньшей мере одного первого индикатора для представления по меньшей мере одной выбранной одночастотной компоненты.
Кодер также может быть сконфигурирован для выбора по меньшей мере одной дополнительной одночастотной компоненты из по меньшей мере второго подмножества множества одночастотных компонент.
Кодер также может быть сконфигурирован для формирования по меньшей мере одного второго индикатора для представления по меньшей мере одной выбранной дополнительной одночастотной компоненты.
Кодер также может быть сконфигурирован для разделения множества одночастотных компонент по меньшей мере на первое и второе подмножества одночастотных компонент.
Кодер также может быть сконфигурирован для разделения множества одночастотных компонент по меньшей мере на первое и второе подмножества одночастотных компонент в зависимости от частоты одночастотной компоненты в множестве.
Кодер также может быть сконфигурирован для разделения множества одночастотных компонент по меньшей мере на первое и второе подмножества одночастотных компонент в зависимости от перцепционной значимости одночастотной компоненты в множестве.
Одночастотные компоненты предпочтительно являются синусоидами.
В соответствии со вторым аспектом изобретения представлен способ кодирования аудиосигнала, включающий: определение множества одночастотных компонент; выбор по меньшей мере одной одночастотной компоненты из первого подмножества множества одночастотных компонент.
Способ также может включать формирование по меньшей мере одного первого индикатора для представления по меньшей мере одной выбранной одночастотной компоненты.
Способ также может включать выбор по меньшей мере одной дополнительной одночастотной компоненты из по меньшей мере второго подмножества множества одночастотных компонент.
Способ также может включать формирование по меньшей мере одного второго индикатора для представления по меньшей мере одной выбранной дополнительной одночастотной компоненты.
Способ также может включать разделение множества одночастотных компонент по меньшей мере на первое и второе подмножества одночастотных компонент.
Разделение множества одночастотных компонент по меньшей мере на первое и второе подмножества одночастотных компонент может зависеть от частоты одночастотной компоненты в множестве.
Разделение множества одночастотных компонент по меньшей мере на первое и второе подмножества одночастотных компонент может зависеть от перцепционной значимости одночастотной компоненты в множестве.
Одночастотные компоненты могут являться синусоидами.
В соответствии с третьим аспектом изобретения представлен декодер для декодирования аудиосигнала, при этом декодер сконфигурирован для: приема по меньшей мере одного индикатора, представляющего по меньшей мере одну одночастотную компоненту из первого подмножества множества одночастотных компонент; и вставки одночастотной компоненты в зависимости от принятого индикатора.
Декодер также может быть сконфигурирован для приема по меньшей мере одного дополнительного индикатора, представляющего по меньшей мере одну дополнительную одночастотную компоненту по меньшей мере из одного дополнительного подмножества одночастотных компонент; и вставки дополнительной одночастотной компоненты в зависимости от принятого дополнительного индикатора.
Декодер также может быть сконфигурирован для приема знакового индикатора, представляющего знак по меньшей мере одной одночастотной компоненты из первого подмножества множества одночастотных компонент.
В соответствии с четвертым аспектом настоящего изобретения представлен способ декодирования аудиосигнала, включающий: прием по меньшей мере одного индикатора, представляющего по меньшей мере одну одночастотную компоненту из первого подмножества множества одночастотных компонент; и вставку по меньшей мере одной одночастотной компоненты в зависимости от принятого индикатора.
Способ также может включать: прием по меньшей мере одного дополнительного индикатора, представляющего по меньшей мере одну дополнительную одночастотную компоненту по меньшей мере из одного дополнительного подмножества одночастотных компонент; и вставку по меньшей мере одной дополнительной одночастотной компоненты в зависимости от принятого дополнительного индикатора.
Способ также может включать прием знакового индикатора, представляющего знак по меньшей мере одной одночастотной компоненты из первого подмножества множества одночастотных компонент.
В соответствии с пятым аспектом изобретения представлено оборудование, содержащее описанный выше кодер.
В соответствии с шестым аспектом изобретения представлено оборудование, содержащее описанный выше декодер.
В соответствии с седьмым аспектом изобретения представлено электронное устройство, содержащее описанный выше кодер.
В соответствии с восьмым аспектом изобретения представлено электронное устройство, содержащее описанный выше декодер.
В соответствии с девятым аспектом изобретения представлен компьютерный программный продукт, сконфигурированный для реализации способа кодирования аудиосигнала, включающего: определение множества одночастотных компонент; выбор по меньшей мере одной одночастотной компоненты из первого подмножества множества одночастотных компонент.
В соответствии с десятым аспектом изобретения представлен компьютерный программный продукт, сконфигурированный для реализации способа декодирования аудиосигнала, включающего: прием по меньшей мере одного индикатора, представляющего по меньшей мере одну одночастотную компоненту из первого подмножества множества одночастотных компонент; и вставку по меньшей мере одной одночастотной компоненты в зависимости от принятого индикатора.
В соответствии с одиннадцатым аспектом изобретения представлен кодер для кодирования аудиосигнала, включающий: средства для определения множества одночастотных компонент; средства для выбора по меньшей мере одной одночастотной компоненты из первого подмножества множества одночастотных компонент.
В соответствии с двенадцатым аспектом изобретения представлен декодер для декодирования аудиосигнала, включающий: средства для приема по меньшей мере одного индикатора, представляющего по меньшей мере одну одночастотную компоненту из первого подмножества множества одночастотных компонент; и средства для вставки одночастотной компоненты в зависимости от принятого индикатора.
В соответствии с тринадцатым аспектом изобретения предлагается кодер для кодирования аудиосигнала, при этом кодер сконфигурирован для: выбора по меньшей мере двух одночастотных компонент; формирования индикатора, который сконфигурирован для представления по меньшей мере двух одночастотных компонент и зависит от частотного интервала между двумя одночастотными компонентами.
Кодер также может быть сконфигурирован для выбора по меньшей мере одной дополнительной одночастотной компоненты; при этом индикатор предпочтительно также сконфигурирован для представления по меньшей мере одной дополнительной одночастотной компоненты; также индикатор предпочтительно сконфигурирован зависимым от частотного интервала между по меньшей мере одной дополнительной одночастотной компонентой и одной из по меньшей мере двух одночастотных компонент.
Индикатор также предпочтительно сконфигурирован зависимым от частоты по меньшей мере одной из двух одночастотных компонент.
Кодер также может быть сконфигурирован для определения частотного интервала между двумя одночастотными компонентами.
Кодер также может быть сконфигурирован для: поиска в списке значений частотного интервала определенного частотного интервала между двумя одночастотными компонентами; и выбора из списка значения, которое наиболее близко к определенному частотному интервалу между двумя одночастотными компонентами, при этом индикатор зависит от выбранного значения из списка значений частотного интервала.
Кодер также может быть сконфигурирован для: определения разности между выбранным значением из списка значений частотного интервала и определенным значением частотного интервала, при этом индикатор предпочтительно также зависит от этой разности.
Кодер также может быть сконфигурирован для: поиска в дополнительном списке значений разности определенной разности между выбранным значением из списка значений частотного интервала и определенным значением частотного интервала; и выбора из дополнительного списка значений разности значения, которое наиболее близко к определенному значению разности, при этом индикатор предпочтительно зависит от выбранного значения из дополнительного списка значений разности.
В соответствии с четырнадцатым аспектом изобретения представлен способ кодирования аудиосигнала, включающий: выбор по меньшей мере двух одночастотных компонент; формирование индикатора, который сконфигурирован для представления по меньшей мере двух одночастотных компонент и зависит от частотного интервала между двумя одночастотными компонентами.
Способ также может включать выбор по меньшей мере одной дополнительной одночастотной компоненты; при этом индикатор предпочтительно также сконфигурирован для представления по меньшей мере одной дополнительной одночастотной компоненты; также индикатор предпочтительно сконфигурирован зависимым от частотного интервала между по меньшей мере одной дополнительной одночастотной компонентой и одной из по меньшей мере двух одночастотных компонент.
Индикатор также может зависеть от частоты одной из по меньшей мере двух одночастотных компонент.
Способ также может включать определение частотного интервала между двумя одночастотными компонентами.
Способ также может включать: поиск в списке значений частотного интервала определенного значения частотного интервала между двумя одночастотными компонентами; и выбор из списка значения, которое наиболее близко к определенному частотному интервалу между двумя одночастотными компонентами, при этом индикатор предпочтительно зависит от выбранного значения из списка значений частотного интервала.
Также способ может включать определение разности между выбранным значением из списка значений частотного интервала и определенным значением частотного интервала, при этом индикатор предпочтительно также зависит от этой разности.
Способ также может включать: поиск в дополнительном списке значений разности определенной разности между выбранным значением из списка значений частотного интервала и определенным значением частотного интервала; и выбор из дополнительного списка значений разности значения, которое наиболее близко к определенной величине разности, при этом индикатор предпочтительно зависит от выбранного значения из дополнительного списка значений разности.
В соответствии с пятнадцатым аспектом изобретения представлен декодер для декодирования аудиосигнала, при этом декодер сконфигурирован для: приема по меньшей мере одного индикатора, представляющего по меньшей мере две одночастотные компоненты, при этом индикатор представляет частотный интервал между двумя одночастотными компонентами; и вставки по меньшей мере двух одночастотных компонент в зависимости от принятого индикатора.
По меньшей мере один индикатор также предпочтительно сконфигурирован для представления по меньшей мере одной дополнительной одночастотной компоненты; также индикатор предпочтительно сконфигурирован зависимым от частотного интервала между по меньшей мере одной дополнительной одночастотной компонентой и одной из по меньшей мере двух одночастотных компонент; а декодер предпочтительно сконфигурирован для вставки по меньшей мере одной дополнительной одночастотной компоненты в зависимости от индикатора.
В соответствии с шестнадцатым аспектом настоящего изобретения представлен способ декодирования аудиосигнала, включающий: прием по меньшей мере одного индикатора, представляющего по меньшей мере две одночастотные компоненты, при этом индикатор представляет частотный интервал между двумя одночастотными компонентами; и вставку по меньшей мере двух одночастотных компонент в зависимости от принятого индикатора.
По меньшей мере один индикатор также предпочтительно сконфигурирован для представления по меньшей мере одной дополнительной одночастотной компоненты; также индикатор предпочтительно сконфигурирован зависимым от частотного интервала между по меньшей мере одной дополнительной одночастотной компонентой и одной из по меньшей мере двух одночастотных компонент; способ также может включать вставку по меньшей мере одной дополнительной одночастотной компоненты в зависимости от индикатора.
В соответствии с семнадцатым аспектом изобретения представлено оборудование, содержащее описанный выше кодер.
В соответствии с восемнадцатым аспектом изобретения представлено оборудование, содержащее описанный выше декодер.
В соответствии с девятнадцатым аспектом изобретения представлено электронное устройство, содержащее описанный выше кодер.
В соответствии с двадцатым аспектом изобретения представлено электронное устройство, содержащее описанный выше декодер.
В соответствии с двадцать первым аспектом изобретения представлен компьютерный программный продукт, сконфигурированный для реализации способа кодирования аудиосигнала, включающего: выбор по меньшей мере двух одночастотных компонент; формирование индикатора, который сконфигурирован для представления по меньшей мере двух одночастотных компонент и зависит от частотного интервала между двумя одночастотными компонентами.
В соответствии с двадцать вторым аспектом изобретения представлен компьютерный программный продукт, сконфигурированный для реализации способа декодирования аудиосигнала, включающего: прием по меньшей мере одного индикатора, представляющего по меньшей мере две одночастотные компоненты, при этом индикатор представляет частотный интервал между двумя одночастотными компонентами; и вставку по меньшей мере двух одночастотных компонент в зависимости от принятого индикатора.
В соответствии с двадцать третьим аспектом изобретения представлен кодер для кодирования аудиосигнала, включающий: средства для выбора по меньшей мере двух одночастотных компонент; средства для формирования индикатора, который сконфигурирован для представления по меньшей мере двух одночастотных компонент и зависит от частотного интервала между двумя одночастотными компонентами.
В соответствии с двадцать четвертым аспектом изобретения представлен декодер для декодирования аудиосигнала, включающий: средства для приема по меньшей мере одного индикатора, представляющего по меньшей мере две одночастотные компоненты, при этом индикатор представляет частотный интервал между двумя одночастотными компонентами; и средства для вставки по меньшей мере двух одночастотных компонент в зависимости от принятого индикатора.
Краткое описание чертежей
Для лучшего ознакомления с настоящим изобретением в качестве примеров будут даваться ссылки на приложенные чертежи, на которых:
фиг.1 - схематическое изображение электронного устройства, использующего варианты осуществления настоящего изобретения;
фиг.2 - схематическое изображение системы аудиокодека, использующего варианты осуществления настоящего изобретения;
фиг.3 - схематическое изображение кодирующей части системы аудиокодека, показанной на фиг.2;
фиг.4 - схематическое изображение высокочастотной области в части кодера, показанного на фиг.3;
фиг.5 - схематическое изображение декодирующей части системы аудиокодека;
фиг.6 - блок-схема, показывающая функционирование варианта осуществления аудиокодера, изображенного на фиг.3 и 4, в соответствии с настоящим изобретением;
фиг.7 - блок-схема, показывающая функционирование варианта осуществления аудиодекодера, изображенного на фиг.5, в соответствии с настоящим изобретением;
фиг.8 - примеры спектрального представления аудиосигнала, вставленных синусоидальных позиций и кодирования синусоидальных позиций в соответствии с вариантами осуществления изобретения;
фиг.9 - другие примеры спектрального представления аудиосигнала и вставленных синусоидальных позиций в соответствии с вариантами осуществления изобретения.
Описание предпочтительных вариантов осуществления изобретения
Далее более подробно описаны возможные механизмы работы кодеков для реализации многоуровневых или масштабируемых аудиокодеков с переменной скоростью. В данном отношении сначала следует сделать ссылку на фиг.1, на которой показана схематичная блок-схема примера электронного устройства 10, которое может включать кодек в соответствии с вариантом осуществления изобретения.
Электронное устройство 10, в качестве примера, может являться мобильным терминалом или пользовательским оборудованием беспроводной системы связи.
Электронное устройство 10 содержит микрофон 11, который через аналого-цифровой преобразователь (АЦП) 14 соединен с процессором 21. Процессор 21 через цифроаналоговый преобразователь (ЦАП) 32 соединен с громкоговорителями 33.
Также процессор 21 соединен с приемопередатчиком (RX/TX) 13, пользовательским интерфейсом 15 и памятью 22.
Процессор 21 может быть сконфигурирован для выполнения различных программных кодов. Выполняемые программные коды включают код для кодирования звука, необходимый для кодирования низкочастотной и высокочастотной полос аудиосигнала. Выполняемые программные коды 23 также включают код для декодирования звука. Выполняемые программные коды 23 могут храниться, например, в памяти 22, чтобы процессор 21 имел доступ к ним при необходимости. Память 22 может также иметь раздел 24 хранения данных, например, данных, кодированных в соответствии с настоящим изобретением.
Код для кодирования и декодирования в различных вариантах изобретения может быть реализован на основе аппаратного или встроенного программного обеспечения.
Пользовательский интерфейс 15 позволяет пользователю вводить команды для электронного устройства 10, например, при помощи клавиатуры, и получать от него информацию, например, через экран. Приемопередатчик 13 обеспечивает связь с другими электронными устройствами, например, через сеть беспроводной связи
Необходимо понимать, что конструкция электронного устройства 10 может дополняться и изменяться множеством способов.
Пользователь электронного устройства 10 для ввода речи может использовать микрофон 11 так, чтобы она передавалась некоторому электронному устройству или сохранялась в разделе 24 хранения данных в памяти 22. С этой целью пользователь через пользовательский интерфейс 15 активизирует соответствующее программное приложение. Приложение, которое может выполняться процессором 21, обеспечивает выполнение процессором 21 кода кодирования, хранящегося в памяти 22.
Аналого-цифровой преобразователь 14 преобразует входной аналоговый аудиосигнал в цифровой аудиосигнал и передает цифровой аудиосигнал процессору 21.
После этого процессор 21 может обрабатывать цифровой сигнал способом, подобным описанному со ссылкой на фиг.2 и 3.
Результирующий битовый поток передается приемопередатчику 13 для передачи в другое электронное устройство. В альтернативном варианте для дальнейшей передачи или предоставления аналогичному электронному устройству 10 кодированные данные могут быть сохранены в разделе 24 хранения данных в памяти 22.
Электронное устройство 10 может также принимать битовый поток с данными от другого электронного устройства, кодированными соответствующим образом, через собственный приемопередатчик 13. В этом случае процессор 21 может выполнять программный код для декодирования, сохраненный в памяти 22. Процессор 21 декодирует принятые данные и отправляет декодированные данные в цифроаналоговый преобразователь 32. Цифроаналоговый преобразователь 32 преобразует декодированные цифровые данные в аналоговые аудиоданные и выводит их через громкоговорители 33. Выполнение программного кода для декодирования может запускаться также с помощью приложения, вызванного пользователем через пользовательский интерфейс 15.
Помимо этого, принятые кодированные данные вместо немедленного воспроизведения через громкоговорители 33 могут сохраняться в разделе 24 хранения данных в памяти 22, в случае необходимости более позднего воспроизведения или передачи еще одному электронному устройству.
Необходимо понимать, что схематичные конструкции, описанные на фиг.2-4, и этапы способов на фиг.7 и 8 представляют только часть работы полного кодека, который в качестве примера реализован в электронном устройстве, изображенном на фиг.1.
Общая работа аудиокодеков, используемых в вариантах осуществления изобретения, показана на фиг.2. Обобщенные системы кодирования/декодирования состоят из кодера и декодера, как схематически показано на фиг.2. Здесь изображена система 102 с кодером 104, запоминающим устройством или медиаканалом 106 и декодером 108.
Кодер 104 сжимает входной аудиосигнал 110, формируя битовый поток 112, который сохраняется или передается по медиаканалу 106. Битовый поток 112 может приниматься декодером 108. Декодер 108 распаковывает битовый поток 112 и формирует выходной аудиосигнал 114. Скорость битового потока 112 и качество выходного аудиосигнала 114 относительно входного сигнала 110 являются основными характеристиками, которые определяют эффективность кодирующей системы 102.
На фиг.3 схематично изображен кодер 104, соответствующий варианту осуществления изобретения. Кодер 104 имеет вход 203, предназначенный для приема аудиосигнала. Вход 203 соединен с низкочастотным фильтром 230 и высокочастотным/полосовым фильтром 235. Низкочастотный фильтр 230 передает сигнал кодеру 231 низкочастотной области (НЧ), также называемому основным кодером. Кодер 231 низкочастотной области сконфигурирован для выдачи сигналов кодеру 232 высокочастотной области (ВЧ). Высокочастотный/полосовой фильтр 235 соединен с ВЧ кодером 232. НЧ кодер 231 и ВЧ кодер 232 сконфигурированы для выдачи сигналов форматеру 234 битового потока (который в некоторых вариантах изобретения также называется мультиплексором битового потока). Форматер 234 битового потока сконфигурирован для выдачи выходного битового потока 112 через выход 205.
В некоторых вариантах осуществления изобретения высокочастотный/полосовой фильтр 235 может являться опциональным, и аудиосигнал передается непосредственно в ВЧ кодер 232.
Функционирование этих компонентов более подробно описано со ссылкой на блок-схему на фиг.6, показывающую работу кодера 104.
Аудиосигнал принимается кодером 104. В первом варианте осуществления изобретения аудиосигнал является цифровым дискретизированным сигналом. В других вариантах настоящего изобретения входные аудиоданные могут являться аналоговым аудиосигналом, например, от микрофона 6, преобразованным из аналогового в цифровой. В других вариантах изобретения входные аудиоданные преобразуются из цифрового сигнала с кодово-импульсной модуляцией в цифровой сигнал с амплитудной модуляцией. Прием аудиосигнала изображен на фиг.7 на этапе 601.
Низкочастотный фильтр 230 и высокочастотный/полосовой фильтр 235 принимают аудиосигнал и определяют частоту среза, до которой фильтруется входной сигнал 110. Частоты принятого аудиосигнала, находящиеся ниже частоты среза, пропускаются низкочастотным фильтром 230 в кодер 231 низкочастотной области (НЧ). Частоты принятого аудиосигнала, находящиеся выше частоты среза, пропускаются высокочастотным фильтром 235 в кодер 232 высокочастотной области (ВЧ). В некоторых вариантах осуществления изобретения дискретизация сигнала опционально понижается с целью увеличения эффективности кодера 231 низкочастотной области.
НЧ кодер 231 получает низкочастотный (и опционально с пониженной дискретизацией) аудиосигнал и применяет к нему подходящее низкочастотное кодирование. В первом варианте осуществления изобретения низкочастотный кодер 231 использует квантование и кодирование Хаффмана с 32 низкочастотными поддиапазонами. Входной сигнал 110 делится на поддиапазоны при помощи блока аналитических фильтров для частотного разложения сигнала. Каждый поддиапазон может квантоваться и кодироваться при помощи информации, предоставленной психоакустической моделью. Параметры квантования, как и схема кодирования, могут определяться примененной психоакустической моделью. Квантованная кодированная информация отправляется в форматер 234 битового потока для создания битового потока 112.
Помимо этого, НЧ кодер 231 преобразует низкочастотный контент при помощи модифицированного дискретного косинусного преобразования (MCDT - modified discrete cosine transform) для формирования реализации синтезированного НЧ сигнала в частотной области. Эти реализации в частотной области передаются на ВЧ кодер 232.
Кодирование низкочастотной области показано на фиг.6 на этапе 606.
В других вариантах осуществления изобретения для формирования выходных данных основного кодирования могут использоваться другие низкочастотные кодеки, которые выводят данные на форматер 234 битового потока. Примерами низкочастотных кодеков в этих вариантах изобретения являются Advanced Audio Coding (AAC), MPEG layer 3 (МРЗ), встроенный базовый кодек для кодирования речи с переменной скоростью ITU-T (EV-VBR) и ITU-T G.729.1.
Если кодер 231 низкочастотной области не обеспечивает эффективного синтезированного выходного сигнала в частотной области в качестве части процесса кодирования, кодер 231 низкочастотной области (НЧ) может также включать низкочастотный декодер и преобразователь частотной области (не показан на фиг.3) для формирования синтезированной копии низкочастотного сигнала. В вариантах осуществления изобретения такие копии затем могут быть преобразованы в представления в частотной области и, при необходимости, разделены на последовательности низкочастотных поддиапазонов, посылаемых ВЧ кодеру 232.
В вариантах осуществления изобретения это обеспечивает возможность выбора кодера 231 низкочастотной области из широкого диапазона всевозможных кодеров/декодеров, и, таким образом, изобретение не ограничено конкретным низкочастотным или основным алгоритмом кодирования, который формирует информацию в частотной области как часть выходных данных.
Кодер 232 высокочастотной области (ВЧ) схематически более подробно показан на фиг.4.
Кодер 232 высокочастотной области принимает от высокочастотного/полосового фильтра 235 сигнал, который поступает на вход процессора 301 модифицированного дискретного косинусного преобразования (MDCT - modified discrete cosine transform) или смещенного дискретного преобразования Фурье (SDFT - shifted discrete Fourier transform).
Частотный выход преобразователя 301 MDCT/SDFT проходит через контроллер 303 тонального выбора, процессор 305 выбора копии полосы в высокочастотной области, процессор 307 масштабирования копии полосы в высокочастотной области, процессор 309 выбора/кодирования синусоидальной вставки.
Контроллер 303 тонального выбора сконфигурирован для управления или настройки процессора 305 выбора копии ВЧ полосы, процессора 307 масштабирования копии ВЧ полосы, процессора 309 выбора/кодирования синусоидальной вставки и мультиплексора 311. Помимо этого процессор 305 выбора копии ВЧ полосы принимает от НЧ кодера 231 синтезированный низкочастотный сигнал в форме частотной области. Процессор 305 выбора копии ВЧ полосы выдает на выходе выбранные ВЧ полосы из НЧ кодера, как будет описано далее, и передает выбранные данные в процессор 307 масштабирования копии ВЧ полосы.
Процессор 307 масштабирования копии ВЧ полосы передает в мультиплексор 311 в кодированной форме выбранные данные и масштабирующие элементы, которые должны быть вставлены в поток 112 данных. Помимо этого процессор 307 масштабирования копии ВЧ полосы передает представление выбранных данных и масштабированную ВЧ полосу в процессор 309 выбора/кодирования синусоидальной вставки. Процессор 309 выбора/кодирования синусоидальной вставки передает сигнал на мультиплексор 311 для включения его в поток 112 выходных данных.
Далее со ссылкой на фиг.6 и 4 будет подробно описана работа ВЧ кодера.
Процессор 301 MDCT/SDFT преобразует высокочастотный аудиосигнал, принятый от высокочастотного/полосового фильтра 235, в представление сигнала в частотной области.
В некоторых вариантах осуществления изобретения процессор MDCT/SDFT также делит высокочастотный аудиосигнал на короткие частотные поддиапазоны. Эти частотные поддиапазоны могут иметь ширину 500-800 Гц. В некоторых вариантах осуществления изобретения частотные поддиапазоны имеют разную ширину полосы. В других вариантах частотные поддиапазоны имеют ширину полосы 750 Гц. В других вариантах изобретения ширина частотных поддиапазонов может быть как равной, так и неравной и может зависеть от назначения частотной полосы для высокочастотной области.
В первом варианте осуществления изобретения ширина частотного поддиапазона постоянна, другими словами, не меняется от кадра к кадру. В других вариантах осуществления изобретения ширина частотного диапазона непостоянна, и частотный поддиапазон может иметь ширину, меняющуюся во времени.
В некоторых вариантах осуществления изобретения расположение переменного частотного поддиапазона может определяться на основании психоакустического моделирования аудиосигнала. Эти частотные поддиапазоны в различных вариантах осуществления изобретения также могут быть последовательными (другими словами, идти один за другим, формируя непрерывную спектральную реализацию) или частично перекрывающими друг друга.
Этап организации поддиапазона и преобразования временной области в частотную показан на фиг.6 как этап 607.
Чтобы кодирование высокочастотной области выполнялось более эффективно, контроллер 303 тонального выбора может быть сконфигурирован для управления выбором копии ВЧ полосы, масштабированием, выбором и кодированием синусоидальной вставки, а также управления мультиплексором.
Выходные данные MDCT/SDFT процессора 301 после смещенного дискретного преобразования Фурье принимаются контроллером 303 тонального выбора.
Уравнение 1 является примером смещенного дискретного преобразования Фурье (SDFT), определенного для двух выборок N (которые в предпочтительных вариантах осуществления изобретения могут рассматриваться как кадры):
где h(n) - окно масштабирования, x(n) - исходный входной сигнал, а u и v представляют собой смещение во временной и частотной области соответственно.
В одном варианте осуществления изобретения u и v могут выбираться таким образом, что u=(N+1)/2 и v=1/2, так как реальная часть преобразования SDFT может также использоваться как преобразование MDCT. Таким образом, это позволяет реализовать преобразователь MDCT и преобразователь SDFT в рамках одной операции преобразования из временной в частотную область и, следовательно, упростить устройство.
Контроллер 303 тонального выбора может быть сконфигурирован для определения, является ли входной высокочастотный сигнал нормальным или тональным. Контроллер 303 тонального выбора может определять характеристики сигнала путем сравнения результата SDFT преобразования для текущего и предыдущего кадров.
Например, если текущий и предыдущий кадры SDFT определены как Yb(k) и Yb-1(k) соответственно, подобие кадров может измеряться индексом S. S определяется уравнением 2:
где NL+1 соответст