2316154 - Кодирование стереофонических сигналов

Кодирование стереофонических сигналов

Иллюстрации

Показать все

Изобретение относится к кодированию многоканальных сигналов, более конкретно к кодированию полифонических звуковых сигналов, таких как стереофонические сигналы. Описан способ кодирования многоканального сигнала, такого как стереофонический звуковой сигнал, включающего в себя по меньшей мере первый компонент сигнала (L) и второй компонент сигнала (R). Способ содержит этапы преобразования по меньшей мере первого и второго компонентов сигнала посредством заранее заданного преобразования в главный сигнал (у), включающий в себя большую часть энергии сигнала, и по меньшей мере один остаточный сигнал (r), включающий в себя меньше энергии, чем главный сигнал, причем это заранее заданное преобразование параметризовано по меньшей мере одним параметром преобразования; и представления многоканального сигнала по меньшей мере посредством главного сигнала и параметра преобразования. Дополнительно описаны соответствующее устройство для кодирования многоканальных сигналов и соответствующий способ и устройство для декодирования такого сигнала. Технический результат - кодирование стереофонического сигнала с эффективным расходом битов для заданного качества звучания. 7 н. и 7 з.п. ф-лы, 13 ил.

Реферат

Область техники, к которой относится изобретение

Данное изобретение относится к кодированию многоканальных сигналов, включающих в себя по меньшей мере первый и второй компоненты сигнала. Более конкретно, изобретение относится к кодированию полифонических звуковых сигналов, таких как стереофонические сигналы.

Предшествующий уровень техники

Стереофонические звуковые сигналы содержат левый (L) и правый (R) компоненты сигнала, которые могут исходить от источника стереофонического сигнала, например, от разделенных микрофонов. Кодирование звуковых сигналов нацелено на уменьшение расхода битов (количества битов, приходящегося на секунду потока данных) стереофонического сигнала, например, для того, чтобы позволить осуществлять эффективную передачу звуковых сигналов через сеть связи, такую как Интернет, через модем и аналоговые телефонные линии, каналы мобильной связи или другие беспроводные сети и т.д. и сохранять стереофонический звуковой сигнал на плате для установки интегральной схемы или другом запоминающем носителе с ограниченной емкостью памяти.

Патент США №4589127 раскрывает передатчик для стереофонических сигналов, который генерирует суммарный и разностный сигналы стереофонических сигналов L и R. Суммарный и разностный сигналы впоследствии используются в схеме модуляции, что приводит к модулированному сигналу, содержащему информацию как суммы, так и разности.

Однако вышеупомянутый способ известного уровня техники не ориентирован на проблему кодирования стереофонического сигнала с эффективным расходом битов, то есть с низким расходом битов для заданного качества звучания.

Сущность изобретения

Вышеупомянутые и другие проблемы решаются посредством способа кодирования многоканального сигнала, включающего в себя по меньшей мере первый компонент сигнала и второй компонент сигнала, причем этот способ содержит этапы

- преобразования по меньшей мере первого и второго компонентов сигнала посредством заранее заданного преобразования в главный сигнал, включающий в себя основную часть энергии сигнала, и по меньшей мере один остаточный сигнал, включающий в себя меньше энергии, чем главный сигнал, причем заранее заданное преобразование параметризовано по меньшей мере одним параметром преобразования; и

- представления многоканального сигнала по меньшей мере посредством главного сигнала и параметра преобразования.

Следовательно, посредством преобразования многоканального сигнала в главный сигнал, который включает в себя основную часть энергии, и остаточный сигнал, который включает в себя только малую часть энергии сигнала, многоканальный сигнал может быть представлен посредством главного сигнала, параметра преобразования и, в необязательном порядке, малого остаточного сигнала, что улучшает эффективность кодирования для многоканального сигнала. С точки зрения эффективности, многоканальный сигнал может быть кодирован с расходом битов, который только слегка выше, чем расход битов единственного канала, например, монофонического канала. Результирующий кодированный сигнал может быть сохранен и/или передан к приемнику.

Когда способ дополнительно включает в себя этап адаптивного определения параметра преобразования на основе по меньшей мере первого и второго компонентов сигнала, оптимальный параметр трансформации можно непрерывно отслеживать, что обеспечивает то, что преобразование остается оптимальным, даже если характеристики входного сигнала изменяются, например, в случае звукового сигнала из-за перемещающегося источника звука или изменений в акустических свойствах окружающей среды.

Когда заданным преобразованием является поворот и параметр преобразования соответствует углу поворота, простое преобразование обеспечивается на основе только одного параметра, угла поворота. Посредством адаптации угла таким образом, что компоненты сигнала, например, компоненты L и R стереофонического сигнала, поворачиваются в сигнал главного компонента и остаточный сигнал, эффективное кодирование обеспечивается при поддержании высокого качества сигнала.

В предпочтительном варианте осуществления изобретения этап представления многоканального сигнала по меньшей мере посредством главного сигнала и параметра преобразования дополнительно содержит этап представления многоканального сигнала главным сигналом, параметром преобразования и остаточным сигналом, что дополнительно улучшает качество кодированного сигнала, так как не выбрасывается никакая информация сигнала. Поскольку остаточный сигнал является малым по сравнению с главным сигналом, распределение расхода битов может осуществляться между этими сигналами. Кроме того, поскольку распределение расхода битов может варьироваться, обеспечен механизм постепенного снижения качества, например, посредством адаптивного увеличения или снижения расхода битов, учитываемого для остаточного сигнала.

Следовательно, в дополнительном предпочтительном варианте, этап представления многоканального сигнала главным сигналом, параметром преобразования и остаточным сигналом, дополнительно содержит этапы

- кодирования главного сигнала с первым расходом битов; и

- кодирования остаточного сигнала со вторым расходом битов, меньшим, чем первый расход битов.

В другом предпочтительном варианте способ дополнительно содержит этап оценивания остаточного сигнала на основе главного сигнала с использованием фильтра с предсказанием, соответствующего множеству параметров фильтра; при этом этап представления многоканального сигнала по меньшей мере посредством главного сигнала и параметра преобразования содержит этап представления многоканального сигнала посредством главного сигнала, параметра преобразования и множества параметров фильтра.

Этот вариант осуществления изобретения основан на понимании того, что для многих многоканальных сигналов, например, в случае звуковых сигналов для музыкальных и речевых сигналов, остаточный сигнал может быть оценен как фильтрованная версия главного сигнала. Следовательно, при определении множества параметров адаптивного фильтра, который моделирует остаточный сигнал, параметры фильтра могут быть кодированы вместе с главным сигналом и параметром преобразования. Следовательно, передача остаточного сигнала исключается без потери информации, включенной в этот сигнал, что обеспечивает эффективное кодирование, которое сохраняет высокий уровень качества.

Преимущество изобретения состоит в том, что оно обеспечивает эффективный расход битов, то есть схему кодирования, которая использует низкий расход битов для заданного качества звучания. Схема кодирования согласно изобретению может использоваться для уменьшения расхода битов без значительного снижения качества звучания, для поддержания расхода битов при улучшении качества звучания или для комбинации вышеупомянутых аспектов.

Изобретение дополнительно относится к способу декодирования информации многоканального сигнала, причем этот способ включает в себя этапы

- приема главного сигнала и параметра преобразования, причем главный сигнал соответствует результату заранее заданного преобразования по меньшей мере первого и второго компонентов многоканального исходного сигнала, причем заранее заданное преобразование параметризовано по меньшей мере упомянутым параметром преобразования; и

- генерирования первого и второго компонентов декодированного сигнала посредством обратного преобразования принятого главного сигнала и по меньшей мере одного остаточного сигнала.

Данное изобретение может быть реализовано различными способами, включая способы, описанные выше и далее, устройства для кодирования и декодирования многоканальных сигналов, соответственно, сигнал передачи данных и другие средства, причем каждое из них дает одну или несколько выгод и преимуществ, описанных в сочетании с первым упомянутым способом, и каждое из которых имеет один или несколько предпочтительных вариантов осуществления, соответствующих предпочтительным вариантам осуществления, описанным в сочетании с первым упомянутым способом и раскрытым в зависимых пунктах формулы изобретения.

Отметим, что признание способов, описанных выше и далее, могут быть реализованы в программном обеспечении и осуществлены в системе обработки данных или другом средстве обработки, вызванном посредством выполнения машиноисполняемых команд. Этими командами может быть средство программного кода, загруженное в память, такую как ОЗУ, с запоминающего носителя или от другого компьютера через компьютерную сеть. Альтернативно, описываемые признаки могут быть реализованы схемами с фиксированным монтажом вместо программного обеспечения или в комбинации с программным обеспечением.

Изобретение дополнительно относится к устройству для кодирования многоканального сигнала, включающего в себя по меньшей мере первый компонент сигнала и второй компонент сигнала, причем это устройство содержит

- первое средство обработки, выполненное с возможностью преобразования по меньшей мере первого и второго компонентов сигнала посредством заранее заданного преобразования в главный сигнал, включающий в себя основную часть энергии сигнала и по меньшей мере один остаточный сигнал, включающий в себя меньше энергии, чем главный сигнал, причем заранее заданное преобразование параметризовано по меньшей мере одним параметром преобразования; и

- второе средство обработки, выполненное с возможностью представления многоканального сигнала посредством по меньшей мере главного сигнала и параметра преобразования.

Изобретение дополнительно относится к устройству для декодирования информации многоканального сигнала, причем это устройство содержит

- средство приема для приема главного сигнала и параметра преобразования, причем главный сигнал соответствует результату заранее заданного преобразования первого и второго многоканального исходного сигнала, причем заранее заданное преобразование параметризовано по меньшей мере упомянутым параметром преобразования; и

- средство обработки для генерирования первого и второго многоканального сигнала путем обратного преобразования принятых главного сигнала и остаточного сигнала.

Вышеупомянутые устройства могут быть частью любого электронного оборудования, включая компьютеры, такие как стационарные и портативные персональные компьютеры (ПК), стационарное и портативное оборудование радиосвязи и другие карманные или портативные устройства, такие как мобильные телефоны, пейджеры, аудиопроигрыватели, мультимедийные проигрыватели, средства связи, т.е. электронные органайзеры, интеллектуальные телефоны, персональные цифровые информационные устройства (PDA), карманные компьютеры и т.п.

Термин «средство обработки» содержит программируемые микропроцессоры общего или специального назначения, процессоры цифровых сигналов (DSP), специализированные интегральные схемы (ASIC), программируемые логические матрицы (PLA), вентильные матрицы, программируемые в условиях эксплуатации (FPGA), электронные схемы специального назначения и т.д., или комбинацию вышеперечисленного. Вышеупомянутые первое и второе средства обработки могут быть отдельными средствами обработки или они могут содержаться в одном средстве обработки.

Термин «средство приема» включает в себя схемы и/или устройства, подходящие для обеспечения передачи данных, например, через проводной или беспроводной канал передачи данных. Примеры таких средств приема включают в себя сетевой интерфейс, сетевую плату, радиоприемник, приемник для других соответствующих электромагнитных сигналов, таких как инфракрасный свет, например, через порт Ассоциации передачи данных в инфракрасном диапазоне (IrDA), радиосвязь, например, приемопередатчики Bluetooth, и т.п. Дополнительные примеры такого средства приема включают в себя кабельный модем, телефонный модем, адаптер цифровой сети с интегрированными услугами (ISDN), адаптер цифровой абонентской линии (DSL), спутниковый приемопередатчик, адаптер сети Ethernet и т.п.

Термин «средство приема» дополнительно содержит другие вводные схемы/устройства для приема сигналов передачи данных, например, сигналов передачи данных, хранимых на машиночитаемом носителе. Примеры такого средства приема включают в себя дисковод флоппи-диска, дисковод компакт-диска (CD-ROM), дисковод универсального цифрового диска (DVD) или любой другой подходящий дисковод, адаптер платы памяти, адаптер смарт-карты и т.д.

Изобретение дополнительно относится к сигналу передачи данных, включающему в себя информацию многоканального сигнала, причем этот сигнал передачи данных генерируется способом, описанным выше и далее. Сигнал может быть воплощен как сигнал передачи данных на несущей, например, как сигнал передачи данных, передаваемый средством связи, как описано выше и далее.

Изобретение дополнительно относится к машиночитаемому носителю, содержащему запись данных, показывающую информацию многоканального сигнала, сгенерированную способом, описанным выше и далее. Термин «машиночитаемый носитель» содержит магнитную ленту, оптический диск, цифровой универсальный диск (DVD), компакт-диск (CD или CD-ROM), минидиск, жесткий диск, флоппи-диск, память на сегнетоэлектриках, электрически стираемое программируемое ПЗУ (EEPROM), флэш-память, электрически программируемое ПЗУ, постоянное запоминающее устройство (ПЗУ), статическое ОЗУ (SRAM), динамическое ОЗУ (DRAM), синхронное динамическое ОЗУ (SDRAM), ферромагнитную память, оптическую память, приборы с зарядовой связью, смарт-карты, плату Международной ассоциации производителей плат памяти для ПК (PCMCIA) и т.д.

Изобретение дополнительно относится к устройству для передачи многоканального сигнала, включающего в себя по меньшей мере первый компонент сигнала и второй компонент сигнала, причем это устройство содержит устройство для кодирования многоканального сигнала, как описано выше и далее.

Перечень фигур чертежей

Эти и другие аспекты изобретения будут явствовать и объясняться со ссылкой на варианты осуществления и со ссылкой на чертежи, в которых:

фиг.1 - схематичный вид системы для передачи стереофонических сигналов согласно варианту осуществления изобретения;

фиг.2 - схематичный вид устройства для кодирования стереофонического сигнала согласно первому варианту осуществления изобретения;

фиг.3 - иллюстрирующие определения преобразования сигнала согласно варианту осуществления изобретения;

фиг.4 - схематичный вид устройства для декодирования стереофонического сигнала согласно первому варианту осуществления изобретения:

фиг.5 - схематичный вид устройства для кодирования стереофонического сигнала согласно второму варианту осуществления изобретения;

фиг.6 - схематичный вид устройства для декодирования стереофонического сигнала согласно второму варианту осуществления изобретения;

фиг.7а-с - схематичные виды примеров схемы фильтра для использования в варианте осуществления изобретения;

фиг.8 - схематичный вид устройства для кодирования стереофонического сигнала согласно третьему варианту осуществления изобретения;

фиг.9 - схематичный вид устройства для кодирования стереофонического сигнала согласно четвертому варианту осуществления изобретения;

фиг.10 - схематичный вид устройства для декодирования стереофонического сигнала согласно четвертому варианту осуществления изобретения;

фиг.11 - схематичный вид устройства для кодирования многоканального сигнала согласно пятому варианту осуществления изобретения;

фиг.12 - схематичный вид устройства для кодирования многоканального сигнала согласно шестому варианту осуществления изобретения;

фиг.13 - схематичный вид схемы вычитания для использования с вариантом осуществления изобретения.

Описание вариантов осуществления изобретения

Фиг.1 показывает схематичный вид системы для передачи стереофонических сигналов согласно варианту осуществления изобретения. Эта система содержит кодирующее устройство 101 для генерирования кодированного стереофонического сигнала и декодирующее устройство 105 для декодирования принятого кодированного сигнала в компоненты L и R стереофонического сигнала. Каждое из кодирующего устройства 101 и декодирующего устройства 105 может быть любым электронным оборудованием или частью такого оборудования. Здесь термин «электронное оборудование» содержит компьютеры, такие как стационарные и портативные ПК, стационарное и портативное оборудование радиосвязи и другие карманные или портативные устройства, такие как мобильные телефоны, пейджеры, аудиопроигрыватели, мультимедийные проигрыватели, средства связи, т.е. электронные органайзеры, интеллектуальные телефоны, персональные цифровые информационные устройства (PDA), карманные компьютеры и т.п. Отметим, что кодирующее устройство 101 и декодирующее устройство могут быть скомбинированы в одном электронном оборудовании, где стереофонические сигналы хранятся на машиночитаемом носителе для дальнейшего воспроизведения.

Кодирующее устройство 101 содержит кодер 102 для кодирования стереофонического сигнала согласно изобретению, причем этот стереофонический сигнал включает в себя компонент L сигнала и компонент R сигнала. Кодер принимает компоненты L и R сигнала и генерирует кодированный сигнал Т. Стереофонический сигнал L и R может происходить из набора микрофонов, например, через дополнительное электронное оборудование, такое как оборудование микширования и т.д. Эти сигналы могут быть далее приняты в качестве выхода от другого стереопроигрывателя, через эфир в качестве радиосигнала или посредством любых других подходящих средств. Предпочтительные варианты такого кодера согласно изобретению будут описаны ниже. Согласно одному варианту осуществления, кодер 102 подключен к передатчику 103 для передачи кодированного сигнала Т через канал 109 связи к декодирующему устройству 105. Передатчик 103 может содержать схемы, подходящие для обеспечения передачи данных, например, через проводной или беспроводной канал 109 передачи данных. Примеры такого передатчика включают в себя сетевой интерфейс, сетевую плату, радиопередатчик, передатчик для других подходящих электромагнитных сигналов, такой как светодиод для передачи инфракрасного света, например, через порт IrDA, радиосвязь, например, через приемопередатчик Bluetooth и т.п. Дополнительные примеры подходящих передатчиков включают в себя кабельный модем, телефонный модем, адаптер цифровой сети с интегрированными услугами (ISDN), адаптер цифровой абонентской линии (DSL), спутниковый приемопередатчик, адаптер сети Ethernet и т.п. Соответственно, каналом 109 связи может быть любой подходящий проводной или беспроводной канал передачи данных, например, основанный на пакетах сети связи, такой как Интернет или другая сеть на основе протокола TCP/IP, канал связи ближнего действия, такой как инфракрасный канал связи, соединение Bluetooth или другой основанный на радиосвязи канал связи. Дополнительные примеры канала связи включают в себя компьютерные сети и сети беспроводной связи, такие как сеть сотовой цифровой пакетной передачи данных (CDPD), сеть глобальной системы мобильной связи (GSM), сеть множественного доступа с кодовым разделением каналов (СОМА), сеть множественного доступа с временным разделением каналов (TDMA), сеть с общей службой пакетной радиопередачи (GPRS), сеть третьего поколения, такая как сеть универсальной системы мобильных телекоммуникаций (UMTS) и т.п. Альтернативно или дополнительно, кодирующее устройство может содержать один или несколько интерфейсов (I/F) 104 для передачи кодированного стереофонического сигнала Т к декодирующему устройству 105.

Примеры таких интерфейсов включают в себя дисковод для хранения данных на машиночитаемом носителе 110, например, дисковод для флоппи-дисков, дисковод считывания/записи компакт-дисков (CD-ROM), дисковод DVD и т.д. Другие примеры включают в себя гнездо для платы памяти, устройство считывания/устройство записи на магнитную карту, интерфейс для доступа к смарт-карте и т.д. Соответственно, декодирующее устройство 105 содержит соответствующий приемник 108 для приема сигнала, переданного передатчиком и/или другим интерфейсом (I/F) 106, для приема кодированного стереофонического сигнала, переданного через интерфейс 104 и машиночитаемый носитель 110. Декодирующее устройство дополнительно содержит декодер 107, который принимает принятый сигнал Т и декодирует его в соответствующие стереофонические компоненты L' и R'. Предпочтительные варианты осуществления такого декодера согласно изобретению будут описаны ниже. Декодированные сигналы L' и R' могут впоследствии подаваться в стереопроигрыватель для воспроизведения через набор громкоговорителей, головных телефонов и т.п.

Фиг.2 показывает схематичный вид устройства 102 для кодирования стереофонического сигнала согласно первому варианту осуществления изобретения. Это устройство содержит схемы (R) 201 для выполнения поворота стереофонического сигнала в пространстве L-R на угол α, приводящего к повернутым компонентам сигнала у и r согласно преобразованию

где w_L=cosα и w_R=sinα будут называться весовыми множителями.

Согласно изобретению угол α определяется таким образом, что он соответствует направлению высокой вариации сигнала. Направление максимальной вариации сигнала, т.е. главный компонент, может быть вычислено посредством анализа главного компонента таким образом, что повернутый компонент у соответствует сигналу главного компонента, который включает в себя основную часть энергии сигнала, и r является остаточным сигналом. Соответственно, устройство по фиг.2 содержит схемы (РСА) 200, которые определяют угол α или, альтернативно, весовые множители w_L и w_R.

Со ссылкой на фиг.3, согласно предпочтительному варианту, вышеупомянутые весовые множители w_L и w_R определяются согласно следующему алгоритму:

Первоначально, входящие стереофонические сигналы L и R выпрямляются и фильтруются фильтром нижних частот, что приводит к сигналам огибающей p(k) для L и q(k) для R, соответственно, где p(k) и q(k) соответствующим образом дискретизированы и индекс выборки обозначен k. Таким образом, вектор х(k)=(р(k),q(k)) обозначает вектор входящего сигнала. Альтернативно, сигналы L и R могут использоваться непосредственно, т.е. без фильтрации, или могут использоваться другие фильтрованные версии L и R, например, фильтрованные фильтром верхних частот сигналы L и R. На фиг.3 некоторое число точек сигнала проиллюстрировано как окружности. В качестве примера указаны точка x(k) сигнала и ее соответствующие компоненты p(k) и q(k). Согласно изобретению сигналы поворачиваются в направлении главного компонента векторов сигнала. В примере по фиг.3 это соответствует направлению y, где α является углом между направлением у и направлением р. Весовой вектор w=(w_L,w_R) указывает направление главного компонента, и повернутые компоненты x(k) обозначены через y(k) и r(k), соответственно.

Главный компонент может быть определен посредством любого подходящего способа, известного в данной области техники. В особенно предпочтительном варианте осуществления используется итеративный способ, использующий правило Oja (см., например, S.Haykin: "Neural Networks", Prentice Hall, N.J., 1999). Согласно этому варианту осуществления весовой вектор w итеративно вычисляется согласно следующему уравнению

где w(k)=(w_L(k),w_R(k)) соответствует оценке в момент времени k. Вышеприведенная итерация может, например, инициироваться множеством малых случайных весов w(0) или любым другим подходящим образом. Вышеприведенный вычисленный весовой вектор может использоваться для вычисления повернутого сигнала согласно у(k)=w^T(k)x(k). Альтернативно, итерация по уравнению (2) может быть выполнена на основе блока, например, для блока N выборок, где N зависит от конкретной реализации, например, N=512, 1024, 2048 и т.д. В этом варианте осуществления вычисленный весовой вектор w(N) для блока может использоваться в преобразовании всех выборок этого блока согласно у(k)=w^T(N)x(k).

Множитель μ в уравнении (2) соответствует временной шкале алгоритма отслеживания. Если μ=0, то весовые множители и, таким образом, угол α, остаются постоянными, тогда как они резко изменяются для больших μ. В качестве примера, для размера блока 2048 выборок, μ может быть выбрано порядка 10^-3 для частоты дискретизации 44,1 кГц.

Преимуществом вышеприведенного итеративного алгоритма является то, что он является линейным, т.е. он не требует вычисления каких-либо тригонометрических функций, квадратных корней и т.п. Дополнительным преимуществом является то, что вышеприведенная итерация дает нормированный весовой вектор w, так как член -μw(k-1)у(k-1) в уравнении (2) соответствует члену снижения веса, ограничивающему большие веса, тогда как член +μx(k-1) направляет весовой вектор в направлении главного компонента. Дополнительно отметим, что в данном варианте осуществления, поскольку x(k) является сигналом огибающей, w_L,w_R∈ [0,1], т.е. весовой вектор w лежит в первом квадранте на фиг.3, что гарантирует то, что μ положительно. Дополнительным преимуществом этого варианта осуществления является то, что достаточно передать одно из w_L и w_R, так как другой множитель может быть определен согласно . Альтернативно, может быть передан угол α.

Опять со ссылкой на фиг.2, схема 200 выдает заданный угол α или, альтернативно, один или оба весовых множителя w_L и w_R. Информация об угле подается в схему 201 поворота, которая генерирует повернутые компоненты сигнала y и r. Понятно, что схемы 200 и 201 могут быть скомбинированы в единую схему, выполняющую итеративное вычисление по уравнению (2) и вычисление у и r согласно уравнению (1).

Устройство дополнительно содержит кодеры (Е) 202, выполняющие надлежащее кодирование сигналов y и r, соответственно. Например, эти сигналы могут быть кодированы согласно стандарту MPEG, например, уровню 3 MPEG I (MP3), согласно синусоидальному кодированию (SSC), или схемам кодирования звука, основывающимся на схеме поддиапазона, параметрической схеме или схеме преобразования, или любых других подходящих схемах или их комбинациях. Понятно, что кодеры 202 могут быть одного и того же типа или разных типов, например, один кодер MP3 и один кодер SSC и т.д. Результирующие кодированные сигналы у_е и r_е, соответственно, подаются в схему 204 объединения (С) вместе с информацией об угле α. Схема 204 объединения выполняет кадрирование, распределение расхода битов и кодирование без потерь, приводящее к комбинированному сигналу Т, подлежащему передаче. В одном варианте осуществления, угол α или, альтернативно, w_L и/или w_R могут передаваться как часть заголовка, передаваемого перед кадром сигнала, блока сигнала и т.п. Согласно изобретению, поскольку угол преобразования α отслеживается таким образом, что сигнал главного компонента включает в себя основную часть энергии сигнала, расходы битов, распределенные сигналам y и r, могут быть выбраны так, чтобы они отличались, что оптимизирует эффективность кодирования.

Например, стереофонические сигналы L и R могут быть выражены как L=M+S и R=M-S, где М соответствует среднему или центральному сигналу и S соответствует стереофоническому или боковому сигналу. В случае выполнения акустической записи стационарного источника звука, например оратора, записываемого двумя микрофонами, сигналы L и R в сущности равны, если оратор расположен в точности между микрофонами и если предположить, что отсутствуют акустические искажения, такие как отражения и т.д. Следовательно, в этом случае S в сущности равно нулю или по меньшей мере мало, и схема кодирования согласно изобретению в сущности дает y, соответствующий L+R, и r, соответствующий L-R, равный нулю или являющийся малым; это соответствует α=45 градусов. Если оратор не расположен точно между микрофонами, т.е. имеется асимметрия, но, по-прежнему, в предположении, что отсутствуют отражения или другие искажения, то повернутый сигнал у согласно изобретению по-прежнему соответствует оратору и остаточный сигнал r в сущности равен нулю. Однако в этом случае угол α отличается от 45 градусов. Если источник звука перемещается, например, слева направо, то способ согласно изобретению все же дает сигнал главного компонента y, соответствующий источнику, и малый остаточный сигнал r, в идеале равный r=0. В этом случае α изменяется от 0 (полностью левый) до 90 градусов (полностью правый).

Вышеприведенные примеры иллюстрируют преимущество отслеживания угла α. В вышеприведенных ситуациях может быть достаточным передавать сигнал главного компонента y и угол α, для того, чтобы позволить декодеру воссоздать исходные сигналы R и L без значительной потери в качестве. В общем, поскольку остаточный сигнал r является малым по сравнению с главным сигналом, распределение битов или эффективность кодирования может варьироваться между у и r. Следовательно, преимуществом изобретения является то, что оно позволяет осуществлять эффективное кодирование стереофонических сигналов.

Фиг.4 показывает схематичный вид устройства 107 для декодирования стереофонического сигнала согласно первому варианту осуществления изобретения. Это устройство принимает кодированный стереофонический сигнал Т, например, исходящий от кодера согласно варианту, описанному в сочетании с фиг.2. Устройство содержит схему (С^-1) 404 для извлечения кодированных сигналов y_е и r_е и информацию об угле α из комбинированного сигнала Т, т.е. схема 404 выполняет обратную операцию схемы 204 объединения по фиг.2. Извлеченные сигналы у_е и r_е подаются в соответствующие декодеры (Е^-1) 402, выполняющие декодирование звука, соответствующее кодированию, выполняемому кодерами 202 по фиг.2, что приводит к декодированному сигналу y' главного компонента и к декодированному остаточному сигналу r'. Сигналы y', r' и информация об угле α подаются в схему 401 поворота (R^-1), которая поворачивает сигналы y', r' обратно в направлении первоначальных компонентов L и R, что приводит к принятым сигналам L' и R'.

Фиг.5 показывает схематичный вид устройства для кодирования стереофонического сигнала согласно второму варианту осуществления изобретения. Это устройство содержит схемы (R) 201, выполняющие поворот стереофонических сигналов L и R на угол α, что приводит к повернутым компонентам y и r сигнала, как описано в сочетании с фиг.2. Устройство дополнительно содержит схемы (РСА) 200 для определения угла поворота, как описано в сочетании с фиг.2 и 3. Согласно этому варианту осуществления изобретения устанавливается, что остаточный сигнал r может быть оценен как фильтрованная версия главного сигнала y. Как описано в сочетании с фиг.2, при выполнении акустической записи источника звука, записываемого двумя микрофонами в отсутствие акустических искажений, например, из-за отражений и т.д., главный сигнал у соответствует источнику звука и остаточный сигнал по существу равен нулю. Однако в более реалистической ситуации искажения присутствуют, например, из-за отражений сигнала от стен комнаты и от головы и «тела» оратора и т.д. Эти эффекты влияют на остаточный сигнал r. Следовательно, при оценке остаточного сигнала фильтром этот фильтр фактически моделирует акустику комнаты и т.д. Для классического оркестра ситуация похожая, хотя в случае современной поп-музыки ситуация может слегка отличаться. В этом случае инженер по звуку обычно микширует множественные каналы в два канала, часто используя искусственную реверберацию, средства спецэффектов и т.д. В этом случае фильтр моделирует акустические эффекты, введенные процессом микширования.

Все еще со ссылкой на фиг.5, устройство содержит адаптивный фильтр (F) 501, принимающий главный сигнал у как входной сигнал и генерирующий фильтрованный сигнал . Параметры F_p фильтра адаптивного фильтра выбираются таким образом, что фильтрованный сигнал аппроксимирует остаточный сигнал r, например, посредством управления адаптивным фильтром 501 сигналом е ошибки, указывающим разницу между r и , генерируемую схемой 502 вычитания. Результирующие параметры F_p фильтра подаются в схему 204 объединения (С) предпочтительно после надлежащего кодирования кодером (К) 503, например кодером, обеспечивающим кодирование по Хаффману (Huffman), или любую другую подходящую схему кодирования. Фильтром 501 может быть любой фильтр, известный в данной области техники. Примеры таких фильтров включают в себя фильтр с импульсной характеристикой конечной длительности (КИХ-фильтр) или фильтр с импульсной характеристикой бесконечной длительности (БИХ-фильтр), адаптированный или неперестраиваемый, с частотами отсечки и величинами, фиксированными или рекурсивно отслеживаемыми, и т.п. Фильтр может быть любого порядка, предпочтительно меньшего, чем 10. Типом фильтра может быть фильтр Баттерворта, Чебышева или любой другой подходящий тип фильтра. Устройство дополнительно содержит кодер 202 для кодирования главного сигнала, как описано в сочетании с фиг.2, что приводит к кодированному главному сигналу y_е, который подается в схему 204 объединения вместе с параметрами F_p фильтра и информацией об угле α. Как описано в сочетании с фиг.2, схема 204 объединения выполняет кадрирование, распределение расхода битов и кодирование без потерь, что приводит к подлежащему передаче суммарному сигналу Т, который включает в себя кодированный главный сигнал у_е, параметры F_p фильтра и информацию об угле α. Согласно этому варианту осуществления изобретения расход битов, подлежащий выделению параметрам F_p фильтра, может быть значительно меньшим расхода битов, необходимого для главного сигнала у, например, в одном варианте осуществления расход битов для F_p может быть, в среднем, меньше, чем 10% расхода битов для y. Следовательно, преимуществом изобретения является то, что оно снижает расход битов, необходимый для передачи стереофонического сигнала. Общий расход битов согласно изобретению лишь слегка выше, чем для единственного монофонического канала. Отметим, однако, что это отношение может варьироваться во время записи. Например, отношение может стать меньше, например, в ситуации с малыми искажениями и стационарным источником, но также больше, например, если сигналы L и R на мгновение становятся независимыми.

Фиг.6 показывает схематичный вид устройства 107 для декодирования стереофонического сигнала согласно второму варианту осуществления изобретения. Это устройство принимает кодированный стереофонический сигнал Т, например, исходящий от кодера согласно варианту, описанному в сочетании с фиг.5. Это устройство содержит схему (С^-1) 404 для извлечения кодированного сигнала y_е, параметров F_p фильтра и информации об угле α из комбинированного сигнала Т, т.е. схема 404 выполняет обратную операцию схемы 204 объединения по фиг.5. Извлеченный сигнал y_е подается в декодер (Е^-1) 402 для выполнения декодирования звука, соответствующего кодированию, выполняемому кодером 202 фиг.5, что приводит к декодированному сигналу y' главного компонента. Предпочтительно, параметры фильтра декодируются декодером (Ê^-1) 602, соответствующим кодированию параметров фильтра кодером 503 по фиг.5. Сигнал y' подается в фильтр (F) 601 вместе с принятыми параметрами фильтра F_p. Фильтр 601 генерирует соответствующий оцененный остаточный сигнал '. Принятый сигнал y' главного компонента, оцененный остаточный сигнал ' и принятая информация об угле α подаются в схему 401 поворота (R^-1), которая поворачивает сигналы y', ' обратно в направлении первоначальных компонентов L и R, что приводит к прин

Кодирование стереофонических сигналов

Патент 2316154