2595910 - Процессор аудиосигналов для обработки кодированных многоканальных аудиосигналов и способ для этого

Процессор аудиосигналов для обработки кодированных многоканальных аудиосигналов и способ для этого

Иллюстрации

Показать все

Изобретение относится к области одновременного воспроизведения многоканальных сигналов. Техническим результатом является обеспечение улучшенной обработки, снижение сложности и/или уменьшение вычислительной нагрузки, повышение качества звука, повышение производительности. Процессор аудиосигналов принимает множество кодированных многоканальных аудиосигналов. Многоканальный декодер декодирует первый кодированный многоканальный сигнал, чтобы формировать первый декодированный многоканальный сигнал. Формирователь формирует кодированный дополнительный аудиосигнал посредством выбора данных кодирования аудио. Дополнительный декодер формирует дополнительный декодированный сигнал посредством декодирования дополнительного кодированного аудиосигнала. Процессор вывода комбинирует первый декодированный многоканальный сигнал и дополнительный декодированный сигнал, чтобы формировать многоканальный выходной сигнал. 2 н. и 13 з.п. ф-лы, 4 ил.

Реферат

Область техники, к которой относится изобретение

Изобретение относится к процессору аудиосигналов и способу для него, и, в частности, но не только, к одновременному воспроизведению многоканальных сигналов.

Уровень техники

За последние десятилетия резко возросло разнообразие и гибкость предоставляемого аудио. Фактически, введение пространственного аудио, кодирования и декодирования цифрового аудио, миниатюризация аудиоустройств и т.д. приводят к тому, что аудио используется множеством различных способов. Помимо этого, дополнительные перспективы и функциональность приводят к появлению нового восприятия пользователем и сценариев применения.

Например, разработаны аудиоустройства, которые обеспечивают возможность одновременного воспроизведения нескольких исходных сигналов, но с пространственным различением. Такие аудиоустройства могут декодировать множество исходных сигналов, чтобы предоставлять декодированные сигналы, которые затем пространственно обрабатываются таким образом, что слушателю кажется, что они исходят из различных направлений. Примеры таких аудиопроигрывателей можно найти в статье "Spatial Track Transition Effects for Headphone Listening", авторов Harma, A. and S. van de Par; 10th Int. Conf. Digital Audio Effects (DAFx10); 2007 год; Бордо; Франция.

Тем не менее, хотя такая обработка нацелена на обеспечение привлекательного восприятия пользователем, она также зачастую имеет ассоциированные недостатки. В частности, сложность и вычислительная нагрузка обработки зачастую являются довольно высокими, в силу этого требуя относительно мощных платформ обработки. Это повышает затраты и потребление мощности, что является особенно нежелательным для небольших портативных аудиопроигрывателей для потребительского сегмента. В качестве альтернативы, сложность и нагрузка по обработке сокращаются за счет ухудшения качества обработки или ограничения на число сигналов аудиоисточника, которые могут быть обработаны. Тем не менее, это приводит к ухудшенному качеству восприятия пользователем.

Следовательно, предпочтительным должен быть усовершенствованный подход, в частности, предпочтительным должен быть подход, обеспечивающий повышение гибкости, снижение сложности, уменьшение вычислительной нагрузки, упрощенную работу, пониженное потребление мощности, повышенное качество звука, улучшенное восприятие пользователем и/или повышенную производительность.

Сущность изобретения

Следовательно, изобретение предпочтительно нацелено на уменьшение, облегчение или устранение одного или более вышеупомянутых недостатков по отдельности или в любом сочетании.

Согласно аспекту изобретения, предусмотрен процессор аудиосигналов, содержащий: приемник для приема множества кодированных многоканальных аудиосигналов; многоканальный декодер для декодирования первого кодированного многоканального сигнала, чтобы формировать первый декодированный многоканальный сигнал; формирователь для формирования кодированного дополнительного аудиосигнала посредством выбора данных кодирования аудио, по меньшей мере, из второго кодированного многоканального аудиосигнала из множества кодированных многоканальных аудиосигналов таким образом, что число каналов кодированного дополнительного аудиосигнала, содержащего данные кодирования аудио из второго кодированного многоканального аудиосигнала, меньше числа каналов во втором кодированном многоканальном сигнале; дополнительный декодер для формирования декодированного дополнительного аудиосигнала посредством декодирования кодированного дополнительного аудиосигнала; и процессор вывода для комбинирования, по меньшей мере, первого декодированного многоканального сигнала и декодированного дополнительного аудиосигнала, чтобы формировать многоканальный выходной сигнал.

Изобретение может обеспечивать улучшенную обработку множества кодированных многоканальных аудиосигналов. В частности, во многих сценариях могут достигаться меньшая сложность и/или требоваться меньшие вычислительные ресурсы. Выходной сигнал, содержащий аудио из множества многоканальных аудиосигналов, может быть сформирован без необходимости полного многоканального декодирования каждого многоканального сигнала. Использование вычислительных ресурсов может быть существенно сокращено, за счет этого обеспечивая возможность включения большего числа многоканальных сигналов в многоканальный выходной сигнал. Во многих сценариях, могут достигаться улучшенное восприятие пользователем, сокращенные затраты и/или упрощенная реализация.

Процессор аудиосигналов, в некоторых вариантах осуществления, дополнительно может содержать средство для воспроизведения многоканального выходного сигнала, например, с использованием наушников.

Кодированные многоканальные аудиосигналы могут быть кодированными стереосигналами. В некоторых вариантах осуществления, многоканальные сигналы из множества кодированных многоканальных аудиосигналов имеют равное число каналов и, в частности, могут быть кодированными стереосигналами.

Кодированный дополнительный аудиосигнал может быть многоканальным сигналом с меньшим числом каналов, чем второй кодированный многоканальный аудиосигнал. В других вариантах осуществления, кодированный дополнительный аудиосигнал может иметь не меньшее или даже большее число каналов, чем второй кодированный многоканальный аудиосигнал, но только данные кодирования из второго кодированного многоканального аудиосигнала включаются в поднабор этих каналов, при этом поднабор содержит меньшее число каналов, чем второй кодированный многоканальный аудиосигнал.

Формирователь реализует сокращение числа каналов кодированных аудиоданных, представляющих аудиоисточник второго кодированного многоканального аудиосигнала. В частности, формирователь может отбрасывать один или более каналов второго кодированного многоканального аудиосигнала.

Второй кодированный многоканальный сигнал типично отличается от первого кодированного многоканального сигнала.

В соответствии с необязательным признаком изобретения, формирователь выполнен с возможностью формировать первый канал кодированного дополнительного аудиосигнала посредством выбора данных кодирования аудио из одного канала второго кодированного многоканального сигнала.

Это позволяет упрощать реализацию и/или уменьшать сложность и/или уменьшать вычислительные ресурсы. В частности, это позволяет обеспечивать извлечение/выбор аудиоданных с низкой сложностью и не требует обработки данных кодирования. Формирователь может выбирать данные кодирования только из одного канала при формировании кодированного дополнительного аудиосигнала и может игнорировать или отбрасывать все другие каналы второго кодированного многоканального аудиосигнала.

Первый канал может содержать данные кодирования только из одного канала второго кодированного многоканального аудиосигнала.

В соответствии с необязательным признаком изобретения, кодированный дополнительный аудиосигнал является многоканальным сигналом, и формирователь выполнен с возможностью формировать второй канал кодированного дополнительного аудиосигнала посредством выбора данных кодирования аудио из одного канала третьего кодированного многоканального сигнала.

Кодированный дополнительный аудиосигнал может содержать данные кодирования из множества кодированных многоканальных сигналов. Кодированный дополнительный аудиосигнал, в частности, может быть многоканальным сигналом, имеющим число каналов, идентичное числу каналов первого кодированного многоканального сигнала, но при этом поднаборы каналов выбираются из различных кодированных многоканальных сигналов.

Дополнительный декодер может быть многоканальным декодером и может выполнять одно многоканальное декодирование кодированного дополнительного аудиосигнала, содержащего каналы из различных кодированных многоканальных сигналов. Таким образом, одно многоканальное декодирование может одновременно декодировать аудио из множества принимаемых кодированных многоканальных сигналов. Дополнительный декодер может быть идентичным многоканальному декодеру, используемому для декодирования первого кодированного многоканального сигнала.

В соответствии с необязательным признаком изобретения, кодированные аудиоданные одного канала кодированного дополнительного аудиосигнала являются идентичными кодированным аудиоданным одного канала второго кодированного многоканального сигнала.

Это позволяет обеспечивать очень эффективную реализацию, типично с низкой сложностью и/или низким потреблением вычислительных ресурсов. В некоторых вариантах осуществления, один канал кодированного дополнительного аудиосигнала может быть сформирован просто посредством копирования всех данных кодирования аудио из одного канала второго кодированного многоканального сигнала.

В соответствии с необязательным признаком изобретения, один канал второго кодированного многоканального сигнала является, по меньшей мере, одним из следующего: средний канал для среднего стереосигнала; левый канал для правого-левого стереосигнала; и правый канал для правого-левого стереосигнала.

В соответствии с необязательным признаком изобретения, кодированный дополнительный аудиосигнал является моносигналом.

В соответствии с необязательным признаком изобретения, кодированный дополнительный аудиосигнал является многоканальным сигналом, имеющим различные каналы, содержащие данные кодирования аудио из различных кодированных многоканальных аудиосигналов из множества кодированных многоканальных аудиосигналов.

Это позволяет обеспечивать, в частности, преимущественный режим работы, производительность и/или реализацию. В частности, это позволяет обеспечивать реализацию с низкой сложностью и низкой нагрузкой по ресурсам при предоставлении высоко предпочтительного восприятия пользователем. Подход во многих сценариях может обеспечивать очень эффективную работу посредством использования многоканального декодера для одновременного декодирования аудио, соответствующего множеству различных источников звука.

В соответствии с необязательным признаком изобретения, каждый канал кодированного дополнительного аудиосигнала соответствует одному каналу одного из различных кодированных многоканальных аудиосигналов.

Это позволяет обеспечивать очень эффективную реализацию.

В соответствии с необязательным признаком изобретения, формирователь выполнен с возможностью выбирать данные кодирования аудио для одного канала кодированного дополнительного аудиосигнала из множества кодированных многоканальных аудиосигналов.

Это позволяет обеспечивать эффективную реализацию и, в частности, может во многих сценариях существенно уменьшать требуемую вычислительную нагрузку при декодировании. Один канал кодированного дополнительного аудиосигнала может быть сформирован посредством выбора данных кодирования из двух (или более) каналов из различных кодированных многоканальных аудиосигналов. Выбор данных кодирования, например, может чередоваться между двумя кодированными многоканальными аудиосигналами в последовательных сегментах кодирования. В некоторых сценариях может применяться более сложный выбор, к примеру, выбор в зависимости от характеристики данных кодирования аудио, по меньшей мере, одного из каналов множества кодированных многоканальных аудиосигналов. Например, могут выбираться данные кодирования, соответствующие самому сильному сигналу.

В соответствии с необязательным признаком изобретения, формирователь выполнен с возможностью формировать управляющие данные кодирования для кодированного дополнительного аудиосигнала посредством модификации управляющих данных кодирования второго кодированного многоканального аудиосигнала таким образом, что они соответствуют кодированным аудиоданным кодированного дополнительного аудиосигнала.

Это позволяет упрощать работу и предоставляет возможность стандартному оборудованию, такому как стандартная функциональность декодера, обрабатывать кодированный дополнительный аудиосигнал. Например, информация заголовка, указывающая скорость передачи данных, может быть модифицирована из данных исходных кодированных многоканальных аудиосигналов в значения, которые отражают выбор данных кодирования аудио при формировании кодированного дополнительного аудиосигнала. Например, исходные кодированные многоканальные аудиосигналы могут быть средними сигналами, и кодированный дополнительный аудиосигнал может быть сформирован в качестве стереосигнала, причем каждый сигнал содержит данные кодирования среднего канала для двух различных кодированных многоканальных аудиосигналов. В этом случае, скорость передачи данных кодированного дополнительного аудиосигнала выше, чем для двух средних кодированных многоканальных аудиосигналов, и данные заголовка могут быть модифицированы, чтобы отражать это.

В соответствии с необязательным признаком изобретения, процессор аудиосигналов дополнительно содержит: пользовательский интерфейс для приема пользовательского ввода; пространственную модель, представляющую позицию виртуального пользователя и позиции виртуальных пространственных источников звука, ассоциированных с множеством кодированных многоканальных аудиосигналов, при этом формирователь выполнен с возможностью выбирать первый кодированный многоканальный сигнал и второй кодированный многоканальный аудиосигнал в ответ на пространственную модель.

Это позволяет обеспечивать предоставление очень привлекательное восприятие пользователем при меньшей сложности. В частности, поскольку декодирование влечет за собой меньшую сложность, большее число позиций виртуальных источников звука может быть воспроизведено для модели, за счет этого предоставляя улучшенное восприятие пользователем.

В некоторых вариантах осуществления, пользовательский интерфейс может включать в себя дисплей для осуществления представления пространственной модели.

В соответствии с необязательным признаком изобретения, процессор вывода выполнен с возможностью применять пространственную обработку, по меньшей мере, к декодированному дополнительному аудиосигналу в ответ на пространственную модель.

Это позволяет обеспечивать высоко предпочтительное восприятие пользователем за счет акустически предоставляемого пространственного представления модели.

В частности, если пользовательский интерфейс включает в себя дисплей для осуществления представления пространственной модели, могут предоставляться комбинированное аудиовизуальное пространственное восприятие пользователем. Кроме того, это может достигаться без необходимости полного декодирования всех источников звука, которые должны быть одновременно пространственно воспроизведены. Таким образом, формирование кодированного дополнительного аудиосигнала позволяет не только уменьшать сложность и использование ресурсов для декодирования, но также позволяет упрощать и уменьшать сложность и использование ресурсов для пространственного воспроизведения.

В соответствии с необязательным признаком изобретения, декодированный дополнительный аудиосигнал является многоканальным сигналом, и пространственная обработка содержит пространственную обработку различных каналов декодированного дополнительного аудиосигнала таким образом, что они соответствуют различным позициям виртуальных пространственных источников звука пространственной модели.

В соответствии с необязательным признаком изобретения, процессор вывода выполнен с возможностью выбирать второй кодированный многоканальный аудиосигнал в ответ на расстояние между позицией виртуального пользователя и позициями виртуальных пространственных источников звука, ассоциированными со вторым кодированным многоканальным аудиосигналом.

Согласно аспекту изобретения, предусмотрен способ обработки аудиосигнала, содержащий: прием множества кодированных многоканальных аудиосигналов; декодирование первого кодированного многоканального сигнала, чтобы формировать первый декодированный многоканальный сигнал; формирование кодированного дополнительного аудиосигнала посредством выбора данных кодирования аудио, по меньшей мере, из второго кодированного многоканального аудиосигнала из множества кодированных многоканальных аудиосигналов таким образом, что число каналов кодированного дополнительного аудиосигнала, содержащего данные кодирования аудио из второго кодированного многоканального аудиосигнала, меньше числа каналов во втором кодированном многоканальном сигнале; формирование декодированного дополнительного аудиосигнала посредством декодирования кодированного дополнительного аудиосигнала; и комбинирование, по меньшей мере, первого декодированного многоканального сигнала и декодированного дополнительного аудиосигнала, чтобы формировать многоканальный выходной сигнал.

Эти и другие аспекты, признаки и преимущества изобретения должны становиться очевидными и должны истолковываться со ссылкой на описанные далее варианты осуществления.

Краткое описание чертежей

Варианты осуществления изобретения описаны далее только в качестве примера со ссылкой на чертежи, из которых:

Фиг.1 иллюстрирует пример элементов процессора аудиосигналов в соответствии с некоторыми вариантами осуществления изобретения;

Фиг.2 иллюстрирует пример элементов процессора вывода сигналов для процессора аудиосигналов в соответствии с некоторыми вариантами осуществления изобретения;

Фиг.3 иллюстрирует пример элементов процессора аудиосигналов в соответствии с некоторыми вариантами осуществления изобретения; и

Фиг.4 иллюстрирует пример визуального представления пространственной модели набора аудиоэлементов.

Подробное описание вариантов осуществления изобретения

Нижеприведенное описание фокусируется на вариантах осуществления изобретения, применимых к воспроизведению стереоаудиоэлементов посредством аудиопроигрывателя, такого как портативный аудиопроигрыватель. Тем не менее, следует принимать во внимание, что изобретение не ограничено этим вариантом применения, а может быть применено ко многим другим аудиосигналам и системам.

Фиг.1 иллюстрирует пример процессора аудиосигналов в соответствии с некоторыми вариантами осуществления изобретения.

Процессор аудиосигналов по фиг.1, в частности, выполнен с возможностью обрабатывать множество кодированных многоканальных сигналов, соответствующих множеству источников звука. В частности, формируется выходной сигнал, который содержит аудиокомпоненты из множества кодированных входных многоканальных сигналов. Каждый из кодированных многоканальных аудиосигналов может быть одним аудиоэлементом или объектом, таким как один кодированный аудиофайл (например, MP3-кодированная песня).

В конкретном примере, дополнительно может вводиться пространственная обработка, так что различные источники звука/аудиоэлементы могут различаться на основе их пространственных характеристик в результирующем сигнале. Например, различные песни могут быть воспроизведены таким образом, что они воспринимаются как исходящие из различных направлений.

Таким образом, в системе по фиг.1, составной выходной сигнал формируется из множества входных сигналов таким образом, что слушатель воспринимает окружение прослушивания с множеством одновременных источников звука. Например, ряд, к примеру, MP3-кодированных песен может представляться одновременно. Таким образом, слушателю предоставляется множество одновременных аудиоэлементов.

Традиционно, воспроизведение одновременных многоканальных сигналов осуществляется посредством декодирования всех многоканальных сигналов с последующим поканальным смешением декодированных многоканальных сигналов. Например, при одновременном воспроизведении двух принимаемых кодированных стереосигналов, два стереодекодера типично используются для того, чтобы формировать декодированные стереосигналы. Два декодированных левых канала после этого смешиваются таким образом, что они формируют левый выходной канал. Аналогично, два декодированных правых канала смешиваются таким образом, что они формируют правый выходной канал. Тем не менее, такой подход требует высокой вычислительной нагрузки и является относительно сложным. Фактически, во многих вариантах применения, желательно иметь, возможно, три или четыре одновременно воспроизводимых источника звука/аудиоэлемента, в силу этого требуя трех или четырех одновременных многоканальных декодеров. Тем не менее, ассоциированное требование по объему вычислений типично существенно выше требования по объему вычислений, типично доступного, например, для портативных приложений, таких как, например, портативные медиа- или аудиопроигрыватели. Фактически, в таких устройствах типично предусмотрен предел (например, 3) на число декодеров, которые могут работать одновременно.

Авторы изобретения выяснили, что для многих вариантов применения, в которых множество многоканальных источников звука одновременно представляется слушателю, может быть приемлемым или фактически предпочтительным предоставление основного источника(ов) при полном многоканальном воспроизведении, тогда как другие источники могут быть воспроизведены с сокращенным числом каналов, и, в частности, во многих сценариях могут быть воспроизведены в качестве моносигнала(ов). Система по фиг.1 использует этот факт вместе с конкретным подходом для формирования такого выходного сигнала, чтобы существенно уменьшать сложность и вычислительные ресурсы. В частности, система по фиг.1 выполнена с возможностью выбирать один (или больше) из входных многоканальных сигналов, которые должны быть воспроизведены в качестве полного многоканального сигнала, включающего в себя применение полного многоканального декодирования и надлежащую обработку. Тем не менее, для другого многоканального сигнала(ов), сокращение числа каналов выполняется до декодирования посредством прямой обработки данных кодирования аудио многоканальных сигналов. Только результирующие кодированные каналы затем декодируются. Поскольку сложность и требование к ресурсам, связанные с декодированием, типично представляют собой один из наиболее значимых факторов в общей сложности и использовании ресурсов, это приводит к очень существенному уменьшению общей сложности и использования вычислительных ресурсов.

Процессор аудиосигналов по фиг.1 содержит приемник 101, который принимает множество кодированных многоканальных аудиосигналов. Таким образом, принимается ряд входных сигналов, при этом каждый входной сигнал является многоканальным сигналом, представляющим источник звука. В примере, каждый входной сигнал является отдельным аудиоэлементом и, в частности, является аудиофайлом, таким как песня. В примере, входные сигналы представляют отдельные и несвязанные источники звука. Таким образом, каждый входной сигнал представляет звуковую сцену или окружение, которое является независимым от звуковой сцены или окружения других входных сигналов. Соответственно, отсутствует пространственная, аудио- и/или перцепционная корреляция между входными сигналами, но они могут быть по отдельности воспроизведены вообще без учета других входных сигналов.

Кроме того, каждый входной сигнал кодируется в соответствии с надлежащим стандартом или алгоритмом кодирования. Например, данные могут быть кодированы в соответствии с MP3-, AAC-кодированием и т.д. Кодирование является, в частности, перцепционным кодированием многоканального аудио с потерями.

Входные многоканальные сигналы могут быть стереосигналами или могут содержать большее число каналов, как, например, в случае пяти- или семиканального сигнала объемного звучания. Нижеприведенное описание сфокусировано на примере, в котором входные сигналы являются стереосигналами, но следует принимать во внимание, что описанные принципы и подходы применяются в равной степени к входным сигналам с большим числом каналов.

В примере, входные сигналы, в частности, принимаются из внутреннего носителя данных, на котором сохраняется большое число кодированных аудиофайлов, таких как MP3- или AAC-кодированные песни. Приемник 101 в этом примере может содержать функциональность для извлечения аудиофайлов из носителя данных. Носитель данных, например, может быть жестким диском или полупостоянным запоминающим устройством. Извлечение файлов из носителя данных может управляться посредством пользовательского выбора, принимаемого через соответствующий пользовательский интерфейс.

В качестве другого примера, входные сигналы могут быть сигналами в реальном времени, которые, например, передаются потоком из источника по Интернету или принимаются через цифровую широковещательную радиопередачу. Входные сигналы дополнительно могут быть приняты из идентичного источника или, например, могут быть приняты из отдельных и независимых источников.

Приемник 101 соединяется с модулем 103 выбора, в который подаются принимаемые (в конкретном примере, извлеченные) кодированные многоканальные сигналы. Система по фиг.1 выполнена с возможностью формировать многоканальный выходной сигнал, причем один из входных кодированных многоканальных сигналов включается в качестве полного многоканального сигнала, тогда как другие кодированные многоканальные сигналы включаются в качестве сигналов с сокращенным числом каналов. Таким образом, для одного входного кодированного многоканального сигнала (который далее упоминается в качестве первичного сигнала) с N каналов, выходной сигнал должен включать в себя все N каналов. Тем не менее, для оставшихся кодированных многоканальных сигналов, только M-канальное представление включается в выходной сигнал, где M<N. В конкретном примере, кодированные многоканальные сигналы являются кодированными стереосигналами, и процессор аудиосигналов формирует выходной стереосигнал, в котором один из входных сигналов предоставляется в качестве стереосигнала, тогда как другие сигналы включаются только в качестве моносигналов.

Модуль 103 выбора, в частности, выбирает один первичный сигнал. Оставшиеся кодированные многоканальные сигналы далее упоминаются в качестве вторичных сигналов.

Модуль 103 выбора соединяется с многоканальным декодером 105, в который подается кодированный первичный сигнал. Многоканальный декодер 105 декодирует первичный кодированный многоканальный сигнал, чтобы формировать первичный декодированный многоканальный сигнал. В конкретном примере, кодированный первичный сигнал является стереосигналом, и многоканальный декодер 105 является стереодекодером, формирующим декодированный стереосигнал.

Многоканальный декодер 105 соединяется с процессором 107 вывода, который формирует многоканальный выходной сигнал, который содержит первичный декодированный многоканальный сигнал.

Модуль 103 выбора дополнительно соединен с формирователем 109, в который подаются вторичные кодированные многоканальные сигналы. Формирователь 109 формирует, по меньшей мере, один кодированный аудиосигнал с сокращенным числом каналов посредством выбора данных кодирования аудио из одного или более вторичных кодированных многоканальных сигналов. Кодированный аудиосигнал с сокращенным числом каналов формируется из данных кодирования аудио одного или более вторичных кодированных многоканальных сигналов. Тем не менее, число каналов в кодированном аудиосигнале с сокращенным числом каналов меньше суммы каналов во вторичных кодированных многоканальных сигналах, которые используются для того, чтобы формировать сокращенный кодированный многоканальный сигнал. Таким образом, по меньшей мере, для одного из вторичных кодированных многоканальных сигналов, включенных в кодированный многоканальный сигнал с сокращенным числом каналов, число каналов уменьшается.

Соответственно, формирователь 109 вводит сокращение числа каналов, используемых для того, чтобы представлять аудио из вторых кодированных многоканальных сигналов. Кроме того, это сокращение достигается посредством выбора данных кодирования аудио из данных кодирования вторичных кодированных многоканальных сигналов. Таким образом, простые операции перемещения, выбора и комбинирования данных могут быть использованы для того, чтобы формировать кодированный аудиосигнал с сокращенным числом каналов, и не требуется декодирование или другая обработка базового аудиосигнала(ов). Сокращение числа каналов, следовательно, достигается с низкой сложностью и без значительного требования к ресурсам.

Формирователь соединяется со вторым декодером 111, в который подается кодированный аудиосигнал с сокращенным числом каналов. Второй декодер продолжает декодировать кодированный аудиосигнал с сокращенным числом каналов, чтобы формировать декодированный многоканальный сигнал с сокращенным числом каналов, далее упоминаемый как вторичный декодированный сигнал.

Второй декодер 111 соединяется с процессором 107 вывода, в который подается вторичный декодированный сигнал. Процессор 107 вывода включает вторичный декодированный сигнал в многоканальный выходной сигнал. Таким образом, многоканальный выходной сигнал формируется в качестве комбинации первичного декодированного сигнала и вторичного декодированного сигнала.

В качестве примера с низкой сложностью, процессор 107 вывода может просто выполнять аудиомикширование первичного декодированного сигнала и вторичного декодированного сигнала. Например, один канал первичного декодированного сигнала может смешиваться с одним каналом декодированного вторичного первичного сигнала. Если вторичный первичный сигнал является многоканальным сигналом, смешивание может повторяться для всех каналов таким образом, что каждый канал декодированного аудиосигнала смешивается с одним каналом первичного декодированного сигнала.

Таким образом, процессор 107 вывода формирует многоканальный выходной сигнал, содержащий первичный аудиоисточник, представленный в качестве полного многоканального сигнала, и один или более вторичных аудиоисточников, представленных в качестве сигналов с сокращенным числом каналов. В качестве конкретного примера, первичный входной стереоисточник может представляться как полное стереопредставление, тогда как два вторичных входных стереоисточника одновременно представляются как два монопредставления. В этом примере, два вторичных источника могут восприниматься локализованными для правого уха и левого уха, соответственно, тогда как первичный сигнал заполняет всю звуковую сцену.

В некоторых вариантах осуществления, схема 107 вывода может непосредственно формировать многоканальный сигнал, который может возбуждать соответствующее средство для воспроизведения аудио многоканального сигнала. Например, схема 107 вывода может непосредственно формировать стереосигнал, возбуждающий пару наушников, или может, например, формировать пять пространственных каналов для различных громкоговорителей системы пятиканального объемного звука. В других сценариях, процессор 107 вывода может просто формировать сигнал для обработки и воспроизведения посредством другой функциональности, устройств или оборудования. Фактически, в некоторых вариантах осуществления, процессор 107 вывода может содержать функциональность для кодирования выходного многоканального сигнала, в силу этого обеспечивая его простую передачу, распространение или сохранение.

Авторы настоящего изобретения выяснили, что привлекательное восприятие пользователем может достигаться с конкретным одновременным воспроизведением нескольких аудиоисточников при уменьшении сложности и требований к ресурсам. В частности, авторы изобретения выяснили, что привлекательное восприятие пользователем могут достигаться посредством поддержания одного источника звука (или поднабора источников звука) при полном многоканальном представлении при сокращении многоканального характера других источников звука. Мало того, что это позволяет обеспечивать привлекательное восприятие пользователем, который, например, выделяет первичный источник(и) звука относительно вторичного источника(ов) звука, но это также может быть использовано для того, чтобы уменьшать сложность. Фактически, авторы изобретения выяснили, что существенное уменьшение сложности/вычислительной нагрузки может достигаться посредством использования конкретного подхода для воспроизведения с сокращением числа каналов в области кодирования (предварительного декодирования) вторичных сигналов на основе выбора данных кодирования аудио. Система, в частности, может уменьшать ресурсы, требуемые для декодирования сигналов. Поскольку вычислительная нагрузка при операциях декодирования зачастую является доминирующей нагрузкой по ресурсам для аудиопроцессоров (особенно для устройств с низкими ресурсами, таких как портативные аудиопроигрыватели), общее уменьшение нагрузки для системы в целом зачастую достигается в значительной степени.

Сокращение числа каналов формирователя 109 во многих сценариях может включать в себя формирование канала кодированного аудиосигнала с сокращенным числом каналов, который включает в себя аудиоданные одного из каналов одного из вторичных кодированных многоканальных сигналов. Таким образом, формирователь 109, в некоторых вариантах осуществления, может просто выбирать все данные кодирования аудио для одного канала вторичного кодированного многоканального сигнала и включать их в один канал кодированного аудиосигнала с сокращенным числом каналов. Следовательно, прямой выбор битов может быть использован для того, чтобы формировать кодированный аудиосигнал с сокращенным числом каналов.

Один канал может представлять один из исходных аудиоканалов в контенте или, в зависимости от типа аудиокодера, некоторую их линейную комбинацию. Например, общие стереоаудиокодеры кодируют сигналы суммы и разности левого и правого входных аудиоканалов вместо исходных левого и правого сигналов. В этом случае, формирователь 109, например, может выбирать только суммирующий сигнал.

В некоторых вариантах осуществления, один канал кодированного аудиосигнала с сокращенным числом каналов может в силу этого содержать кодированные аудиоданные, которые являются идентичными одному каналу одного из вторичных кодированных многоканальных сигналов. Кодированный аудиосигнал с сокращенным числом каналов может быть сформирован посредством простого выбора канала из одного или более вторичных кодированных многоканальных сигналов. Этот выбор канала выбирает поднабор доступных каналов и отбрасывает некоторые каналы, в силу этого приводя к общему сокращению числа каналов.

Следует принимать во внимание, что в вариантах осуществления, в которых кодированные аудиоданные для кодированного аудиосигнала с сокращенным числом каналов выбираются просто посредством взятия данных кодирования аудио из одного или более

Процессор аудиосигналов для обработки кодированных многоканальных аудиосигналов и способ для этого

Патент 2595910