Пространственное воспроизведение звука
Иллюстрации
Показать всеИзобретение относится к средствам для пространственного воспроизведения звука. Технический результат заключается в улучшении пространственного восприятия при прослушивании. Устройство для пространственного воспроизведения звука содержит приемное устройство для приема многоканального аудиосигнала. Анализатор определяет пространственное свойство многоканального аудиосигнала, такое как пространственная сложность или организация. Процессор выбора затем выбирает режим воспроизведения из множества режимов воспроизведения звука, при этом режимы многоканального воспроизведения звука используют различные технологии пространственного рендеринга. Схема воспроизведения затем возбуждает набор громкоговорителей, чтобы воспроизводить многоканальный аудиосигнал с использованием выбранного режима воспроизведения. Переключение между режимами воспроизведения может быть быстрым (например, в порядке от 100 мс до 10 с), тем самым обеспечивая краткосрочную адаптацию режима воспроизведения к характеристикам сигналов. Подход может, в частности, предоставлять улучшенное пространственное восприятие для слушателя. 2 н. и 12 з.п. ф-лы, 3 ил.
Реферат
Область техники, к которой относится изобретение
Изобретение относится к пространственному воспроизведению звука и, в частности, но не только, к пространственному воспроизведению звука, включающему в себя микширование с увеличением частоты многоканального аудиосигнала.
Уровень техники
Пространственное воспроизведение звука в форме стереозаписей и стереовоспроизведения известно в течение нескольких десятилетий. В последние десятилетия используются более совершенные компоновки и обработка сигналов для того, чтобы предоставлять улучшенное пространственное восприятие при прослушивании. В частности, стало распространенным использование объемного звука с использованием, например, 5 или 7 пространственных динамиков, чтобы предоставлять расширенное восприятие в связи, например, с просмотром фильмов или телевизионных передач. Помимо этого, компактные системы громкоговорителей с несколькими режимами возбуждения, к примеру, "звуковые жалюзи" стали популярным вариантом для традиционных стереосистем и систем 5.1. Эти устройства предоставляют восприятие широкой пространственной аудиокартины для слушателя даже из небольшого устройства. Это основано на цифровой обработке сигналов и специальной физической компоновке устройства.
Пространственная звуковая обработка все в большей степени использует усовершенствованную обработку сигналов в качестве части воспроизведения звука, чтобы предоставлять улучшенное пространственное восприятие. Например, сложные алгоритмы могут быть использованы для того, чтобы микшировать с увеличением частоты аудиосигнал к более высокому числу каналов. Например, 5-канальный сигнал объемного звучания на передающей стороне может быть смикширован с понижением частоты к стерео- или моносигналу. Этот сигнал затем распределяется, и воспроизведение звука включает в себя микширование с увеличением частоты принимаемого сигнала к исходному 5-канальному сигналу.
В качестве другого примера, обработка сигналов может быть использована для того, чтобы предоставлять эффект расширения звука в стереосигнал, приводящий к восприятию слушателем более широкой звуковой сцены. Типично способы основаны на операциях обработки сигналов, которые уменьшают корреляцию между каналами. Эти технологии, в частности, являются популярными в компактных упомянутых выше акустических системах.
В качестве другого примера, воспроизведение пространственного сигнала может включать в себя извлечение доминирующего источника звука, например, в стереосигнале. Оставшийся остаточный сигнал типично должен соответствовать окружающему стереоизображению, которое является более рассеянным. Доминирующий сигнал и окружающий сигнал затем могут быть воспроизведены по-разному, так что характеристики воспроизведения оптимизируются для каждого сигнала.
Тем не менее, хотя такие технологии пространственного воспроизведения звука улучшают восприятие при прослушивании, зачастую возникают некоторые ассоциированные недостатки. В частности, воспроизведение может не предоставлять оптимальное пространственное восприятие во всех случаях, и обработка сигналов в некоторых случаях может фактически приводить к ухудшенному пространственному восприятию.
Следовательно, улучшенная система для пространственного воспроизведения звука имеет преимущество, в частности, имеет преимущество система, предоставляющая повышенную гибкость, упрощенную работу, упрощенную реализацию, улучшенное пространственное восприятие при прослушивании и/или повышенную производительность.
Сущность изобретения
Следовательно, изобретение предпочтительно нацелено на уменьшение, облегчение или устранение одного или более вышеуказанных недостатков по отдельности или в любом сочетании.
Согласно аспекту изобретения, предусмотрена устройство для пространственного воспроизведения звука, причем устройство содержит: приемное устройство для приема многоканального аудиосигнала; схему для определения пространственного свойства многоканального аудиосигнала; схему для выбора выбранного режима воспроизведения из множества режимов воспроизведения звука в ответ на пространственное свойство, причем режимы многоканального воспроизведения звука используют различные технологии пространственного рендеринга; и схему воспроизведения для возбуждения набора пространственных каналов, предоставляемых посредством набора громкоговорителей, чтобы воспроизводить многоканальный аудиосигнал с использованием выбранного режима воспроизведения; при этом множество режимов воспроизведения звука содержит, по меньшей мере, два из следующего: режим монофонического воспроизведения; режим воспроизведения, поддерживающий пространственные характеристики многоканального сигнала; режим воспроизведения, содержащий обработку пространственного расширения; и режим воспроизведения, содержащий разделение, по меньшей мере, на один доминирующий исходный сигнал и окружающий сигнал и применение различного пространственного воспроизведения, по меньшей мере, одного первичного исходного сигнала и окружающего сигнала.
Изобретение может предоставлять улучшенное воспроизведение звука во многих вариантах осуществления. В частности, улучшенное пространственное восприятие может предоставляться во многих сценариях. Типично, пространственное воспроизведение может быть улучшено для конкретного аудиосигнала. Подход дополнительно может обеспечивать реализацию с низкой сложностью и упрощенную работу во многих вариантах осуществления.
Выбор надлежащего способа воспроизведения может быть оптимизирован для испытываемых конкретных условий при поддержании низкой сложности.
Пространственное свойство может служить признаком пространственной организации и/или пространственной сложности сигнала. Например, пространственное свойство может служить признаком присутствия одного или более доминирующих источников звука в соответствии с подходящим критерием или процессом для извлечения доминирующих источников звука. В некоторых вариантах осуществления, пространственное свойство может служить признаком пространственного распределения источников звука в звуковом изображении, представленном посредством многоканального сигнала.
Набором громкоговорителей, в частности, могут быть громкоговорителями установки объемного звука, содержащей, например, 3, 5 или 7 пространственных динамиков (в дополнение, возможно, к динамику с непространственным низкочастотным эффектом или сабвуферу). Набором громкоговорителей могут быть системы громкоговорителей с несколькими режимами возбуждения типично с тремя или более по отдельности возбуждаемыми громкоговорителями (или массивами громкоговорителей) в одном физическом устройстве. Набор громкоговорителей также может содержать множество таких устройств.
В соответствии с необязательным признаком изобретения, по меньшей мере, один из режимов воспроизведения звука содержит, по меньшей мере, одно из следующего: микширование с увеличением частоты к более высокому числу пространственных каналов, чем число каналов многоканального аудиосигнала; и микширование с понижением частоты к меньшему числу пространственных каналов, чем число каналов многоканального аудиосигнала.
Изобретение может предоставлять улучшенное пространственное восприятие. Например, некоторые звуковые изображения стереосигнала могут предоставлять улучшенное пространственное восприятие при воспроизведении в качестве моносигнала. Другие звуковые изображения стереосигнала могут предоставлять улучшенное пространственное восприятие при воспроизведении в качестве расширенного стереосигнала в комбинации с центральным сигналом, т.е. при воспроизведении с использованием трех пространственных каналов.
В соответствии с необязательным признаком изобретения, набор пространственных каналов содержит различное число каналов, чем многоканальный аудиосигнал.
Изобретение может предоставлять улучшенное пространственное восприятие для системы воспроизведения звука и может, в частности, обеспечивать дополнительные степени свободы в адаптации воспроизведения звука к конкретному звуковому изображению и пространственным характеристикам.
В соответствии с необязательным признаком изобретения, максимальная частота переключения для переключения между режимами воспроизведения звука превышает 1 Гц.
Это позволяет предоставлять динамическую адаптацию и оптимизацию, которая может близко совпадать с варьирующимися характеристиками аудио, тем самым предоставляя улучшенное восприятие при прослушивании.
Признак может обеспечивать повышенную производительность и улучшенную адаптацию режима воспроизведения к аудиосигналу, тем самым предоставляя расширенное восприятие при прослушивании. Подход может обеспечивать краткосрочную адаптацию воспроизведения к характеристикам сигналов.
В некоторых вариантах осуществления, схема для определения пространственного свойства преимущественно может быть выполнена с возможностью определять пространственное свойство с постоянной времени меньше 500 секунд, 100 секунд, 1 секунды, 500 мс, 100 мс или даже 50 мс.
Постоянная времени представляет время, которое требуется для пространственного свойства, чтобы достигать 1-1/e≈63% от своего конечного (асимптотического) значения после ступенчатого изменения.
В некоторых вариантах осуществления, схема для определения пространственного свойства выполнена с возможностью включать в себя фильтрацию нижних частот пространственного свойства, причем фильтрация нижних частот имеет частоту отсечки при 3 дБ, превышающую 0,001 Гц, 0,01 Гц, 0,1 Гц, 1 Гц, 10 Гц или 50 Гц.
Множество режимов воспроизведения звука содержит, по меньшей мере, два из следующего: режим монофонического воспроизведения; режим воспроизведения, поддерживающий пространственные характеристики многоканального сигнала; режим воспроизведения, содержащий обработку пространственного расширения; и режим воспроизведения, содержащий разделение, по меньшей мере, на один доминирующий исходный сигнал и окружающий сигнал и применение различного пространственного воспроизведения, по меньшей мере, одного первичного исходного сигнала и окружающего сигнала.
Эти технологии воспроизведения могут быть, в частности, преимущественными и подходящими для того, чтобы предоставлять улучшенные характеристики прослушивания для различных характеристик аудио. Во многих вариантах осуществления, множество режимов воспроизведения звука преимущественно может содержать два, три, или все четыре режима воспроизведения, поскольку они, в частности, подходят для различных характеристик и тем самым вместе предоставляют набор режимов, которые предоставляют улучшенное воспроизведение для большого спектра характеристик аудио. Технологии могут, в частности, вместе предоставлять подходящие характеристики воспроизведения для широкого диапазона аудиосигналов.
В соответствии с необязательным признаком изобретения, устройство дополнительно содержит: схему для определения характеристики содержимого для многоканального аудиосигнала; при этом схема для выбора выполнена с возможностью дополнительно выбирать выбранный алгоритм воспроизведения в ответ на характеристику содержимого.
Это позволяет дополнительно улучшать адаптацию воспроизведения и предоставлять улучшенное пространственное восприятие во многих вариантах осуществления. Характеристика содержимого, например, может быть определена посредством анализа содержимого многоканального аудиосигнала и/или ассоциированного видеосигнала.
В соответствии с необязательным признаком изобретения, схема для определения характеристики содержимого выполнена с возможностью определять характеристику содержимого в ответ на метаданные, ассоциированные с многоканальным аудиосигналом.
Это позволяет предоставлять, в частности, точный подход с низкой сложностью, который может быть преимущественным во многих вариантах осуществления.
В соответствии с необязательным признаком изобретения, схема для воспроизведения многоканального аудиосигнала выполнена с возможностью адаптировать характеристику технологии пространственного рендеринга выбранного режима воспроизведения в ответ на характеристику содержимого.
Это позволяет дополнительно улучшать адаптацию воспроизведения и предоставлять улучшенное пространственное восприятие во многих вариантах осуществления.
В соответствии с необязательным признаком изобретения, схема для воспроизведения многоканального аудиосигнала выполнена с возможностью адаптировать характеристику технологии пространственного рендеринга выбранного режима воспроизведения в ответ на пространственное свойство.
Это позволяет дополнительно улучшать адаптацию воспроизведения и предоставлять улучшенное пространственное восприятие во многих вариантах осуществления.
В соответствии с необязательным признаком изобретения, характеристикой пространственной обработки является степень пространственного расширения, применяемая, по меньшей мере, к двум каналам многоканального аудиосигнала.
Это позволяет предоставлять, в частности, преимущественную оптимизацию, поскольку пространственное расширение позволяет предоставлять значительно расширенное пространственное восприятие для некоторых характеристик аудио, но может ухудшать пространственное восприятие для других характеристик аудио. Соответственно, оптимизация пространственного расширения к характеристикам аудио позволяет предоставлять, в частности, преимущественную производительность.
В соответствии с необязательным признаком изобретения, схема для воспроизведения многоканального аудиосигнала выполнена с возможностью постепенно переходить от первого выбранного алгоритма воспроизведения ко второму выбранному алгоритму воспроизведения.
Это позволяет предоставлять повышенную производительность и позволяет, в частности, уменьшать заметность изменения между различными режимами воспроизведения. Устройство, в частности, может быть выполнено с возможностью, во время интервала перехода, формировать сигналы возбуждения для набора громкоговорителей с использованием, как первого выбранного алгоритма воспроизведения, так и второго выбранного алгоритма воспроизведения и возбуждать набор громкоговорителей посредством сигналов, сформированных в качестве взвешенной комбинации сигналов возбуждения, причем взвешивание динамически изменяется во время интервала перехода.
В соответствии с необязательным признаком изобретения, схема для определения пространственного свойства выполнена с возможностью определять пространственное свойство в ответ на энергетический индикатор для комбинированного сигнала, по меньшей мере, двух каналов многоканального аудиосигнала относительно энергетического индикатора для разностного сигнала, по меньшей мере, двух каналов.
Это может быть, в частности, преимущественным пространственным свойством для адаптации пространственного воспроизведения. В частности, это позволяет предоставлять преимущественный компромисс между точностью и сложностью для многих сценариев.
В соответствии с необязательным признаком изобретения, схема для определения пространственного свойства выполнена с возможностью раскладывать многоканальный аудиосигнал, по меньшей мере, на один сигнал доминирующего источника звука и остаточный сигнал и определять пространственное свойство в ответ на энергетический индикатор для сигнала доминирующего источника звука относительно энергетического индикатора для остаточного сигнала.
Это может быть, в частности, преимущественным пространственным свойством для адаптации пространственного воспроизведения. В частности, это позволяет предоставлять преимущественный компромисс между точностью и сложностью для многих сценариев.
Согласно аспекту изобретения, предусмотрен способ пространственного воспроизведения звука, при этом способ содержит: прием многоканального аудиосигнала; определение пространственного свойства многоканального аудиосигнала; выбор выбранного режима воспроизведения из множества режимов воспроизведения звука в ответ на пространственное свойство, причем режимы многоканального воспроизведения звука используют различные технологии пространственного рендеринга; и возбуждение набора громкоговорителей, чтобы воспроизводить многоканальный аудиосигнал с использованием выбранного режима воспроизведения; при этом множество режимов воспроизведения звука содержит, по меньшей мере, два из следующего: режим монофонического воспроизведения; режим воспроизведения, поддерживающий пространственные характеристики многоканального сигнала; режим воспроизведения, содержащий обработку пространственного расширения; и режим воспроизведения, содержащий разделение, по меньшей мере, на один доминирующий исходный сигнал и окружающий сигнал и применение различного пространственного воспроизведения, по меньшей мере, одного первичного исходного сигнала и окружающего сигнала.
Эти и другие аспекты, признаки и преимущества изобретения должны становиться очевидными и должны истолковываться со ссылкой на описанные далее варианты осуществления.
Краткое описание чертежей
Варианты осуществления изобретения описаны далее только в качестве примера со ссылкой на чертежи, из которых:
Фиг.1 является иллюстрацией примера системы для пространственного воспроизведения звука в соответствии с некоторыми вариантами осуществления изобретения;
Фиг.2 является иллюстрацией примера элементов системы для пространственного воспроизведения звука в соответствии с некоторыми вариантами осуществления изобретения; и
Фиг.3 является иллюстрацией примера системы для пространственного воспроизведения звука в соответствии с некоторыми вариантами осуществления изобретения.
Подробное описание вариантов осуществления изобретения
Последующее описание сосредоточено на вариантах осуществления изобретения, применимых к пространственному воспроизведению звука стереосигнала с использованием микширования с увеличением частоты к трем каналам. Тем не менее, следует принимать во внимание, что изобретение не ограничено этим вариантом применения, а может быть применено ко многим другим аудиосигналам и способам воспроизведения.
Фиг.1 иллюстрирует пример системы для воспроизведения звука в соответствии с некоторыми вариантами осуществления изобретения. Система содержит приемное устройство 101, которое принимает пространственный аудиосигнал, содержащий множество аудиоканалов. В примере, входной сигнал является стереосигналом, но следует принимать во внимание, что в других вариантах осуществления другие числа каналов могут использоваться. Например, входной сигнал может быть пятиканальным входным сигналом объемного звучания. В некоторых сценариях, входной сигнал может быть кодированным сигналом, и приемное устройство 101 может быть выполнено с возможностью частично или полностью декодировать входной сигнал для последующей обработки посредством системы. Например, для каждого сегмента кодирования, частотное представление входного сигнала может быть сформировано в качестве промежуточного частотного представления, используемого посредством схемы кодирования. Также следует принимать во внимание, что множество каналов входного сигнала может быть представлено посредством одного кодированного аудиосигнала и ассоциированных параметрических данных. Например, многоканальный входной сигнал может быть кодированным моносигналом и пространственными параметрическими данными. В качестве конкретного примера, входной сигнал может быть параметрическим стереосигналом.
Входной многоканальный аудиосигнал может быть принят из любого внутреннего или внешнего источника.
Приемное устройство 101 соединяется со схемой 103 формирователя сигналов возбуждения, которая принимает многоканальный (в конкретном примере стереосигнал) из приемного устройства 101. Схема 103 формирователя сигналов возбуждения формирует сигналы возбуждения для набора громкоговорителей 105. Набор громкоговорителей предоставляет число пространственных каналов. В примере, громкоговорители предоставляют левый канал, правый канал и центральный канал, но следует принимать во внимание, что в других вариантах осуществления больше (или меньше) пространственных каналов могут предоставляться. Например, в некоторых вариантах осуществления, громкоговорители могут предоставлять только левый и правый канал. В других вариантах осуществления, полная система объемного звучания снабжена например, пятью или семью пространственными каналами.
В некоторых примерах, число пространственных каналов, предоставляемых посредством динамиков в наборе громкоговорителей 105, может быть равным числу каналов в многоканальном сигнале. Тем не менее, в примере, число пространственных каналов, предоставляемых посредством набора громкоговорителей 105, больше числа каналов в многоканальном сигнале. В примере, схема 103 формирователя сигналов возбуждения может работать в некоторых режимах воспроизведения, которые включают в себя микширование с увеличением частоты каналов многоканального сигнала к числу пространственных каналов. Альтернативно или дополнительно, схема 103 формирователя сигналов возбуждения может включать в себя функциональность для выбора поднабора доступных каналов, по меньшей мере, в некоторых режимах воспроизведения, причем поднабор отличается в различных режимах воспроизведения. Один или более этих режимов дополнительно может включать в себя микширование с понижением частоты входных каналов. Например, для входного стереосигнала, один режим воспроизведения может предоставлять вывод с использованием двух из пространственных каналов (например, левого и правого), другой режим воспроизведения может использовать только один пространственный канал (например, центральный канал), и еще один другой режим воспроизведения может использовать три пространственных канала (например, левый, правый и центральный канал).
В конкретном примере, набор громкоговорителей 105 содержит три громкоговорителя в пространственной компоновке, тем самым предоставляя три пространственных канала. Таким образом, динамики набора громкоговорителей 105 соответствуют левому, правому и среднему динамику.
Таким образом, набор громкоговорителей выполнен с возможностью предоставлять пространственное восприятие. В некоторых вариантах осуществления, схема 103 формирователя сигналов возбуждения может знать точное размещение громкоговорителей относительно позиции прослушивания, но типично это не происходит, и пространственное воспроизведение звука основано на допускаемом размещении громкоговорителей, как известно из традиционных систем объемного звучания и стереосистем. Набор громкоговорителей предоставляет множество пространственных каналов, например, они могут предоставлять левый, правый и центральный пространственный канал, которые используются для того, чтобы предоставлять пространственное восприятие для слушателя. Тем не менее, набор громкоговорителей не должен иметь один отдельный громкоговоритель для каждого канала. Например, набор громкоговорителей может содержать массив громкоговорителей и ассоциированную функциональность возбуждения для предоставления пространственных каналов с использованием технологий формирования диаграммы направленности аудио. Таким образом, громкоговорители из набора громкоговорителей 105 по фиг.1 могут восприниматься в качестве виртуальных громкоговорителей, которые соответствуют данному пространственному местоположению или каналу. В некоторых вариантах осуществления, каждый виртуальный громкоговоритель может соответствовать физическому громкоговорителю, но это не необходимо во всех вариантах осуществления.
Схема 103 формирователя сигналов возбуждения выполнена с возможностью использовать различные режимы воспроизведения звука при возбуждении громкоговорителей 105. Различные режимы воспроизведения звука используют различные технологии пространственного рендеринга. Таким образом, различные режимы воспроизведения звука могут применять различные алгоритмы пространственной обработки, и тем самым различные режимы воспроизведения звука имеют различные пространственные характеристики аудио. Например, один режим воспроизведения звука может представлять многоканальный сигнал с использованием только одного громкоговорителя 105 (т.е. в качестве моновоспроизведения), другой режим воспроизведения может просто возбуждать каждый громкоговоритель с помощью сигнала соответствующего пространственного канала вообще без пространственной обработки, тем самым поддерживая пространственные характеристики входного сигнала. Еще один другой режим воспроизведения может расширять входные каналы по всем громкоговорителям и вводить пространственное расширение. Таким образом, схема 103 формирователя сигналов возбуждения спроектирована с возможностью позволять предоставлять существенно отличающуюся пространственную обработку и возбуждать набор громкоговорителей 105 с существенно отличающимися свойствами. Фактически, различные режимы воспроизведения не просто используют различные настройки параметров для данной пространственной обработки, но применяют различные базовые принципы и в конкретном использовании различные алгоритмы и способы пространственной обработки.
Такое множество режимов воспроизведения может обеспечивать предоставление существенно отличающихся эффектов посредством системы и может обеспечивать высокую изменчивость в пространственном восприятии слушателя. Тем не менее, авторы изобретения выяснили, что хотя пространственная обработка сигналов может предоставлять расширенное восприятие, она также может в некоторых случаях приводить к уменьшенному пространственному восприятию. Например, эффект алгоритма преобразования аудиоформата (к примеру, пространственное расширение, микширование с увеличением частоты, преобразование в моносигнал и т.д.) на воспринимаемое стереоизображение может различаться для различного содержимого и характеристик сигналов.
Например, способ может предоставлять широкое пространственное изображение, которое является подходящим для сцены боевика, но этот способ может восприниматься как беспокоящий и нечеткий в случае программы новостей или музыки с одним инструментом. Т.е. микширование с увеличением частоты или стереорасширение, которое может быть подходящим для одного типа содержимого, может формировать нежелательный эффект при использовании для другого типа содержимого.
В качестве другого примера, алгоритмы микширования с увеличением частоты, которые нацелены на извлечение центрального канала из стереосигнала, могут не всегда работать оптимально, когда нет четкого центрального источника звука в стереосмешении. Если способ извлечения центрального канала используется для такого содержимого, это может приводить к уменьшению ширины стереоизображения.
Предоставление возможности конечному пользователю вручную выбирать или регулировать режим воспроизведения может обеспечивать снижение этой чувствительности, поскольку пользователь может выбирать режим, предоставляющий самое приятное пространственное восприятие. Тем не менее, авторы изобретения выяснили, что это решение зачастую может быть непрактичным, поскольку оно обеспечивает только медленную и очень трудоемкую адаптацию.
Решение может состоять в том, чтобы задавать режим воспроизведения для каждого возможного типа аудио. Например, для программы новостей используется один конкретный режим воспроизведения, для фильма используется другой конкретный режим воспроизведения и т.д. Тем не менее, авторы изобретения выяснили, что такой подход с большой вероятностью является неточным, поскольку предпочтительное пространственное воспроизведение может не быть связано напрямую с определенным типом аудио.
Фактически, авторы изобретения выяснили, что существенно улучшенное восприятие зачастую может достигаться посредством реализации динамического выбора в реальном времени подходящего режима воспроизведения. Авторы изобретения дополнительно выяснили, что преимущественная производительность может достигаться посредством реализации такого динамического выбора на основе пространственного свойства входного сигнала. Таким образом, в системе по фиг.1, режим воспроизведения динамически выбирается на основе пространственного свойства входного сигнала. Тем самым, достигается быстрая адаптация в реальном времени режима воспроизведения к конкретным изменениям во входном сигнале.
Такой подход обеспечивает автоматическое и динамическое приспособление воспроизведения звука к текущим характеристикам сигнала, тем самым обеспечивая расширенное восприятие при прослушивании. Кроме того, подход обеспечивает очень быструю адаптацию, что разрешает оптимизацию режима воспроизведения для текущих характеристик и настроек вместо средних или ожидаемых характеристик, например, для определенного типа аудио или конкретного типа программы, который представляет аудио. Например, подход обеспечивает динамическое и автоматическое изменение режима воспроизведения во время звуковой дорожки фильма, так что, например, звуки диалогов и действий воспроизводятся посредством наиболее подходящего алгоритма воспроизведения для этого конкретного звука. Например, известно, что пространственное изображение зачастую изменяется непрерывно в течение длительности мультимедийного элемента. Например, аудиосцена фильма может содержать чередование между широкими сценами стереофонического аудио и моментами, когда только один источник звука, к примеру, речь актера, является слышимым. В первом случае требуется, чтобы стереоизображение было широким и иммерсивным, в то время как во втором случае естественно иметь четко локализованное пространственное местоположение для речи. Система по фиг.1 предусматривает автоматическое регулирование режима воспроизведения, чтобы отражать такие настройки.
В частности, система по фиг.1 содержит анализатор 107, который выполнен с возможностью определять пространственное свойство многоканального аудиосигнала. Пространственное свойство может, в частности, быть индикатором относительно степени пространственной организации или сложности, которая присутствует во входном сигнале. Пространственное свойство может служить признаком степени пространственного расширения и может, в частности, служить признаком того, отличается входной сигнал посредством одного или более одиночных четко определенных источников звука или в большей степени отличается посредством окружающего звука без сильных направленных меток.
Анализатор 107 соединяется с процессором 109 выбора, в который подается пространственное свойство и который выполнен с возможностью выбирать режим воспроизведения из множества режимов воспроизведения звука, которые могут быть использованы посредством схемы 103 формирователя сигналов возбуждения. Процессор 109 выбора дополнительно соединен со схемой 103 формирователя сигналов возбуждения и управляет ей, чтобы использовать выбранный режим воспроизведения. Таким образом, по мере того как пространственное свойство варьируется, процессор 109 выбора динамически и автоматически переключается между режимами воспроизведения, чтобы предоставлять оптимальную обработку воспроизведения для текущих характеристик. Таким образом, достигается улучшенное пространственное восприятие.
Система, в частности, выполнена с возможностью обеспечивать краткосрочную адаптацию режима воспроизведения к характеристикам сигналов. Таким образом, может разрешаться быстрое переключение, тем самым позволяя пространственному воспроизведению не только быть оптимизированным в среднем (за длительный период), но также и совпадать с более мгновенными изменениями сигнала.
Соответственно, анализатор 107 выполнен с возможностью формировать оценку в форме пространственного свойства, которое подвергается фильтрации нижних частот или усредняется, но с относительно высокой частотой. Аналогично, фактическое переключение между режимами воспроизведения может выполняться с относительно высокой частотой. Таким образом, вместо того, чтобы выбирать режим воспроизведения и использовать его, например, для всей программы, система по фиг.1 динамически адаптирует режим воспроизведения так, что он совпадает с краткосрочными изменениями в характеристиках сигналов.
Предпочтительные динамические характеристики системы могут зависеть от конкретных характеристик и настроек отдельного варианта осуществления.
Тем не менее, во многих вариантах осуществления, в частности, преимущественная производительность может достигаться с помощью системы, которая обеспечивает обновления режима воспроизведения с интервалами, которые варьируются в диапазоне типично приблизительно от 50 мс до 5 минут. Точный динамический характер может быть выбран на основе компромисса между точностью адаптации к текущим характеристикам сигнала и надежностью системы и степенью артефактов, ассоциированных с переключением между различными режимами.
Во многих вариантах осуществления, фильтрация нижних частот, включенная при определении пространственного свойства, преимущественно имеет частоту отсечки при 3 дБ, превышающую 0,001 Гц, 0,01 Гц, 0,1 Гц, 1 Гц, 10 Гц или 50 Гц, в зависимости от конкретных настроек отдельного варианта осуществления. Соответственно, пространственное свойство преимущественно может быть определено с постоянной времени меньше 500 секунд, 100 секунд, 10 секунд, 1 секунды, 500 мс, 100 мс или даже 50 мс. Постоянная времени может задаваться как время, которое требуется для пространственного свойства, чтобы достигать 1-1/e≈63% от своего конечного (асимптотического) значения после ступенчатого изменения. Например, пространственное свойство может отслеживать или зависеть от одной или более пространственных характеристик многоканального сигнала. Ступенчатое изменение в этой пространственной характеристике при поддержании всех остальных параметров постоянными должно приводить к изменению в пространственном свойстве. Постоянная времени для определения пространственного свойства затем может измеряться в качестве времени, которое требуется для этого изменения, чтобы достигать 1-1/e≈63% от своего конечного (асимптотического) значения.
Аналогично, переключение может компоноваться в соответствии с аналогичной динамикой. В частности, максимальная частота переключения для переключения между режимами воспроизведения может превышать 0,01 Гц; 0,1 Гц, 1 Гц или даже 10 Гц. Максимальная частота может быть наиболее быстрым возможным переключением вследствие определения пространственного свойства и/или фактической операции переключения. Таким образом, максимальная частота переключения может быть наибольшим изменением частоты в базовых пространственных характеристиках аудиосигнала, которому может следовать система.
В конкретном варианте осуществления, схема 103 формирователя сигналов возбуждения выполнена с возможностью переключаться между четырьмя различными режимами воспроизведения.
В первом режиме воспроизведения схема 103 формирователя сигналов возбуждения просто поддерживает исходный стереосигнал и не вводит пространственной модификации. Таким образом, этот режим работы поддерживает пространственные характеристики многоканального входного сигнала. В конкретном примере, входной стереосигнал просто воспроизводится в качестве стереосигнала, т.е. левый входной канал подается в левый громкоговоритель, а правый входной канал подается в правый громкоговоритель, и сигнал вообще не подается в центральный громкоговоритель. Таким образом, в этом режиме воспроизведения схема 103 формирователя сигналов возбуждения предоста