2520420 - Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала

Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала

Иллюстрации

Показать все

Изобретение относится к средствам фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал. Технический результат заключается в повышении разборчивости речи, определяемой сигналом. Определяют по меньшей мере одно значение управления ослаблением, служащее признаком меры сходства между относящимся к речи содержанием, определяемым речевым каналом, и относящимся к речи содержанием, определяемым неречевым каналом. Ослабляют неречевой канал в ответ по меньшей мере на одно значение управления ослаблением. Масштабируют необработанный сигнал управления ослаблением (например, сигнал управления усилением с подавлением слабого сигнала более сильным) для неречевого канала в ответ по меньшей мере на одно значение управления ослаблением. 10 н.з. и 56 з.п. ф-лы, 7 ил.

Реферат

Перекрестная ссылка на родственные заявки

Данная заявка заявляет приоритет предварительной заявки на патент США № 61/311437, поданной 8 марта 2010 г., которая полностью включена в настоящий документ посредством ссылки.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ

1. Область технического применения

Изобретение относится к системам и способам улучшения разборчивости человеческой речи (например, диалога), определенной многоканальным звуковым сигналом. В некоторых вариантах осуществления изобретение представляет собой способ и систему для фильтрации звукового сигнала, содержащего речевой канал и неречевой канал, с целью улучшения разборчивости речи, определенной сигналом, путем определения по меньшей мере одного значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным неречевым каналом, и ослабления неречевого канала в ответ на значение управления ослаблением.

2. Предпосылки изобретения

Повсюду в данном раскрытии, включая формулу изобретения, термин «речь» употребляется в широком смысле для обозначения человеческой речи. Поэтому «речь», определенная звуковым сигналом, представляет собой звуковое содержание сигнала, которое воспринимается как человеческая речь (например, диалог, монолог, пение или другая человеческая речь) при воспроизведении сигнала громкоговорителем (или другим звукоизлучающим преобразователем). Согласно типичным вариантам осуществления изобретения, слышимость речи, определенной звуковым сигналом, улучшается относительно другого звукового содержания (например, инструментальной музыки или неречевых звуковых эффектов), определенного сигналом, что, таким образом, улучшает разборчивость (например, ясность или легкость понимания) речи.

Повсюду в данном раскрытии, включая формулу изобретения, выражение «усиливающее речь содержание» канала или многоканального звукового сигнала представляет содержание (определенное каналом), которое усиливает разборчивость или другое воспринимаемое качество речевого содержания, определенное другим каналом (например, речевым каналом) сигнала.

Типичные варианты осуществления изобретения предполагают, что большая часть речи, определенная многоканальным входным звуковым сигналом, определяется центральным каналом этого сигнала. Это предположение находится в соответствии с общепринятым условием при получении окружающего звука, согласно которому большая часть речи обычно помещается только в один канал (центральный канал), и большая часть музыки, звукового сопровождения и звуковых эффектов обычно микшируется во все каналы (например, в левый, правый, левый окружающий и правый окружающий также хорошо, как и в центральный канал).

Поэтому центральный канал многоканального звукового сигнала в данном раскрытии иногда будет именоваться «речевым» каналом, а все остальные каналы сигнала (например, левый, правый, левый окружающий и правый окружающий) в данном описании иногда будут именоваться «неречевыми» каналами. Аналогично, «центральный» канал, генерируемый путем суммирования левого и правого каналов стереофонического сигнала, речь которого панорамируется по центру, в данном раскрытии иногда будет именоваться «речевым» каналом, а «побочный» канал, генерируемый путем вычитания такого центрального канала из левого (или правого) канала стереофонического сигнала, в данном раскрытии иногда будет именоваться «неречевым» каналом.

Повсюду в данном раскрытии, включая формулу изобретения, выражение выполнения операции «на» сигналах или данных (например, фильтрация, масштабирование, или преобразование сигналов или данных) употребляется в широком смысле для обозначения выполнения операции непосредственно на сигналах или данных или на обработанных версиях сигналов или данных (например, на версиях сигналов, которые перед выполнением на них указанной операции были подвергнуты предварительной фильтрации).

Повсюду в данном раскрытии, включая формулу изобретения, выражение «система» употребляется в широком смысле для обозначения устройства, системы или подсистемы. Например, подсистема, которая реализует декодер, может именоваться системой декодера, и система, содержащая такую подсистему (например, система, которая генерирует Х выходных сигналов в ответ на ряд входных сигналов, в которой подсистема генерирует М входных сигналов, и остальные Х-М входные сигналы принимаются из внешнего источника), также может именоваться системой декодера.

Повсюду в данном раскрытии, включая формулу изобретения, выражение «соотношение» первой величины («А») ко второй величине («В») употребляется в широком смысле для обозначения A/B, или B/A, или соотношения масштабированной, или смещенной, версии одной из величин, А или В, и масштабированной, или смещенной, версии другой величины, А или В (например, (A+x)/(B+y), где x и y - значения смещения).

Повсюду в данном раскрытии, включая формулу изобретения, выражение «воспроизведение» сигналов звукоизлучающими преобразователями (например, динамиками) обозначает вызов преобразователей для генерирования звука в ответ на сигналы, включая выполнение любого требуемого усиления и/или другой обработки сигналов.

Когда речь слышится в присутствии конкурирующих звуков (так, как при слушании друга сквозь шум толпы в ресторане), часть акустических свойств, которые передают фонематическое содержание речи (реплик), маскируется конкурирующими звуками и больше не является доступной слушателю для декодирования сообщения. По мере того как уровень конкурирующего звука увеличивается относительно уровня речи, сокращается количество реплик, которые принимаются верно, и восприятие речи постепенно становится все более затруднительным до тех пор, пока, при некотором уровне конкурирующего звука, процесс восприятия речи не прекратится. И хотя данная зависимость сохраняет силу для всех слушателей, уровень конкурирующего звука, который является допустимым для любого уровня речи, неодинаков для всех слушателей. Некоторые слушатели, например те, у которых потеря слуха по причине старения (пресбиакузиса), или те, которые слушают язык, приобретенный ими после полового созревания, менее способны к тому, чтобы переносить конкурирующие звуки, чем слушатели с хорошим слухом или слушатели, использующие их родной язык.

Тот факт, что слушатели отличаются своей способностью понимать речь в присутствии конкурирующих звуков, имеет последствия для уровня, на котором звуковое сопровождение и музыкальный фон в новостях или развлекательном звуковом материале смешивается с речью. Слушатели с потерей слуха, или слушатели, использующие иностранный язык, часто предпочитают менее высокий относительный уровень неречевого звукового материала, чем тот уровень, который предусматривается информационным наполнителем.

Для приспособления к этим специальным потребностям известно применение ослабления (подавления слабого сигнала более сильным) к неречевым каналам многоканального звукового сигнала, и применение меньшего ослабления (или отсутствие его применения) к речевому каналу сигнала для того, чтобы улучшить разборчивость речи, определяемой сигналом.

Например, международная заявка PCT, номер публикации WO №2010/011377, именующая автором изобретения Hannes Muesch и переданная Dolby Laboratories Licensing Corporation (опубликована 28 января 2010 г.), раскрывает то, что неречевые каналы (например, левый и правый каналы) многоканального звукового сигнала могут маскировать речь в речевом канале сигнала (например, в центральном канале) до точки, в которой требуемый уровень разборчивости речи больше не является удовлетворительным. WO №2010/011377 описывает, как определить функцию ослабления, предназначенную для ее применения схемой подавления слабого сигнала более сильным к неречевым каналам в попытке демаскировать речь в речевом канале, сохраняя при этом максимальную возможную часть замысла информационного наполнителя. Технология, описанная в WO №2010/011377, основывается на допущении, что содержание неречевого канала никогда не улучшает разборчивость (или другое воспринимаемое качество) речевого содержания, определенного речевым каналом.

Настоящее изобретение частично основывается на признании того, что, несмотря на то, что данное допущение верно для подавляющей части многоканального звукового содержания, оно действительно не всегда. Автор изобретения признал, что, когда по меньшей мере один неречевой канал многоканального звукового сигнала не содержит содержание, которое улучшает разборчивость (или другое воспринимаемое качество) речевого содержания, определяемого речевым каналом сигнала, фильтрация сигнала по способу согласно WO №2010/011377 может отрицательно повлиять на развлекательные впечатления лица, прослушивающего воспроизводимый фильтрованный сигнал. Согласно типичным вариантам осуществления настоящего изобретения, в те моменты времени, когда содержание не согласуется с допущением, лежащим в основе способа согласно WO №2010/011377, применение способа, описанного в WO №2010/011377, приостанавливается или модифицируется.

Существует потребность в способе и системе для фильтрации многоканального звукового сигнала с целью улучшения разборчивости речи в общем случае, когда по меньшей мере один неречевой канал звукового сигнала содержит содержание, которое улучшает разборчивость речевого содержания в речевом канале звукового сигнала.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В первом классе вариантов осуществления изобретение представляет собой способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определенной сигналом. Способ предусматривает следующие этапы: (a) определение по меньшей мере одного значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенный речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом многоканального звукового сигнала; и (b) ослабление по меньшей мере одного неречевого канала многоканального звукового сигнала в ответ по меньшей мере на одно значение управления ослаблением. Как правило, этап ослабления содержит масштабирование необработанного сигнала управления ослаблением (например, сигнала управления усилением с подавлением слабого сигнала более сильным) для неречевого канала в ответ по меньшей мере на одно значение управления ослаблением. Предпочтительно, неречевой канал ослабляется так, чтобы улучшить разборчивость речи, определенной речевым каналом, без нежелательного ослабления усиливающего речь содержания, определенного неречевым каналом. В некоторых вариантах осуществления изобретения каждое значение управления ослаблением, определенное на этапе (а), служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным одним неречевым каналом звукового сигнала, и этап (b) предусматривает этап ослабления указанного неречевого канала в ответ на каждое указанное значение управления ослаблением. В некоторых других вариантах осуществления изобретения этап (а) предусматривает этап получения производного неречевого канала из по меньшей мере одного неречевого канала звукового сигнала, и по меньшей мере одно значение управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным производным неречевым каналом. Например, производный неречевой канал может быть сгенерирован путем суммирования, или иного микширования или сочетания по меньшей мере двух неречевых каналов звукового сигнала. Определение каждого значения управления ослаблением из единственного производного неречевого канала может снижать стоимость и сложность реализации некоторых вариантов осуществления изобретения в отношении стоимости и сложности определения различных подмножеств множества значений коэффициента ослабления из других неречевых каналов. В тех вариантах осуществления изобретения, где входной звуковой сигнал содержит по меньшей мере два неречевых канала, этап (b) может предусматривать этап ослабления подмножества неречевых каналов (например, каждого из неречевых каналов, из которых был получен производный неречевой канал) или всех неречевых каналов в ответ по меньшей мере на одно значение управления ослаблением (например, в ответ на единственную последовательность значений управления ослаблением).

В некоторых вариантах осуществления изобретения в первом классе этап (а) предусматривает этап генерирования сигнала управления ослаблением, служащего признаком последовательности значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом, в разное время (например, в другом промежутке времени), и этап (b) предусматривает следующие этапы: масштабирование сигнала управления усилением с подавлением слабого сигнала более сильным в ответ на сигнал управления ослаблением с целью генерирования масштабированного сигнала управления усилением, и применение масштабированного сигнала управления усилением для ослабления по меньшей мере одного неречевого канала (например, передачу масштабированного сигнала управления усилением в схему подавления слабого сигнала более сильным с целью управления ослаблением схемой подавления слабого сигнала более сильным по меньшей мере одного неречевого канала). Например, в некоторых таких вариантах осуществления изобретения этап (а) предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств (служащей признаком относящегося к речи содержания, определенного речевым каналом) со второй последовательностью относящихся к речи характерных свойств (служащей признаком относящегося к речи содержания, определенного по меньшей мере одним неречевым каналом) с целью генерирования сигнала управления ослаблением, и каждое из значений управления ослаблением, указываемых сигналом управления ослаблением, служит признаком меры сходства между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств в разное время (например, в другом промежутке времени). В некоторых вариантах осуществления изобретения каждое значение управления ослаблением представляет собой значение управления усилением.

В некоторых вариантах осуществления изобретения в первом классе каждое значение управления ослаблением монотонно относится к вероятности того, что по меньшей мере один неречевой канал звукового сигнала служит признаком усиливающего речь содержания, которое улучшает разборчивость (или другое воспринимаемое качество) речевого содержания, определенного речевым каналом. В некоторых других вариантах осуществления изобретения в первом классе каждое значение управления ослаблением монотонно относится к ожидаемому усиливающему речь значению по меньшей мере одного неречевого канала (например, по мере вероятности того, что по меньшей мере один неречевой канал служит признаком усиливающего речь содержания, умноженного на меру улучшения воспринимаемого качества, которое усиливающее речь содержание, определенное по меньшей мере одним неречевым каналом, могло бы обеспечивать для речевого содержания, определенного многоканальным сигналом). Например, когда этап (а) предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного по меньшей мере одним неречевым каналом, первая последовательность относящихся к речи характерных свойств может представлять собой последовательность значений вероятности речи, каждое из которых указывает в разное время (например, в другом промежутке времени) вероятность того, что речевой канал служит признаком речи (а не иного, чем речь звукового содержания), и вторая последовательность относящихся к речи характерных свойств также может представлять собой последовательность значений вероятности речи, каждое из которых указывает в разное время (например, в другом промежутке времени) вероятность того, что неречевой канал служит признаком речи. Известны различные способы автоматического генерирования из звукового сигнала указанных последовательностей значений вероятности речи. Например, один из таких способов описан авторами Robinson и Vinton в препринте "Automated Speech/Other Discrimination for Loudness Monitoring" (Audio Engineering Society, Preprint number 6437 of Convention 118, май 2005 года).

В альтернативном варианте предполагается, что последовательности значений вероятности речи могут создаваться вручную (например, информационным наполнителем) и передаваться конечному пользователю параллельно с многоканальным звуковым сигналом.

Во втором классе вариантов осуществления изобретения, где многоканальный звуковой сигнал содержит речевой канал и по меньшей мере два неречевых канала, которые содержат первый неречевой канал и второй неречевой канал, способ изобретения включает следующие этапы: (а) определение по меньшей мере одного первого значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и вторым относящимся к речи содержанием, определенным первым неречевым каналом (например, определение, которое заключается в сравнении первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком второго относящегося к речи содержания); и (b) определение по меньшей мере одного второго значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и третьим относящимся к речи содержанием, определенным вторым неречевым каналом (определение, которое заключается в сравнении третьей последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, с четвертой последовательностью относящихся к речи характерных свойств, служащей признаком третьего относящегося к речи содержания, где третья последовательность относящихся к речи характерных свойств может быть идентична первой последовательности относящихся к речи характерных свойств из этапа (а)). Как правило, способ предусматривает этап ослабления первого неречевого канала (например, масштабируемого ослабления первого неречевого канала) в ответ по меньшей мере на одно первое значение управления ослаблением и ослабления второго неречевого канала (например, масштабируемого ослабления второго неречевого канала) в ответ по меньшей мере на одно второе значение управления ослаблением. Предпочтительно, каждый неречевой канал ослабляется так, чтобы улучшить разборчивость речи, определенной речевым каналом, без нежелательного ослабления усиливающего речь содержания, определенного тем или иным неречевым каналом.

В некоторых вариантах осуществления изобретения во втором классе:

по меньшей мере одно первое значение управления ослаблением, определенное на этапе (а), представляет собой последовательность значений управления ослаблением, и каждое из значений управления ослаблением представляет собой значение управления усилением, предназначенное для масштабирования величины усиления, применяемого к первому неречевому каналу схемой подавления слабого сигнала более сильным с тем, чтобы улучшить разборчивость речи, определенной речевым каналом, без нежелательного ослабления усиливающего речь содержания, определенного первым неречевым каналом; и

по меньшей мере одно второе значение управления ослаблением, определенное на этапе (b), представляет собой последовательность вторых значений управления ослаблением, и каждое из вторых значений управления ослаблением представляет собой значение управления усилением, предназначенное для масштабирования величины усиления, применяемого ко второму неречевому каналу схемой подавления слабого сигнала более сильным с тем, чтобы улучшить разборчивость речи, определенной речевым каналом, без нежелательного ослабления усиливающего речь содержания, определенного вторым неречевым каналом.

В третьем классе вариантов осуществления изобретение представляет собой способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определенной сигналом. Способ предусматривает следующие этапы: (а) сравнение характеристики речевого канала и характеристики неречевого канала с целью генерирования по меньшей мере одного значения коэффициента ослабления, предназначенного для управления ослаблением неречевого канала относительно речевого канала; и (b) корректировка по меньшей мере одного значения коэффициента ослабления в ответ по меньшей мере на одно значение вероятности усиления речи с целью генерирования по меньшей мере одного скорректированного значения коэффициента ослабления, предназначенного для управления ослаблением неречевого канала относительно речевого канала. Как правило, этап корректировки представляет собой (или содержит) масштабирование каждого указанного значения коэффициента ослабления в ответ на одно указанное значение вероятности усиления речи с целью генерирования указанного скорректированного значения коэффициента ослабления. Как правило, каждое значение вероятности усиления речи служит признаком (например, монотонно относится к) вероятности того, что неречевой канал (или неречевой канал, полученный из неречевого канала или из множества неречевых каналов входного звукового сигнала) служит признаком усиливающего речь содержания (содержания, которое улучшает разборчивость или другое воспринимаемое качество речевого содержания, определенного речевым каналом). В некоторых вариантах осуществления изобретения значение вероятности усиления речи служит признаком ожидаемого усиливающего речь значения для неречевого канала (например, мерой вероятности того, что неречевой канал служит признаком усиливающего речь содержания, умноженного на меру улучшения воспринимаемого качества, которое усиливающее речь содержание неречевого канала могло бы обеспечивать для речевого содержания, определенного многоканальным звуковым сигналом). В некоторых вариантах осуществления изобретения в третьем классе по меньшей мере одно значение вероятности усиления речи представляет собой последовательность сравнительных значений (например, значений разности), определенных по способу, который предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, и каждое из сравнительных значений является мерой сходства между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств в разное время (например, в другом промежутке времени). В типичных вариантах осуществления изобретения в третьем классе способ также включает этап ослабления неречевого канала в ответ по меньшей мере на одно скорректированное значение коэффициента ослабления. Этап (b) может содержать масштабирование по меньшей мере одного значения коэффициента ослабления (которое, как правило, является, или определяется, сигналом управления усилением с подавлением слабого сигнала более сильным или другого необработанного сигнала управления ослаблением) в ответ по меньшей мере на одно значение вероятности усиления речи.

В некоторых вариантах осуществления изобретения в третьем классе каждое значение коэффициента ослабления, генерируемое на этапе (а), представляет собой первый множитель, служащий признаком величины коэффициента ослабления неречевого канала, необходимой для ограничения соотношения мощности сигнала в неречевом канале и мощности сигнала в речевом канале так, чтобы оно не превышало предварительно определенное пороговое значение, масштабированное посредством второго множителя, монотонно связанного с вероятностью того, что речевой канал служит признаком речи. Как правило, этап корректировки в этих вариантах осуществления изобретения представляет собой (или содержит) масштабирование каждого указанного значения коэффициента ослабления посредством одного указанного значения вероятности усиления речи с целью генерирования одного указанного скорректированного значения коэффициента ослабления, где значение вероятности усиления речи представляет собой множитель, монотонно связанный с одной из следующих величин: вероятностью того, что неречевой канал служит признаком усиливающего речь содержания (содержания, которое увеличивает разборчивость, или другое воспринимаемое качество, речевого содержания, определенного многоканальным звуковым сигналом), и ожидаемым усиливающим речь значением для неречевого канала (например, мерой вероятности того, что неречевой канал служит признаком усиливающего речь содержания, умноженной на меру улучшения воспринимаемого качества, которое усиливающее речь содержание неречевого канала могло бы обеспечивать для речевого содержания, определяемого многоканальным звуковым сигналом).

В некоторых вариантах осуществления изобретения в третьем классе каждое значение коэффициента ослабления, генерируемое на этапе (а), представляет собой первый множитель, служащий признаком величины (например, минимальной величины) ослабления неречевого канала, достаточной для того, чтобы вызывать превышение предварительно определенного порогового значения прогнозируемой разборчивостью речи, определяемой речевым каналом в присутствии содержания, определенного неречевым каналом, масштабированный посредством второго множителя, монотонно связанного с вероятностью того, что речевой канал служит признаком речи. Предпочтительно, прогнозируемая разборчивость речи, определенная речевым каналом в присутствии содержания неречевого канала, определяется согласно модели прогнозирования разборчивости на психоакустической основе. Как правило, этап корректировки в данных вариантах осуществления изобретения представляет собой (или содержит) масштабирование каждого указанного значения коэффициента ослабления посредством одного указанного значения вероятности усиления речи с целью генерирования одного указанного скорректированного значения коэффициента ослабления, где значение вероятности усиления речи представляет собой множитель, монотонно связанный с одной из следующих величин: вероятностью того, что неречевой канал служит признаком усиливающего речь содержания, и ожидаемым усиливающим речь значением неречевого канала.

В некоторых вариантах осуществления изобретения в третьем классе этап (а) предусматривает этапы генерирования каждого указанного значения коэффициента ослабления, заключающегося в определении спектра мощности (служащего признаком мощности как функции частоты) каждого из каналов, речевого канала и неречевого канала, и выполнения в частотной области определения значения коэффициента ослабления в ответ на каждый из указанных спектров мощности. Предпочтительно, значения коэффициента ослабления, генерируемые таким образом, определяют ослабление как функцию частоты, которую необходимо приложить к частотным составляющим неречевого канала.

В одном из классов вариантов осуществления изобретение представляет собой способ и систему для усиления речи, определенной многоканальным входным звуковым сигналом. В некоторых вариантах осуществления изобретения система согласно изобретению содержит модуль (подсистему) анализа, сконфигурированный для анализа входного многоканального сигнала с целью генерирования значений управления ослаблением, и подсистему ослабления. Подсистема ослабления сконфигурирована для применения ослабления с подавлением слабого сигнала более сильным, которое управляется по меньшей мере некоторыми из значений управления ослаблением, к каждому неречевому каналу входного сигнала с целью генерирования фильтрованного выходного звукового сигнала. В некоторых вариантах осуществления изобретения подсистема ослабления содержит схему подавления слабого сигнала более сильным (управляемую по меньшей мере некоторыми из значений управления ослаблением), подключенную и сконфигурированную для применения ослабления (подавления слабого сигнала более сильным) к каждому неречевому каналу входного сигнала с целью генерирования фильтрованного выходного звукового сигнала. Схема подавления слабого сигнала более сильным управляется управляющими значениями в том смысле, что ослабление, которое она применяет к неречевым каналам, определяется текущими значениями управляющих значений.

В типичных вариантах осуществления изобретения система согласно изобретению представляет собой, или содержит, универсальный или специализированный процессор, запрограммированный посредством программного обеспечения (или встроенного программного обеспечения) и/или иначе сконфигурированный для выполнения одного из вариантов осуществления способа изобретения. В некоторых вариантах осуществления изобретения система согласно изобретению представляет собой универсальный процессор, подключенный для приема входных данных, служащих признаком входного звукового сигнала, и запрограммированный (посредством надлежащего программного обеспечения) на генерирование выходных данных, служащих признаком выходного звукового сигнала, в ответ на входные данные путем выполнения одного из вариантов осуществления способа изобретения. В других вариантах осуществления изобретения система согласно изобретению реализуется путем надлежащего конфигурирования (например, программирования) конфигурируемого процессора обработки цифровых звуковых сигналов (DSP). Звуковой DSP может представлять собой традиционный DSP, который является конфигурируемым (например, программируемым посредством надлежащего программного обеспечения или встроенного программного обеспечения, или иначе конфигурируемым в ответ на управляющие данные) для выполнения любой из ряда операций на входном звуковом сигнале. В действии звуковой DSP, который сконфигурирован для выполнения активного усиления речи согласно изобретению и подключается для приема входного звукового сигнала, и DSP, как правило, в дополнение к усилению речи (наряду с усилением речи) выполняет ряд операций на входном звуковом сигнале. Согласно различным вариантам осуществления изобретения, звуковой DSP является действующим для выполнения одного из вариантов осуществления способа изобретения после того, как он конфигурируется (например, программируется) для генерирования выходного звукового сигнала в ответ на входной звуковой сигнал путем выполнения способа на входном звуковом сигнале.

Особенности настоящего изобретения предусматривают систему, сконфигурированную (например, запрограммированную) для выполнения любого из вариантов осуществления способа изобретения, и машинно-читаемый носитель данных (например, диск), в памяти которого хранится код, предназначенный для реализации любого из вариантов осуществления способа изобретения.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

ФИГ. 1 - блок-схема одного из вариантов осуществления системы согласно изобретению.

ФИГ. 1A - блок-схема другого варианта осуществления системы согласно изобретению.

ФИГ. 2 - блок-схема другого варианта осуществления системы согласно изобретению. ФИГ. 2A - блок-схема другого варианта осуществления системы согласно изобретению. ФИГ. 3 - блок-схема другого варианта осуществления системы согласно изобретению.

ФИГ. 4 - блок-схема процессора обработки цифровых звуковых сигналов (DSP), который является одним из вариантов осуществления системы согласно изобретению.

ФИГ. 5 - блок-схема компьютерной системы, содержащей машинно-читаемый носитель данных 504, в памяти которого хранится компьютерный код, предназначенный для программирования системы с целью выполнения одного из вариантов осуществления способа изобретения.

ПОДРОБНОЕ ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Технологически возможными являются многие варианты осуществления настоящего изобретения. Из настоящего раскрытия средним специалистам в данной области будет ясно, как их реализовать. Варианты осуществления системы согласно изобретению, способа и носителя данных будут описаны со ссылкой к ФИГ. 1, 1A, 2, 2A и 3-5.

Автор изобретения сделал наблюдение, что содержание некоторых многоканальных звуковых сигналов имеет отличающееся, все еще относящееся к речи содержание в речевом канале и в по меньшей мере одном неречевом канале. Например, многоканальные звукозаписи некоторых театрализованных представлений микшированы так, что «сухая» речь (т.е. речь без заметной реверберации) помещается в речевой канал (как правило, центральный канал, С, сигнала), и та же речь, но со значительной реверберационной составляющей («сырая» речь), помещается в неречевые каналы сигнала. В типичном сценарии сухая речь представляет собой сигнал от микрофона, который театральный исполнитель держит близко ко рту, и сырая речь представляет собой сигнал от микрофонов, расположенных в аудитории. Сырая речь связана с сухой речью, поскольку она представляет собой то, как выступление слышится на месте в аудитории. Однако она отличается от сухой речи. Как правило, сырая речь запаздывает относительно сухой речи и имеет отличающийся спектр и различные дополнительные составляющие (например, шум в аудитории и реверберацию).

В зависимости от относительных уровней сухой и сырой речи существует возможность того, что сырая составляющая речи будет маскировать сухую составляющую речи до той степени, когда ослабление неречевых каналов в схеме подавления слабого сигнала более сильным (например, как в способе, описанном в процитированной выше заявке WO №2010/011377) будет нежелательным образом ослаблять сигнал сырой речи. Хотя сухую и сырую составляющие речи можно описать как отдельные сущности, слушатель в своем восприятии смешивает обе эти составляющие и слышит их как единый поток речи. Ослабление сырой составляющей речи (например, в схеме подавления слабого сигнала более сильным) может оказывать влияние, выражающееся в снижении воспринимаемой громкости смешанного речевого потока наряду с сокращением ширины его отображения. Автор изобретения осознал, что многоканальные звуковые сигналы, содержащие сырую и сухую составляющие речи отмеченного типа, часто могут быть более приятными для восприятия, а также в большей степени способствующими разборчивости речи, если уровень сырых составляющих речи не изменяется в ходе усиливающей речь обработки сигналов.

Изобретение частично основывается на осознании того, что, когда по меньшей мере один неречевой канал многоканального звукового сигнала содержит содержание, которое увеличивает разборчивость (или другое воспринимаемое качество) речевого содержания, определенного речевым каналом сигнала, фильтрация неречевых каналов сигнала с использованием схемы подавления слабого сигнала более сильным (например, в соответствии со способом WO №2010/011377) может отрицательно влиять на развлекательные впечатления лица, прослушивающего воспро

Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала

Патент 2520420