Способ сокращения данных при передаче и/или накоплении цифровых сигналов

Патент 2099906

Авторы

Классы МПК

H04S1 - Двухканальные системы (H04S 5/00,H04S 7/00 имеют преимущество)

Реферат

Использование: в технике передачи и/или накопления цифровых сигналов нескольких зависимых каналов. Сущность изобретения: способ сокращения данных заключается в преобразовании входных сигналов из временного диапазона в спектральные величины частотного диапазона, которые кодируют, передают и/или накапливают, декодируют и передают обратно по каналам во временном диапазоне. Особенность способа состоит в том, что из спектральных величин блоков данных, связывающих каналы, определяют величину, характеризующую спектральное различие между сигналами различных каналов, которую сравнивают с заданным пороговым значением, а при величине спектрального различия, меньшей порогового значения, совместно кодируют сигналы из различных каналов. Благодаря тому, что совместное кодирование происходит только тогда, когда имеется достаточная спектральная аналогичность сигналов в обоих каналах, устраняются ощутимые помехи, наблюдаемые обычно в известных способах кодирования по методам "середина/боковая сторона" или "интенсивность-стерео" при неблагоприятной структуре сигнала. 13 з.п. ф-лы, 1 ил.

Изобретение относится к способу сокращения данных при передаче и/или накоплении цифровых сигналов нескольких зависимых каналов в соответствии с ограничительной частью пп. 1-7 формулы изобретения.

Способы, при которых, например, передаются кодированные по частоте аудиосигналы, известны из публикаций ВОИС. С целью пояснения не поясненных в данном патенте понятий следовало бы сослаться на эти печатные издания.

Многие известные способы кодирования с сокращением данных цифровых аудиосигналов кодируют сигналы в частотном диапазоне и используют для передачи сигналов из временного диапазона в частотный диапазон (в спектральные величины) надлежащую технику отображения, например, "FFT", "DCT", "MDCT", "Многофазный банк фильтров" или "Гибридный банк фильтров".

С помощью этих способов может быть достигнута высокая степень использования резервирования сигналов и иррелевантность относительно свойств человеческого уха.

Если при передаче сигналов нескольких каналов сигналы не зависят друг от друга, возможно дополнительное уплотнение передаваемого количества данных. Это условие выполнено, например, в случае с сигналами в каналах квадрофонического или стереофонического аудиосигнала.

Способ использования избыточности/иррелевантности между обоими каналами стерео-аудиосигнала описан в публикации J.D. Johnston, "Perceptual Transform Coding of Wadeband Stereo Signals", IEEE, 1989. При так называемом MS-кодировании (кодирование середина/боковая сторона) вместо левого и правого каналов кодируется сумма (=середина) и разность (=боковая сторона) стереосигнала. Благодаря этому, достигается экономия в количестве передаваемых данных.

Зависимость сигналов двух стереоканалов использует также известный из публикации "Subband Coding of Stereophonie Digital Audio Signals", IEEE, 1991, p. 3601-3604, способ "интенсивность-стерео". При этом способе передается моносигнал, а также дополнительная информация с помощью левого/правого распределения сигнала.

При неблагоприятной структуре сигнала из-за этих обоих способов могут появляться сильные помехи. Например, резко отличающаяся структура сигнала в левом и правом каналах приводит при способе кодирования середина/боковая сторона к искусственно вызванным явлениям, которые не маскируются фактически имеющимися в канале сигналом. Поэтому, например, генерируется саксофонный громкий сигнал, который имел место только в правом канале, на левом канале помехи, которые не маскируются и поэтому не воспринимаются. При использовании способа "интенсивность-стерео" нарушается звуковое звучание, если левый и правый каналы имеют резко отличную спектральную структуру.

Таким образом, известные способы могут использоваться только тогда, когда нельзя ожидать неблагоприятной структуры сигнала или когда в пользу сокращения количества данных приходится мириться с помехами.

В основе изобретения лежит задача разработки способа сокращения данных при передаче и/или накоплении цифровых сигналов нескольких зависимых каналов, при котором используется зависимость сигналов в различных каналах и который не приводит к субъективно воспринимаемый помехе переданного сигнала.

Решения этой задачи в соответствии с изобретением указаны в пп. 1 и 7 формулы изобретения.

В соответствии с изобретением сигналы различных каналов переводятся вначале в спектральном диапазоны. Затем из спектральных величин, которые относятся к соединяющим блокам каналов, определяется величина, которая представляет собой меру спектрального разноса между сигналами. Эта величина тем меньше, чем аналогичнее спектральные величины соединяемых блоков. Если эта величина не превышает заранее заданное пороговое значение, кодирование сигналов более не осуществляется раздельно в отдельных каналах, а происходит общее кодирование.

Совместное кодирование осуществляется в соответствии с известными способами, которые приводят к сокращению количества передаваемых данных.

При превышении заранее заданной пороговой величины не происходит совместное кодирование сигналов различных каналов. В пользу качества переданных данных заранее отказываются от дополнительного сокращения данных.

Другие и усовершенствованные варианты изобретения охарактеризованы в дополнительных пунктах формулы изобретения.

В соответствии с п. 2 формулы изобретения не все параметры спектра, которые относятся к блоку, используются для определения спектрального разноса. Более того, спектральный разнос определяется из частей диапазона частот, так что определяются несколько величин спектрального разноса в расчете на каждый блок. Таким образом этот способ быстрее реагирует на изменения спектрального разноса.

В соответствии с п. 3 формулы изобретения способ в соответствии с изобретением может быть применен особенно предпочтительным образом к сигналам из двух акустических стереоканалов. Для этого случая указано предпочтительное предписание для определения величины, которая представляет собой меру спектрального разноса.

Если нормированный по спектральной энергии спектральный разнос частот SD/SE находится ниже постоянной пороговой величины "с", то обеспечено то, что достаточна спектральная аналогичность для совместного кодирования обоих каналов. В этом случае определяемые в соответствии с психоакустикой пороги маскирования для обоих каналов также достаточно аналогичны, так что искусственно вызванные явления, которые появляются при совместном кодировании, эффективно маскируются в обоих каналах.

Альтернативное правило для определения спектрального разноса охарактеризовано также в п. 3 формулы изобретения.

Пороговая постоянная "с" может быть определена эмпирически и, в соответствии с п. 4 формулы изобретения, предпочтительно находится в пределах от 0,5 до 1.

Особенно предпочтительные варианты совместного кодирования указаны в пунктах 5 и 6 формулы изобретения. В соответствии с пунктом 5 формулы изобретения, совместное кодирование осуществляется известным способом кодирования середина/боковая сторона. Предпочтительно этот способ может быть использован тогда, когда придается значение максимальному качеству при низкой скорости передачи двоичных единиц информации. В соответствии с п. 6 формулы изобретения, используется более простой способ кодирования "интенсивность-стерео".

В п. 7 формулы изобретения охарактеризован способ, который решает задачу в соответствии с изобретением.

Из соответствующих спектральным величинам частей частотного диапазона различных каналов определяются величины, которые представляют собой меру спектральной энергии этих частей частотного диапазона.

Эти спектральные энергии различных каналов сравниваются с общей спектральной энергией всех каналов.

В каналах, в которых в части диапазона частот спектральная энергия опускается ниже заранее заданной доли общей спектральной энергии всех каналов в этой части диапазона частот, с соответствующими спектральными величинами сопрягается величина 0. Этот способ имеет особое преимущество тогда, когда использованное для передачи количество двоичных единиц информации приводится в соответствие с передаваемыми спектральными величинами. В этом случае происходит экономия данных, так как нули могут передаваться с особенно небольшим количеством двоичных единиц информации.

В соответствии с п. 8 формулы изобретения, используется способ, основанный на отдельных спектральных величинах. Тем самым, в отдельных каналах перед передачей из общего спектра могут вырезаться экстремально узкие частотные характеристики, которые и без того не могли бы различаться с помощью психоакустического эффекта маскирования.

При охарактеризованном в п. 9 формулы изобретения передаются сигналы из двух акустических каналов, которые образуются путем матрицирования из стереосигналов. Особенно эффективно этот способ работает тогда, когда с помощью матрицирования в соответствии с п. 10 осуществляется метод кодирования середина/боковая сторона. В частности, при кодировании методом середина/боковая сторона стереосигналов, которые отличаются высокой спектральной аналогичностью обоих каналов, появляются различные спектральные энергии в среднем и боковом каналах. В этом случае в боковом канале небольшие кодированные по частоте величины могут заменяться нулем, не вызывая появления субъективно различаемых помех. Однако способ может быть применен также для среднего канала, если боковой канал имеет достаточно высокую спектральную энергию по сравнению со средним каналом.

Предпочтительные правила для выбора спектральных величин, которые заменяются нулем, указаны в п. 11 и 12 формулы изобретения. В то время, как в соответствии с п. 11 для определения спектральных энергий соответственно используются отдельные спектральные величины, способ в соответствии с п. 12 работает с парами спектральных величин. Этот способ предпочтительно может быть использован тогда, когда для передачи выбирается двухкоординатное кодирование, при котором совместно кодируются, соответственно, пары соседних спектральных величин. Само собой разумеется, что указанное предписание может быть также распространено на многокоординатный способ кодирования.

Коэффициент пороговой величины "к", который является крайне важным для выбора спектральных величин, которые заменяются нулем, является свободно задаваемым коэффициентом, который оптимизируется эмпирическим путем.

В соответствии с п. 13 формулы изобретения, для различных диапазонов частот определяются различные коэффициенты пороговых величин. Тем самым, лучше учитываются свойства человеческого слуха.

При передаче цифровых аудиосигналов для расчета порога маскирования используется, как правило, психоакустическая модель. Так как порог маскирования является мерилом того, какие доли акустического сигнала могут восприниматься человеческим ухом, в соответствии с п. 14 формулы изобретения, пороговый коэффициент выводится из порога маскирования. Порог маскирования является изменяющейся во времени величиной, которая постоянно приводится в соответствии с пороговым коэффициентом. С помощью этого способа может достигаться оптимальное сокращение данных относительно уменьшения данных и распознаваемости в декодированном сигнале. При особенно критических диапазонах частот с тональными компонентами осуществляется консервативная обработка кодированных по частоте величин, в то время как в некритических диапазонах из спектра удаляются строки изображения.

Существенные преимущества изобретения заключаются в том, что без существенного увеличения комплексности способа передачи достигается дополнительное сокращение данных. Способ в соответствии с изобретением не зависит от специфической структуры использованного способа кодирования и благодаря этому может быть использован разносторонне.

Способ нуждается лишь в дополнительной обработке сигналов в требующемся в небольших количествах коде на передающей стороне, однако не в декодере, который в больших количествах используется конечными потребителями.

Пример осуществления способа в соответствии с изобретением более подробно поясняется ниже со ссылкой на чертеж, где представлена функциональная схема способа: a- кодирование, b декодирование.

Временные сигналы левого стереоканала и правого стереоканала переводятся в банках аналитических фильтров 1а, 1 в частотный диапазон. Для этого в распоряжении имеются несколько известных способов, как например, "FFT", "DCT", "MDCT", "Многофазный банк фильтров", "Гибридный банк фильтров" и т.д.

К переведенным в частотный диапазон сигналам применяется кодирующая матрица 2, которая допускает совместное кодирование обоих каналов. В примере осуществления используется метод кодирования середина/боковая сторона.

В последующем каскаде 3 осуществляется сокращение данных путем стирания определенных частотных диапазонов. В боковом канале или в среднем канале в частотных диапазонах, в которых сигнал имеет сравнительно небольшую спектральную энергию, соответствующие спектральные величины заменяются нулем.

Затем сигналы кодируются в двухканальном кодирующем устройстве аудиоданных 4, например, в энтропийном кодирующем устройстве, и переводятся с помощью мультиплексора в поток двоичных знаков.

Для управления кодирования по методу середина/боковая сторона, стиранием частотных диапазонов и кодированием аудиоданных входные сигналы подвергаются дальнейшему анализу. С помощью психоакустической модели в каскаде 6 рассчитывается порог маскирования, который имеет решающее значение для кодирующего устройства 4 аудиоданных. Из порога маскирования выводится также пороговый коэффициент в качестве условия того, какие спектральные величины в каких частотных диапазонах заменяются в каскаде 3 нулем.

В каскаде 5 с помощью спектрального разноса сигналов в обоих каналах определяется, должно ли для выбранного участка сигнала осуществляться кодирование по методу середина/боковая сторона в помощью применения кодирующей матрицы 2. Если на выбранном участке сигнала спектральная аналогичность данных слишком мала, в каскаде 2 осуществляется кодирование по методу середина/боковая сторона. Более того, оба канала кодируются раздельно.

Образовавшийся в кодирующем устройстве поток двоичных знаков передается на декодирующее устройство, структура которого представлена на фиг. 1b.

В декодирующем устройстве в каскаде 7 поток двоичных знаков декодируется и затем, в каскаде 8, из кодированных по методу середина/боковая сторона сигналов образуются сигналы левого и правого каналов, которые в банках синтезирующих фильтров 9a, 9b переносятся обратно из частотного диапазона во временной диапазон.

Формула изобретения

1. Способ сокращения данных при передаче и/или накоплении цифровых сигналов от взаимно зависимых каналов, заключающийся в преобразовании входных сигналов из временного диапазона в спектральные величины частотного диапазона, которые кодируют, передают и/или накапливают, декодируют и передают обратно по каналам во временном диапазоне, отличающийся тем, что из спектральных величин блоков данных, связывающих каналы, определяют величину, характеризующую спектральное различие между сигналами различных каналов, которую сравнивают с заданным пороговым значением, а при величине спектрального различия, меньшей порогового значения, совместно кодируют сигналы из различных каналов.

2. Способ по п.1, отличающийся тем, что величины спектрального различия между сигналами различных каналов определяют в соответствующих частях частотного диапазона сигналов.

3. Способ по п.1 или 2, отличающийся тем, что для сигналов двух звуковых стереоканалов условие совместного кодирования представлено соотношением SD / SE < C, где SD мера спектрального различия между сигналами правого и левого стереоканалов, определяемая уравнением или уравнением где L_i или R_i кодированные по частоте коэффициенты левого и правого стереоканала соответственно; n произвольное нормированное значение; f₁ и f₂ индексируемые границы частотного диапазона; (LR RATIO) соотношение величин сигналов левого и правого каналов; SE величина энергии спектрального представления стереосигнала, определяемая уравнением где с заданная постоянная пороговая величина, 0 < с < 1.

4. Способ по п.3, отличающийся тем, что постоянную пороговую величину с выбирают в пределах 0,5 1,0.

5. Способ по пп.3 и 4, отличающийся тем, что при совместном кодировании стереосигналов производят кодирование типа "середина боковая сторона" суммы и разности этих сигналов, а значение (LR RATIO) устанавливают равным 1.

6. Способ по пп.3 и 4, отличающийся тем, что при совместном кодировании стереосигналов производят кодирование типа "интенсивность стерео" с передачей моносигнала и дополнительной информации из распределений каналов, а значение (LR RATIO) определяют согласно соотношению 7. Способ по п.1, отличающийся тем, что в соответствующих спектральным величинам частях частотного диапазона различных каналов определяют значения, представляющие меру спектральной энергии этих частей, полученные значения для различных каналов сравнивают с величиной спектральной энергии всех каналов в этих частях частотного диапазона, а в частях частотного диапазона, где величина спектральной энергии в отдельных каналах меньше заданной доли общей спектральной энергии всех каналов, соответствующие спектральные величины частей частотного диапазона устанавливают равными нулю.

8. Способ по п.7, отличающийся тем, что при определении спектральной энергии используют отдельные спектральные величины из различных каналов.

9. Способ по п. 7, отличающийся тем, что при передаче сигналов двух звуковых стереоканалов производят матричную обработку сигналов левого и правого каналов.

10. Способ по п.9, отличающийся тем, что при матричной обработке производят кодирование типа "середина боковая сторона" суммы и разности стереосигналов.

11. Способ по п.10, отличающийся тем, что спектральные величины (S_i) в разностном или суммарном канале заменяют нулем при выполнении условия |S₁|ⁿ<K^{(|L₁|ⁿ+|R_i|ⁿ), где К выбранный коэффициент пороговой величины.}

12. Способ по п.10, отличающийся тем, что при определении спектральной энерги используют пары дискретных величин и спектральные величины S₂_i и S₂_i₊₁ в разностном или суммарном канале устанавливают равными нулю при выполнении условия |Sⁿ₂_i+Sⁿ₂_i+1|<K*(|L_{|ⁿ+|R_2i|ⁿ+|L_2i+1|ⁿ+|R_2i+1|ⁿ). 13. Способ по п.11 или 12, отличающийся тем, что величину коэффициента К выбирают различной в разных частотных диапазонах.}

14. Способ по пп. 11 13, отличающийся тем, что при кодировании спектральных величин значение коэффициента К адаптивно определяют с учетом порога маскирования используемой психоакустической модели.

РИСУНКИ

Рисунок 1