Кодирование информации без потерь с гарантированной максимальной битовой скоростью
Иллюстрации
Показать всеИзобретение относится к кодированию информационных величин без потерь и, в частности, к концепции для гарантирования максимальной битовой скорости для кодированного представления информационных величин. Технический результат - повышение точности воспроизведения информации. Компактное кодированное представление информационных величин, не превышающее предопределенный размер, может быть получено, когда первое правило кодирования, генерирующее кодированное представление информационных величин переменной длины, сравнивается со вторым правилом кодирования, генерирующим кодированное представление информационных величин фиксированной длины, и когда выбирается правило кодирования, приводящее к кодированному представлению, требующему меньшее количество единиц информации. Таким образом, может быть гарантировано, что максимальная битовая скорость будет не больше максимальной битовой скорости второго правила кодирования, согласно которому получается второе кодированное представление. Путем передачи сигналов выбора правила кодирования посредством некоторой информации правила вместе с кодированным представлением информационных величин позже на стороне декодера могут быть получены корректные информационные величины, используя правило декодирования, которое соответствует правилу кодирования, использованному во время кодирования. 7 н. и 10 з.п. ф-лы, 6 ил.
Реферат
Область техники
Настоящее изобретение относится к кодированию информационных величин без потерь и, в частности, к концепции для гарантирования максимальной битовой скорости для кодированного представления информационных величин.
Предшествующий уровень техники
В последнее время способ многоканального аудиовоспроизведения становится все более важным. Это может быть вследствие факта, что способы аудиосжатия/кодирования, такие как хорошо известный способ mp3, предоставили возможность распространения аудиозаписей через Интернет или другие каналы передачи с ограниченной полосой пропускания. Способ кодирования mp3 стал таким известным, потому что он предоставляет возможность распространения всех записей в стереоформате, то есть цифровое представление аудиозаписи включает в себя первый или левый стереоканал и второй или правый стереоканал.
Тем не менее, существуют принципиальные недостатки обычных двухканальных аудиосистем. Поэтому разработан способ объемного звучания. В добавление к двум стереоканалам L и R рекомендованное многоканальное объемное представление включает в себя дополнительный центральный канал C и два объемных канала Ls, Rs. На этот формат звука также ссылаются как на стерео три/два, что означает три фронтальных канала и два объемных канала. Обычно требуется пять каналов передачи. В условиях воспроизведения необходимы, по меньшей мере, пять динамиков в пяти подходящих местоположениях, чтобы получить оптимальную зону наилучшего восприятия на определенном расстоянии от пяти громкоговорителей, расположенных должным образом.
В данной области техники известны несколько способов для уменьшения количества данных, необходимых для передачи сигнала многоканального аудио. Такие способы называются способами объединенного стерео. Для этого приведена ссылка на фиг.5, которая иллюстрирует устройство 60 объединенного стерео. Это устройство может быть устройством, реализующим, например, стерео интенсивности (IS) или кодирование бинаурального сигнала (BCC). Такое устройство обычно в качестве ввода принимает, по меньшей мере, два канала (CH1, CH2,... CHn), и выводит, по меньшей мере, один канал несущей и параметрические данные. Параметрические данные определены так, что в декодере может быть вычислена аппроксимация исходного канала (CH1, CH2,... CHn).
Как правило, канал несущей включает в себя выборки поддиапазонов, спектральные коэффициенты, выборки временной области и т.п., что предоставляет относительно хорошее представление базового сигнала, тогда как параметрические данные не включают в себя такие выборки спектральных коэффициентов, а включают параметры управления для управления определенным алгоритмом восстановления, таким как взвешивание путем умножения, временная манипуляция, частотная манипуляция, фазовая манипуляция и т.п. Параметрические данные, следовательно, включают в себя только относительно грубое представление сигнала или связанного канала. Что касается количественной оценки, то объем данных, требуемый каналом несущей, будет в пределах 60-70 кбит/сек, тогда как объем данных, требуемый параметрической дополнительной информации для одного канала, будет в пределах 1,5-2,5 кбит/сек. Примером параметрических данных являются хорошо известные масштабные коэффициенты, информация IS или параметры бинаурального сигнала, как описано ниже.
Способ BCC описан, например, в документах AES convention paper 5574, "Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression", C. Faller, F. Baumgarte, May 2002, Munich; IEEE WASPAA Paper "Efficient representation of spatial audio using perceptual parametrization", October 2001, Mohonk, NY; "Binaural cue coding applied to audio compression with flexible rendering", C. Faller and F. Baumgarte, AES 113th Convention, Los Angeles, Preprint 5686, October 2002; "Binaural cue coding - Part II: Schemes and applications", C. Faller, F. Baumgarte, IEEE Trans., on Speech and Audio Proc., volume level. 11, no. 6, Nov. 2003.
При кодировании BCC несколько входных аудиоканалов конвертируются в спектральное представление с использованием преобразования, основанного на дискретном преобразовании Фурье, с перекрывающимися окнами. Результирующий однородный спектр разделяется на не перекрывающиеся части. Каждая часть примерно имеет полосу частот, которая пропорциональна эквивалентной прямоугольной полосе частот (ERB). Параметры BCC оцениваются тогда между двумя каналами для двух частей. Эти параметры BCC, как правило, задаются для каждого канала относительно опорного канала и также квантуются. Переданные параметры окончательно вычисляются согласно предписанным формулам (кодируются), что также может зависеть от особых разделов сигнала, который требуется обработать.
Существует ряд параметров BCC. Параметр ICLD, например, описывает разницу (отношение) между энергиями, содержащимися в двух сравниваемых каналах. Параметр ICC (межканальная когерентность/корреляция) описывает корреляцию между двумя каналами, которая может быть описана как схожесть форм волн двух каналов. Параметр ICTD (межканальная разность времени) описывает глобальный сдвиг времени между 2 каналами, тогда как параметр IPD (межканальная разность фаз) описывает то же относительно фаз сигналов.
Известно, что при обработке аудиосигнала по кадру, анализ BCC также выполняется по кадру, то есть меняющимся по времени образом, а также по частоте. Это означает, что для каждого спектрального диапазона параметры BCC получаются отдельно. Это означает, что в случае, когда блок аудиофильтров разлагает входной сигнал на, например, 32 сигнала полос пропускания, блок анализа BCC получает набор параметров BCC для каждого из 32 диапазонов.
Относящийся к этому способ, также известный как параметрическое стерео, описан в документах: J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, "High-Quality Parametric Spatial Audio Coding at Low Bitrates", AES 116th Convention, Berlin, Preprint 6072, May 2004; E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, "Low Complexity Parametric Stereo Coding", AES 116th Convention, Berlin, Preprint 6073, May 2004.
Резюмируя, последние подходы для параметрического кодирования сигналов многоканального аудио ("Кодирование Пространственного Аудио", "Кодирование бинаурального сигнала" и т.п.) представляют сигнал многоканального аудио посредством сигнала понижающего микширования (который может быть монофоническим или содержать несколько каналов) и параметрической дополнительной информации ("пространственных сигналов"), характеризующей воспринимаемый уровень пространственного звука. Желательно поддерживать скорость передачи дополнительной информации на наименьшем возможном уровне, чтобы минимизировать служебную информацию и оставить как можно больше доступной пропускной способности для кодирования сигналов понижающего микширования.
Один из вариантов удержания битовой скорости дополнительной информации на низком уровне является кодирование без потерь дополнительной информации схемы пространственного аудио путем применения, например, алгоритмов статистического кодирования к дополнительной информации.
Кодирование без потерь широко применялось в обычном аудиокодировании, чтобы обеспечить оптимальное компактное представление квантованных спектральных коэффициентов и другой дополнительной информации. Примеры подходящих схем и способов кодирования даны в стандартах ISO/IEC MPEG1 часть 3, MPEG2 часть 7 и MPEG4 часть 3.
Эти стандарты и, например, также документ IEEE "Noiseless Coding of Quantized Spectral Coefficients in MPEG-2 Advanced Audio Coding", S.R. Quackenbush, J.D. Johnston, IEEE WASPAA, Mohonk, NY, October 1997 описывают современные способы, которые включают в себя следующие меры для кодирования квантованных параметров без потерь:
- многомерное кодирование Хаффмана квантованных спектральных коэффициентов;
- использование общей (многомерной) кодовой книги Хаффмана для наборов коэффициентов;
- кодирование величины либо как целой, либо кодирование информации знака и информации величины по отдельности (то есть, имея в кодовой книге Хаффмана только записи для данного абсолютного значения, что уменьшает необходимый размер кодовой книги "без учета знака" по сравнению с книгой "с учетом знака");
- использование альтернативных кодовых книг различных наибольших абсолютных величин, то есть различных максимальных абсолютных величин среди параметров, которые требуется кодировать;
- использование альтернативных кодовых книг различного статистического распределения для каждой наибольшей абсолютной величины;
- передача в декодер выбора кодовой книги Хаффмана как дополнительной информации;
- использование "секций" для определения диапазона применения каждой выбранной кодовой книги Хаффмана;
- дифференциальное кодирование масштабных коэффициентов по частоте и последующее кодирование результата по алгоритму Хаффмана.
Еще один способ для кодирования без потерь грубо квантованных величин в единый код импульсно-кодовой манипуляции (ИКМ) предложен в стандарте MPEG 1 аудио (названный группированием в рамках стандарта и используемый для уровня 2). Это более подробно описано в стандарте ISO/IEC 11172-3:93.
Публикация "Binaural cue coding - Part II: Schemes and applications", C. Faller and F. Baumgarte, IEEE Trans, on Speech and Audio Proc, volume level. 11, no.6, Nov. 2003 дает некоторую информацию о кодировании параметров BCC. Предлагается, что квантованные параметры ICLD дифференциально кодируются:
- по частоте и результат впоследствии кодируется по алгоритму Хаффмана (посредством одномерного кода Хаффмана);
- по времени и результат впоследствии кодируется по алгоритму Хаффмана (посредством одномерного кода Хаффмана);
и что в конце, наиболее эффективный вариант выбирается как представление исходного аудиосигнала.
Как упомянуто выше, было предложено оптимизировать эффективность сжатия путем применения дифференциального кодирования по частоте и, альтернативно, по времени и выбора наиболее эффективного варианта. Тогда выбранный вариант сигнализируется в декодер посредством некоторой дополнительной информации.
Описанные выше способы полезны для уменьшения количества данных, которые, например, должны быть переданы посредством аудио- или видеопотока. Использование вышеописанных способов кодирования без потерь, основанных на схемах статистического кодирования, обычно приводит к битовому потоку с переменной битовой скоростью.
Несмотря на то что способы по предшествующему уровню техники значительно уменьшают размер данных, которые необходимо передать, все они имеют один общий недостаток. Поскольку статистическое кодирование сжимает информационные величины, которые предположительно появляются в сжимаемом наборе данных часто, некоторое количество последовательно появляющихся редких параметров приводит к очень большой длине кода. Поскольку такая комбинация параметров вероятно иногда появляется в сложном потоке данных, который требуется кодировать, то результирующий поток битов обычно будет иметь секции с относительно высокой битовой скоростью.
Если в этих секциях битовая скорость превышает максимальную возможную битовую скорость передающей среды, например максимальную фактическую скорость передачи данных беспроводного соединения во время работы потокового приложения, то передача кодированных данных будет остановлена или прервана, что безусловно неблагоприятно.
Сущность изобретения
Целью настоящего изобретения является предоставление концепции кодирования информационных величин без потерь, одновременно гарантируя более низкую максимальную битовую скорость.
Согласно первому аспекту настоящего изобретения эта цель достигнута посредством кодера для кодирования информационных величин, которые описываются более чем одним битом, чтобы получать кодированное представление информационных величин, причем кодер содержит: оценщик битов, предназначенный для оценивания количества единиц информации, требуемых для кодирования информационных величин, используя первый способ кодирования и используя второй способ кодирования, причем первый способ кодирования такой, что при кодировании информационных величин получаются кодированные представления, имеющие различные количества единиц информации, а второй способ кодирования такой, что при кодировании информационных величин получаются кодированные представления, имеющие идентичные количества единиц информации, причем кодированное представление получается из комбинации информационных величин, имеющей, по меньшей мере, две комбинированные информационные величины; и поставщик, предназначенный для предоставления кодированного представления, полученного с использованием правила кодирования, приводящего к меньшему количеству единиц информации для кодированного представления, и для предоставления информации правила, указывающей правило кодирования, на котором основано кодированное представление.
Согласно второму аспекту настоящего изобретения эта цель достигнута посредством декодера для декодирования кодированного представления информационных величин, которые описаны более чем одним битом, и для обработки информации правила, указывающей правило кодирования, использованное для кодирования информационных величин, причем декодер содержит: приемник для приема кодированного представления и информации правила и декомпрессор для декодирования кодированного представления, причем декомпрессор обеспечивает получение информационной величины с использованием в зависимости от информации правила первое правило декодирования или второе правило декодирования, причем первое правило декодирования такое, что информационные величины получаются из кодированных представлений, имеющих различные количества единиц информации, а второе правило декодирования такое, что информационные величины получаются из кодированных представлений, имеющих идентичные количества информационных величин, причем информационные величины получаются из комбинаций информационных величин, имеющих, по меньшей мере, две комбинированные информационные величины в кодированном представлении.
Согласно третьему аспекту настоящего изобретения эта цель достигнута посредством способа для кодирования информационных величин, которые описываются более чем одним битом, чтобы получать кодированное представление информационных величин, причем способ содержит этапы, на которых оценивают количество единиц информации, требуемых для кодирования информационных величин используя первый способ кодирования и используя второй способ кодирования, причем первый способ кодирования такой, что при кодировании информационных величин получаются кодированные представления, имеющие различные количества единиц информации, а второй способ кодирования такой, что при кодировании информационных величин получаются кодированные представления, имеющие идентичные количества единиц информации, причем кодированное представление получается из комбинации информационных величин, имеющей, по меньшей мере, две комбинированные информационные величины; и предоставляют кодированное представление, полученное с использованием правила кодирования, приводящего к меньшему количеству единиц информации для кодированного представления, и предоставляют информацию правила, указывающую правило кодирования, на котором основано кодированное представление.
Согласно четвертому аспекту настоящего изобретения эта цель достигнута посредством компьютерной программы, которая при выполнении на компьютере реализует вышеупомянутый способ.
Согласно пятому аспекту настоящего изобретения эта цель достигнута посредством способа для декодирования кодированного представления информационных величин, которые описаны более чем одним битом, и для обработки информации правила, указывающей правило кодирования, использованное для кодирования информационных величин, причем способ содержит этапы, на которых принимают кодированное представление и информацию правила и декодируют кодированное представление, используя в зависимости от информации правила первое правило декодирования или второе правило декодирования, причем первое правило декодирования такое, что информационные величины получаются из кодированных представлений, имеющих различные количества единиц информации, а второе правило декодирования такое, что информационные величины получаются из кодированных представлений, имеющих идентичные количества информационных величин, причем информационные величины получаются из комбинаций информационных величин, имеющих, по меньшей мере, две комбинированные информационные величины в кодированном представлении.
Согласно шестому аспекту настоящего изобретения эта цель достигнута посредством компьютерной программы, которая при выполнении на компьютере реализует вышеупомянутый способ.
Согласно седьмому аспекту настоящего изобретения эта цель достигнута посредством кодированного представления информационных величин, причем кодированное представление включает в себя первую часть, сгенерированную с использованием первого правила кодирования, причем первое правило кодирования такое, что при кодировании информационных величин получаются кодированные представления, имеющие различные количества единиц информации; вторую часть, сгенерированную с использованием второго правила кодирования, причем второе правило кодирования такое, что при кодировании информационных величин получаются кодированные представления, имеющие идентичные количества единиц информации, причем кодированное представление получается из комбинации информационных величин, имеющей, по меньшей мере, две комбинированные информационные величины; и информацию правила, указывающую использованное правило кодирования.
Настоящее изобретение основано на том, что компактное кодированное представление информационных величин, не превышающее предопределенный размер, может быть получено, когда первое правило кодирования, генерирующее кодированное представление информационных величин переменной длины, сравнивается со вторым правилом кодирования, генерирующим кодированное представление информационных величин фиксированной длины, и когда выбирается правило кодирования, приводящее к кодированному представлению, требующему меньшее количество единиц информации. Таким образом, может быть гарантировано, что максимальная битовая скорость будет не больше битовой скорости второго правила кодирования, согласно которому получается второе кодированное представление. Путем сигнализации выбора правила кодирования посредством некоторой информации правила вместе с кодированным представлением информационных величин позже на стороне декодера могут быть получены корректные информационные величины, используя правило декодирования, соответствующее правилу кодирования, использованному во время кодирования.
Этот принцип более подробно описан в следующих разделах, где предполагается, что должным образом спроектированный код переменной длины соответствует статистике информационных величин, которые требуется кодировать.
Известно, что когда применяется статистическое кодирование квантованных величин, фактическое потребление единиц информации, необходимое для представления набора данных, зависит от величин, которые требуется кодировать. Обычно, чем больше вероятность величин, чем меньше битов используется. В противоположность, очень маловероятные наборы данных требуют очень высокой битовой скорости. Таким образом, может случиться, что для некоторых блоков данных потребуется очень высокая скорость передачи данных, что может быть неблагоприятным, например, если канал передачи имеет ограниченную пропускную способность.
Предложенный способ дает возможность гарантировать известный верхний предел потребления битов для наборов данных, кодированных по статистическому алгоритму, даже для очень редких величин. В особенности, способ обеспечивает, что потребление битов не превышает потребление битов при использовании кода ИКМ. Способ кодирования может быть резюмирован следующим образом:
- Набор данных кодируется с использованием процесса обычного статистического кодирования (например, по алгоритму Хаффмана). Результирующее потребляемое количество битов сохраняется.
- Вычисляется потребляемое количество битов для представления ИКМ. Следует отметить, что это всего лишь количество величин, которые требуется кодировать, умноженное на длину кода ИКМ или на долю длины кода ИКМ, и, следовательно, ее легко вычислить.
- Если потребляемое количество битов для статистического кодирования превышает потребляемое количество битов для кодирования ИКМ, то выполняется выбор кодирования ИКМ и это сигнализируется в декодер посредством соответствующей дополнительной информации.
Соответствующим образом действует этап декодирования.
В предпочтительном варианте осуществления настоящего изобретения квантованные величины кодируются, выполняя сравнения схемы статистического кодирования с кодом ИКМ.
В вышеописанном варианте осуществления настоящего изобретения максимальная битовая скорость определяется длиной слова кода ИКМ. Таким образом, зная длину этого слова можно спроектировать систему кодера, транспортной среды и декодера, обеспечивающих безопасную работу путем выбора такой транспортной среды, чтобы ее пропускная способность превышала максимальную битовую скорость, определенную кодом ИКМ.
Во втором предпочтительном варианте осуществления, основанном на предыдущем варианте осуществления настоящего изобретения, несколько информационных величин дополнительно комбинируются в одну величину, которая представляется более эффективно, используя кодирование ИКМ, то есть которая имеет диапазон, близкий к степени двух. Группирование описано более подробно посредством следующего примера.
Величины квантованных переменных с диапазоном 0...4 (то есть 5 возможных различных величин) не могут быть эффективно представлены посредством кода ИКМ, поскольку при наименьшей возможной длине кода в 3 бита растрачивается 3 из возможных 23=8 величин. Комбинирование 3 таких переменных (то есть, получая 53=125 возможных комбинаций) в один код с длиной в 7 битов значительно уменьшает количество избыточности, поскольку 53=125, что почти равно 27=128.
Следовательно, при этом подходе комбинированной реализации предложенной концепции для ограничения сверху потребляемого количества битов будет использоваться группированное кодирование ИКМ для определения верхней границы скорости передачи данных (и отходной вариант кодирования) для альтернативы ИКМ.
Эта комбинированная реализация имеет очевидное преимущество, заключающееся в способности дополнительно уменьшить максимальную битовую скорость.
Краткое описание чертежей
Предпочтительные варианты осуществления настоящего изобретения описаны ниже посредством ссылки на прилагаемые чертежи, на которых:
Фиг.1 - иллюстрация изобретательского кодера;
Фиг.2 - иллюстрация примера оценки битов согласно изобретательской концепции;
Фиг.3A - иллюстрация группирования 2 информационных величин до кодирования ИКМ;
Фиг.3B - иллюстрация группирования 3 информационных величин;
Фиг.4 - иллюстрация изобретательского декодера; и
Фиг.5 - иллюстрация многоканального аудиокодера согласно предшествующему уровню техники.
Подробное описание предпочтительных вариантов осуществления
Фиг.1 иллюстрирует структурную схему заявленного кодера для кодирования информационных величин или для получения кодированного представления информационных величин, одновременно гарантируя фиксированную максимальную битовую скорость. Кодер 100 содержит оценщик 102 битов и поставщик 104.
Информационные величины 106, которые требуется кодировать, вводятся в оценщик 102 битов и в поставщик 104. В одной возможной реализации оценщик 102 битов оценивает требуемое количество единиц информации путем использования первого правила кодирования и использования второго правила кодирования. Информация о том, которое правило кодирования приводит к кодированному представлению, требующему меньшее количество единиц информации, предоставляется в поставщик 104 линии 108 передачи данных о правиле. Тогда поставщик 104 кодирует информационные величины 106 по переданному правилу кодирования и доставляет на свои выходы кодированное представление 110, а также информацию 112 правила, указывающую использованное правило кодирования.
В модификации вышеописанного варианта осуществления настоящего изобретения оценщик 102 битов кодирует информационные величины 106, используя первое и второе правила кодирования. Оценщик 102 битов далее считает единицы информации, требуемые для двух кодированных представлений, и доставляет в поставщик 104 кодированное представление с меньшим количеством единиц информации и информацию правила. Возможная передача уже кодированного представления из оценщика 102 битов в поставщик 104 обозначена пунктирным соединением 114 данных на Фиг.1. Поставщик 104 тогда просто переправляет уже кодированное представление на свой вывод и дополнительно доставляет информацию 112 правила.
Фиг.2 иллюстрирует то, как оценщик 102 битов оценивает количество битов, необходимых для получения кодированного представления, путем сравнения кода Хаффмана и кода ИКМ.
Кодовая книга 120 Хаффмана используется, чтобы назначать целочисленные значения величины 122 кодовым словам 124, которые представлены последовательностью битов. Следует отметить, что кодовая книга Хаффмана выбрана по возможности наиболее простой, чтобы сфокусироваться на основной идее изобретательской концепции.
Код ИКМ, используемый для сравнения и чтобы гарантировать максимальную постоянную битовую скорость, состоит из кодовых слов ИКМ длиной 4 бита, позволяя использовать 16 возможных кодовых слов, как указано в описании 126 ИКМ.
В показанном здесь простом примере информационные величины 128, которые требуется кодировать, представлены шестью последовательными целыми числами (011256), что означает, что информационная величина имеет только десять возможных установок. Информационные величины 128 вводятся в оценщик 102 битов, который получает количество битов, необходимых для построения кодированного представления с использованием кодовой книги Хаффмана, как показано секцией 130 Хаффмана оценщика 102 битов, и используя представление ИКМ, как указано секцией 132 ИКМ. Как можно увидеть на фиг.2, представление информационных величин, кодированное алгоритмом статистического кодирования, требует 22 бита, тогда как представление ИКМ требует 24 бита, что является количеством информационных величин, умноженным на длину битов одного кодового слова ИКМ. В случае с фиг.2 заявленный кодер принимает решение перейти на представление информационных величин, кодированное алгоритмом статистического кодирования, и сигнализирует подходящую информацию правила, которая выводится вместе с представлением, кодированным алгоритмом статистического кодирования.
Фиг.3A и 3B иллюстрируют возможности дополнительно уменьшить максимальную битовую скорость путем группирования информационных величин 128, чтобы сформировать группы информационных величин, которые кодируются методом ИКМ.
Ниже используются те же информационные величины 128, что и с Фиг.2, чтобы акцентировать влияние, которое может иметь группирование ИКМ на соответствующую изобретению концепцию кодирования информационных величин.
Поскольку и в этом случае одна информационная величина может иметь только 10 возможных установок, представляется возможным комбинировать две последовательные информационные величины в группы информационных величин 140а-140c до формирования представления ИКМ уже комбинированных величин. Это возможно, поскольку код ИКМ из 7 битов предоставляет возможность 128 различных комбинаций, тогда как группа из двух произвольных информационных величин может составить только 100 различных комбинаций.
Каждая из групп 140а-140с информационных величин назначена теперь одному кодовому слову 142a-142с ИКМ из 7 битов. Как можно увидеть на Фиг.3A, применение стратегии группирования до формирования представления ИКМ приводит к получению кодированного представления информационных величин 128, имеющему только 21 бит, по сравнению с 24 битами, необходимыми для негруппированного представления ИКМ с фиг.2. В вышеописанной стратегии группирования среднее значение 3,5 битов потребляется для каждой информационной величины в потоке данных (7 битов/2 информационных значения).
Как показано на Фиг.3B, можно дополнительно увеличить эффективность группирования путем группирования 3 величин в группы информационных величин 146а и 146b. В этом случае может быть сформировано 100 возможных комбинаций, которые могут быть перекрыты кодом ИКМ из 10 битов, как показано кодовыми словами 148а и 148b ИКМ на фиг.3B. Таким образом, представление ИКМ требует только 20 битов, дополнительно уменьшая среднее значение битов на информационную величину до 3,33 (10/3).
Очевидно, что битовая скорость, необходимая для кодирования, может значительно улучшиться путем группирования величин, поскольку максимальная битовая скорость будет на 12,5% (16,7%) ниже заданных примеров по фиг.3A и 3B. Дополнительное применение группирования, к примеру, по фиг.2 приведет к тому, что оценщик 102 битов примет другое решение и сигнализирует, что код ИКМ приведет к кодированному представлению, требующему меньшее количество битов.
Фиг.4 иллюстрирует структурную схему декодера согласно настоящему изобретению. Декодер 160 содержит декомпрессор 162 и приемник 163 для предоставления кодированного представления 110 и информации 112 правила, указывающей правило кодирования, использованное для кодирования информационных величин.
Декомпрессор 162 обрабатывает информацию 112 правила, чтобы получить правило декодирования, подходящее для получения информационных величин 106 из кодированного представления 110.
Декомпрессор 162 тогда восстанавливает кодированное представление 110, используя правило декодирования, и предоставляет информационные величины 106 на свои выводы.
Приведенное в предыдущих параграфах описание детализирует предложенную в изобретении концепцию путем сравнения схемы статистического кодирования, формирующей код с переменной длиной битов, со схемой кодирования ИКМ, формирующей код с фиксированной длиной битов. Предложенная в изобретении концепция никоим образом не ограничена типами кодов, которые сравниваются во время процесса кодирования. По существу, любая комбинация из двух или более кодов подходит для выполнения сравнения и получения кодированного представление информационных величин, которое компактно в максимально возможной степени, в особенности, более компактно, чем получаемое путем использования только одного кода.
Настоящее изобретение описано в контексте аудиокодирования, где параметры, описывающие, например, пространственные свойства аудиосигнала, кодируются и декодируются согласно предложенной в изобретении концепции. Данная концепция, гарантирующая максимальную битовую скорость для кодированного содержимого, может быть также длительно применена к любому другому параметрическому представлению или информационным величинам.
Особенно полезны реализации, где ранее квантованные параметры кодируются посредством статистического кодирования, поскольку предполагается, что в этом случае эффективность кодирования будет высока. Несмотря на это, в качестве входного представления для заявляемой схемы кодирования также может быть использовано прямое спектральное представление аудио- или видеосигнала. В особенности, когда сигнал описывается различными разными частями сигнала, следующими друг за другом во времени, причем временные части описываются посредством параметров, содержащих частотное представление сигнала, описанные выше меры кодирования могут быть применены по частоте и по времени. Также может быть применено группирование ИКМ, группирование параметров по времени или по частоте.
Хотя заявленный декодер, как описано выше, извлекает информацию о том, какое правило декодирования использовать для декодирования кодированного представления, посредством информации правила, сигнализирующей о правиле декодеру, в альтернативном варианте осуществления также возможно, что декодер 160 непосредственно извлекает из кодированного представления 110, какое правило использовать, например, путем распознавания особой последовательности битов в кодированном представлении, что дает преимущество, заключающееся в том, что дополнительная информация, сигнализирующая информацию правила, может быть опущена.
В зависимости от требований конкретной реализации заявленных способов эти способы могут быть реализованы посредством аппаратного обеспечения или программного обеспечения. Реализация может быть выполнена с использованием цифрового носителя информации, в частотности, диска, DVD или CD, имеющего сохраненные на нем считываемые электронными средствами сигналы управления, которые взаимодействуют с программируемой компьютерной системой для выполнения заявленных способов. В целом, настоящее изобретение, следовательно, представляет собой компьютерный программный продукт с программным кодом, хранимым на машиночитаемом носителе, причем когда компьютерный программный продукт выполняется на компьютере, программный код обеспечивает выполнение способов, соответствующих изобретению. Иначе говоря, способы, соответствующие изобретению, следовательно, представляют собой компьютерную программу, имеющую программный код для выполнения, по меньшей мере, одного из заявленных способов, когда компьютерная программа выполняется на компьютере.
Хотя настоящее изобретение проиллюстрировано и описано со ссылкой на его конкретные варианты осуществления, специалистам в данной области техники будет очевидно, что могут быть выполнены различные изменения в форме и деталях в рамках объема и сущности настоящего изобретения. Следует понимать, что различные изменения могут быть выполнены при адаптации различных вариантов осуществления в рамках более широких концепций, раскрытых здесь и охватываемых следующей формулой изобретения.
1. Кодер для кодирования без потерь информационных величин, описывающих аудиосигнал, причем информационные величины описываются более чем одним битом, чтобы получить кодированное представление информационных величин, причем кодер содержитоценщик битов, предназначенный для оценивания количества единиц информации, требуемых для кодирования информационных величин, используя первое правило кодирования и используя второе правило кодирования,причем первое правило кодирования такое, что при кодировании информационных величин получаются кодированные представления, имеющие различные количества единиц информации,второе правило кодирования такое, что при кодировании информационных величин получаются кодированные представления, имеющие идентичные количества единиц информации, причем кодированное представление получается путем назначения одного кодового слова фиксированной длины комбинации информационных величин, имеющей, по меньшей мере, две комбинированные информационные величины; ипоставщик, предназначенный для предоставления кодированного представления, полученного путем использования правила кодирования, которое приводит к меньшему количеству единиц информации для кодированного представления, и для предоставления информации правила, указывающей правило кодирования, на котором основано кодированное представление.
2. Кодер по п.1, в котором первое правило кодирования такое, что количество единиц информации, требуемое кодированным представлением фиксированного количества информационных величин, зависит от лежащих в основе информационных величин.
3. Кодер по п.1, в котором первое правило кодирования такое, что получение кодированного представления включает в себя использование кодовой книги Хаффмана.
4. Кодер по п.1, в котором первое правило кодирования такое, что получение кодированного представления включает в себя получение дифференциально кодированного представления информационных величин.
5. Кодер по п.4, в котором дифференциально кодированное представление является дифференциально кодированным по времени или по частоте.
6. Кодер по п.1, в котором информационные величины включа