2575809 - Кодер, использующий прямое подавление помех дискретизации

Кодер, использующий прямое подавление помех дискретизации

Иллюстрации

Показать все

Изобретение относится к кодеку, поддерживающему переключение между режимом кодирования с преобразованием с подавлением помех дискретизации во временной области и режимом кодирования временной области. Технический результат состоит в том, что кодек сделан менее подверженным потере кадра. Это достигается посредством добавления дополнительного синтаксического участка к кадрам, в зависимости от которого устройство синтаксического анализа декодера может выбрать между первым действием ожидания, что текущий кадр содержит, и, таким образом, считывая данные прямого подавления помех дискретизации из текущего кадра, и вторым действием неожидания, что текущий кадр содержит, и, таким образом, не считывая данные прямого подавления помех дискретизации из текущего кадра. 6 н. и 14 з.п. ф-лы, 27 ил.

Реферат

Настоящее изобретение относится к кодеку, поддерживающему режим кодирования с преобразованием с подавлением помех дискретизации во временной области и режим кодирования временной области, равно как и прямое подавление помех дискретизации для переключения между обоими режимами.

Удобно сочетать разные режимы кодирования для того, чтобы кодировать общие аудиосигналы, представляющие сочетание аудиосигналов разных типов, такие как речь, музыка или тому подобное. Отдельные режимы кодирования могут быть адаптированы для конкретных типов аудио, и, таким образом, многорежимный аудиокодер может воспользоваться преимуществом изменения режима кодирования во времени, соответствующего изменению типа аудиоконтента. Другими словами, многорежимный аудиокодер может решить, например, кодировать участки аудиосигнала, имеющего речевой контент, используя режим кодирования, специально выделенный для кодирования речи, и использовать другой режим кодирования для того, чтобы кодировать другие участки аудиоконтента, представляющего неречевой контент, такой как музыка. Режимы кодирования временной области, такие как режимы кодирования с линейным предсказанием возбуждения кодовой книги, имеют склонность быть более подходящими для кодирования речевого контента, тогда как режимы кодирования с преобразованием имеют склонность превосходить режимы кодирования временной области, поскольку имеется отношение к кодированию музыки.

Уже были решения для решения проблемы копирования с сосуществованием разных типов аудио внутри одного аудиосигнала. Появившийся в настоящее время USAC, например, предлагает переключение между режимом кодирования частотной области, главным образом согласовывающимся со стандартом AAC, и двумя дополнительными режимами линейного предсказания, аналогичными режимам подкадров стандарта AMR-WB плюс, а именно основанным на MDCT (Модифицированное дискретное косинусное преобразование) вариантом режима TCX (TCX = кодированное с преобразованием возбуждение) и режима ACELP (линейное предсказание возбуждения адаптивной кодовой книги). Чтобы быть более точным, в стандарте AMR-WB+, TCX основывается на DFT-преобразовании, но в USAC TCX имеет основу MDCT-преобразования. Определенная кадровая структура используется для того, чтобы переключаться между областью FD-кодирования, аналогично AAC, и областью линейного предсказания, аналогично AMR-WB+. Сам стандарт AMR-WB+ использует собственную кадровую структуру, образующую подкадровую структуру, родственную стандарту USAC. Стандарт AMR-WB+ обеспечивает возможность определенной конфигурации подразделения, подразделяющей кадры AMR-WB+ на более мелкие TCX- и/или ACELP-кадры. Аналогично стандарт AAC использует базовую кадровую структуру, но обеспечивает возможность использования разных длин окон для того, чтобы кодировать с преобразованием содержимое кадра. Например, могут быть использованы либо длинное окно и ассоциированная длинная длина преобразования, либо восемь коротких окон с ассоциированными преобразованиями более короткой длины.

MDCT вызывает помехи дискретизации. Это, таким образом, является верным на границах TCX- и FD-кадров. Другими словами, точно так же, как любой кодер частотной области, использующий MDCT, помехи дискретизации возникают в регионах перекрывания окон, которые подавляются при помощи соседних кадров. То есть для переходов между двумя FD-кадрами или между двумя TCX-(MDCT-) кадрами или переходов между либо от FD к TCX, либо от TCX к FD, существует неявное подавление помех дискретизации посредством процедуры перекрывания/добавления в рамках реконструкции на декодирующей стороне. Тогда нет больше помех дискретизации после добавления перекрывания. Однако в случае переходов с ACELP нет собственного подавления помех дискретизации. Тогда должен быть представлен новый инструмент, который может быть назван FAC (прямое подавление помех дискретизации). FAC служит для подавления помех дискретизации, исходящих от соседних кадров, если они отличаются от ACELP.

Другими словами, проблемы подавления помех дискретизации возникают всегда, когда возникают переходы между режимом кодирования с преобразованием и режимом кодирования временной области, как, например, ACELP. Для того чтобы выполнить преобразование от временной области к спектральной области так эффективно, насколько возможно, используется кодирование с преобразованием с подавлением помех дискретизации во временной области, такое как MDCT, т.е. режим кодирования, использующий преобразование с перекрытием, где перекрывающиеся оконные участки сигнала преобразовываются, используя преобразование, согласно которому число коэффициентов преобразования на участок меньше, чем число сэмплов на участок, так что помехи дискретизации возникают, поскольку имеют отношение отдельные участки, при этом помехи дискретизации, являющиеся подавляемыми посредством подавления помех дискретизации во временной области, т.е. посредством добавления перекрывающихся участков с помехами дискретизации соседних участков повторно преобразованного сигнала. MDCT является таким преобразованием с подавлением помех дискретизации во временной области. Неблагоприятно TDAC (подавление помех дискретизации во временной области) недоступно при переходах между режимом TC-кодирования и режимом кодирования временной области.

Для того чтобы решить эту проблему, может быть использовано прямое подавление помех дискретизации (FAC), согласно которому кодер сообщает внутри потока данных дополнительные данные FAC внутри текущего кадра всегда, когда возникает изменение в режиме кодирования с кодирования с преобразованием на кодирование временной области. Это, однако, вынуждает декодер сравнивать режимы кодирования идущих подряд кадров для того, чтобы выявить, содержит ли декодируемый в текущий момент кадр данные FAC внутри своего синтаксиса. Это, в свою очередь, означает, что могут быть кадры, для которых декодер не может быть уверен относительно того, должен ли таковой считать или осуществить синтаксический анализ данных FAC из текущего кадра. Другими словами, в случае когда один или более кадров были потеряны во время передачи, декодер не знает для непосредственно следующих (принятых) кадров относительно того, возникло ли изменение режима кодирования, и относительно того, содержит ли битовый поток кодированных данных текущего кадра данные FAC. Следовательно, декодер должен отбросить текущий кадр и ждать следующий кадр. В качестве альтернативы декодер может осуществить синтаксический анализ текущего кадра посредством выполнения декодирующих испытаний, причем одно, предполагающее, что данные FAC присутствуют, и другое, предполагающее, что данные FAC не присутствуют, с последующим решением относительно того, что одна из двух альтернатив не исполняется. Процесс декодирования наиболее вероятно мог бы привести декодер к аварии при одном из двух условий. То есть в реальности возможность последнего не является допустимым подходом. Декодер должен в любое время знать, как интерпретировать данные и не полагаться на свои собственные предположения о том, как интерпретировать данные.

Следовательно, целью настоящего изобретения является предоставить кодек, который является более устойчивым к ошибкам или устойчивым к потере кадра, с, однако, поддержкой переключения между режимом кодирования с преобразованием с подавлением помех дискретизации во временной области и режимом кодирования временной области.

Эта цель достигается объектом изобретения по любому из независимых пунктов формулы изобретения, прикрепленных посредством этого.

Настоящее изобретение основывается на обнаружении, что более устойчивый к ошибкам и устойчивый к потере кадра кодек, поддерживающий переключение между режимом кодирования с преобразованием с подавлением помех дискретизации во временной области и режимом кодирования временной области, является достижимым, если дополнительный синтаксический участок добавляется к кадрам, в зависимости от которого устройство синтаксического анализа декодера может выбрать между первым действием ожидания, что текущей кадр содержит, и, таким образом, считывая данные прямого подавления помех дискретизации из текущего кадра, и вторым действием неожидания, что текущий кадр содержит, и, таким образом, не считывая данные прямого подавления помех дискретизации из текущего кадра. Другими словами, тогда как небольшая часть эффективности кодирования потеряна из-за обеспечения вторым синтаксическим участком, это всего лишь второй синтаксический участок, который предоставлен для возможности использовать кодек в случае канала связи с потерей кадра. Без второго синтаксического участка декодер был бы не способен декодировать какой-либо участок потока данных после потери и потерпел бы аварию при попытке возобновить синтаксический анализ. Таким образом, в способствующем ошибкам окружении эффективность кодирования предохраняется от стремления к нулю посредством внесения второго синтаксического участка.

Кроме того, предпочтительные варианты осуществления настоящего изобретения являются предметов зависимых пунктов формулы изобретения. Кроме того, предпочтительные варианты осуществления настоящего изобретения подробно описаны ниже относительно чертежей. В частности,

на фиг.1 показана схематичная блок-схема декодера согласно варианту осуществления;

на фиг.2 показана схематичная блок-схема кодера согласно варианту осуществления;

на фиг.3 показана блок-схема возможной реализации реконструктора с фиг.2;

на фиг.4 показана блок-схема возможной реализации модуля FD-декодирования с фиг.3;

на фиг.5 показана блок-схема возможной реализации модуля LPD-декодирования с фиг.3;

на фиг.6 показана схематичная диаграмма, иллюстрирующая процедуру кодирования для того, чтобы сгенерировать данные FAC в соответствии с вариантом осуществления;

на фиг.7 показана схематичная диаграмма возможного повторного преобразования для преобразования TDAC в соответствии с вариантом осуществления;

на фиг.8, 9 показаны блок-схемы для иллюстрации линейной структуры пути данных FAC при кодере дополнительной обработки в кодере, чтобы тестировать изменение режима кодирования в смысле оптимизации;

на фиг.10, 11 показаны блок-схемы обработки декодером для того, чтобы достичь данных FAC, фиг.8 и 9, из потока данных;

на фиг.12 показана схематичная диаграмма реконструкции на основе FAC на декодирующей стороне поперек от границ кадров разных режимов кодирования;

на фиг.13, 14 схематично показана обработка, выполняемая при обработчике переходов с фиг.3 для того, чтобы выполнить реконструкцию с фиг.12;

на фиг.15-19 показаны участки структуры синтаксиса в соответствии с вариантом осуществления; и

на фиг.20-22 показаны участки структуры синтаксиса в соответствии с другим вариантом осуществления.

На фиг.1 показан декодер 10 согласно варианту осуществления настоящего изобретения. Декодер 10 является для декодирования потока данных, содержащего последовательность кадров 14a, 14b и 14c, в которую кодируются временные сегменты 16a-c информационного сигнала 18 соответственно. Как проиллюстрировано на фиг.1, временные сегменты с 16a по 16c являются неперекрывающимися сегментами, которые напрямую примыкают друг к другу во времени и являются последовательно упорядоченными во времени. Как проиллюстрировано на фиг.1, временные сегменты с 16a по 16c могут быть равного размера, но альтернативные варианты осуществления также допустимы. Каждый из временных сегментов с 16a по 16c кодируется в соответствующий один из кадров с 14a по 14c. Другими словами, каждый временной сегмент с 16a по 16c уникально ассоциирован с одним из кадров с 14a по 14c, который, в свою очередь, имеет также порядок, заданный среди них, который следует порядку сегментов с 16a по 16c, которые кодируются в кадры с 14a по 14c соответственно. Хотя фиг.1 предлагает, что каждый кадр с 14a по 14c является равной длины, измеряемой в, например, кодированных битах, это является, конечно, не обязательным. Скорее, длина кадров с 14a по 14c может варьироваться согласно сложности временного сегмента с 16a по 16c, с которым ассоциирован кадр с 14a по 14c.

Для легкости объяснения охарактеризованных ниже вариантов осуществления предполагается, что информационный сигнал 18 является аудиосигналом. Однако следует обратить внимание, что информационный сигнал мог быть также любым другим сигналом, таким как сигнал, выведенный физическим датчиком или тому подобным, таким как оптический датчик или тому подобный. В частности, сигнал 18 может быть дискретизирован с определенной частотой дискретизации, и временные сегменты с 16a по 16c могут покрывать непосредственно идущие подряд участки этого сигнала 18, равные по времени числу сэмплов соответственно. Числом сэмплов на сегмент времени с 16a по 16c может, например, быть 1024 сэмпла.

Декодер 10 содержит устройство 20 синтаксического анализа и реконструктор 22. Устройство 20 синтаксического анализа выполнено с возможностью осуществления синтаксического анализа потока 12 данных и, при синтаксическом анализе потока 12 данных, считывания первого синтаксического участка 24 и второго синтаксического участка 26 из текущего кадра 14b, т.е. кадра, который следует декодировать в текущий момент. На фиг.1 для примера предполагается, что кадр 14b является кадром, который следует декодировать в текущий момент, тогда как кадр 14a является кадром, который был декодирован непосредственно перед этим. Каждый кадр с 14a по 14c имеет первый синтаксический участок и второй синтаксический участок, включенные в него, с их значимостью или значением, описанными ниже. На фиг.1 первый синтаксический участок внутри кадров с 14a по 14c указан с помощью прямоугольника с "1" и второй синтаксический участок указан с помощью прямоугольника с "2".

Естественно, каждый кадр с 14a по 14c также имеет дополнительную информацию, включенную в него, которая необходима для представления ассоциированного временного сегмента с 16a по 16c, как описано более подробно ниже. Эта информация указана на фиг.1 заштрихованным блоком, в котором ссылочное обозначение 28 используется для дополнительной информации текущего кадра 14b. Устройство 20 синтаксического анализа выполнено с возможностью, при синтаксическом анализе потока 12 данных, также считывания информации 28 из текущего кадра 14b.

Реконструктор 22 выполнен с возможностью реконструкции текущего временного сегмента 16b информационного сигнала 18, ассоциированного с текущим кадром 14b, на основе дополнительной информации 28, используя выбранный один из режима декодирования с преобразованием с подавлением помех дискретизации во временной области и режима декодирования временной области. Выбор зависит от первого синтаксического элемента 24. Оба режима декодирования отличаются друг от друга присутствием или отсутствием какого-либо перехода от спектральной области обратно к временной области, используя повторное преобразование. Повторное преобразование (наряду с его соответствующим преобразованием) вносит помехи дискретизации, поскольку рассматриваются отдельные временные сегменты, однако эти помехи дискретизации являются компенсируемыми посредством подавления помех дискретизации во временной области, поскольку рассматриваются переходы на границах между идущими подряд кадрами, кодированными в режиме кодирования с преобразованием с подавлением помех дискретизации во временной области. Режим декодирования временной области не делает необходимым какое-либо повторное преобразование. Скорее, декодирование остается во временной области. Таким образом, в общем говоря, режим декодирования с преобразованием с подавлением помех дискретизации во временной области реконструктора 22 задействует повторное преобразование, которое выполняется реконструктором 22. Это повторное преобразование назначает первое число коэффициентов преобразования, как получено из информации 28 текущего кадра 14b (являясь режимом декодирования с TDAC-преобразованием), на сегмент повторно преобразованного сигнала, имеющий длину сэмпла второго числа сэмплов, которое больше, чем первое число, тем самым вызывая помехи дискретизации. Режим декодирования временной области, в свою очередь, может задействовать режим декодирования с линейным предсказанием, согласно которому коэффициенты возбуждения и линейного предсказания реконструируются из информации 28 текущего кадра, который в этом случае является режимом кодирования временной области.

Таким образом, как стало ясно из рассмотренного выше, в режиме декодирования с преобразованием с подавлением помех дискретизации во временной области, реконструктор 22 получает из информации 28 сегмент сигнала для реконструкции информационного сигнала в соответствующем временном сегменте 16b посредством повторного преобразования. Сегмент повторно преобразованного сигнала длиннее, чем в действительности текущий временной сегмент 16b, и участвует в реконструкции информационного сигнала 18 внутри временного участка, который включает в себя и продолжается за пределы временного сегмента 16b. На фиг.1 проиллюстрировано окно 32 преобразования, используемое при преобразовании первоначального сигнала как при преобразовании, так и при повторном преобразовании. Можно видеть, что окно 32 может содержать нулевой участок 32₁ в его начале и нулевой участок 32₂ в его заднем конце и участки 32₃ и 32₄ с помехами дискретизации в переднем и заднем крае текущего временного сегмента 16b, в котором участок 32₅ без помех дискретизации, где окно 32 является одним, может быть расположен между обоими участками 32₃ и 32₄с помехами дискретизации. Нулевые участки 32₁ и 32₂ являются необязательными. Также возможно, что присутствует лишь один из нулевых участков 32₁ и 32₂. Как показано на фиг.1, оконная функция может быть монотонно увеличивающейся/уменьшающейся внутри участков с помехами дискретизации. Помехи дискретизации возникают внутри участков 32₁ и 32₂ с помехами дискретизации, где окно 32 непрерывно ведет от нуля к единице или наоборот. Помехи дискретизации не являются критичными до тех пор, пока предыдущие и следующие временные сегменты тоже кодируются в режиме кодирования с преобразованием с подавлением помех дискретизации во временной области. Эта возможность проиллюстрирована на фиг.1 по отношению к временному сегменту 16c. Пунктирная линия иллюстрирует соответствующее окно 32' преобразования для временного сегмента 16c, участок с помехами дискретизации которого сходится с участком 32₄ с помехами дискретизации текущего сегмента 16b. Добавление сигналов преобразованных сегментов временных сегментов 16b и 16c реконструктором 22 подавляет помехи дискретизации обоих сегментов повторно преобразованных сигналов между собой.

Однако в случае, где предыдущий или следующий кадр с 14a по 14c кодируется в режиме кодирования временной области, переход между разными режимами кодирования происходит в результате на переднем или заднем крае текущего временного сегмента 16b, и чтобы учитывать соответствующие помехи дискретизации, поток 12 данных содержит данные прямого подавления помех дискретизации внутри соответствующего кадра, непосредственно следующего за переходом, для обеспечения возможности декодеру 10 компенсировать помехи дискретизации, возникающие при этом соответствующем переходе. Например, может случиться, что текущий кадр 14b принадлежит к режиму кодирования с преобразованием с подавлением помех дискретизации во временной области, но декодер 10 не знает, принадлежал ли предыдущий кадр 14a режиму кодирования временной области. Например, кадр 14a может потеряться во время передачи, и декодер 10, соответственно, не будет иметь к нему доступа. Однако в зависимости от режима кодирования кадра 14a текущий кадр 14b содержит данные прямого подавления помех дискретизации для того, чтобы компенсировать помехи дискретизации, возникающие на участке 32₃ с помехами дискретизации или нет. Аналогично, если текущий кадр 14b принадлежал к режиму кодирования временной области, и предыдущий кадр 14a не был принят декодером 10, тогда текущий кадр 14b имеет данные прямого подавления помех дискретизации, включенные в него, или не зависящие от режима предыдущего кадра 14b. В частности, если предыдущий кадр 14a принадлежал к другому режиму кодирования, т.е. режиму кодирования с преобразованием с подавлением помех дискретизации во временной области, то данные прямого подавления помех дискретизации присутствовали бы в текущем кадре 14b, чтобы подавить помехи дискретизации, иным образом возникающие на границе между временными сегментами 16a и 16b. Однако если предыдущий кадр 14a принадлежал к тому же режиму кодирования, т.е. режиму кодирования временной области, то устройству 20 синтаксического анализа не следовало бы ожидать присутствия данных прямого подавления помех дискретизации в текущем кадре 14b.

Следовательно, устройство 20 синтаксического анализа использует второй синтаксический участок 26, чтобы выявить, присутствуют ли данные 34 прямого подавления помех дискретизации в текущем кадре 14b или нет. При синтаксическом анализе потока 12 данных устройство 20 синтаксического анализа может выбрать одно из первого действия ожидания, что текущий кадр 14b содержит, и, таким образом, считывая данные 34 прямого подавления помех дискретизации из текущего кадра 14b, и второго действия неожидания, что текущий кадр содержит, и, таким образом, не считывая данные 34 прямого подавления помех дискретизации из текущего кадра 14b, причем выбор зависит от второго синтаксического участка 26. Если присутствует, реконструктор 22 выполнен с возможностью выполнения прямого подавления помех дискретизации на границе между текущим временным сегментом 16b и предыдущим временным сегментом 16a предыдущего кадра 14a, используя данные прямого подавления помех дискретизации.

Таким образом, по сравнению с ситуацией, где второй синтаксический участок не присутствует, декодер по фиг.1 не должен отбрасывать или безуспешно прерывать синтаксический анализ, текущий кадр 14b, даже если режим кодирования предыдущего кадра 14a неизвестен декодеру 10, например, из-за потери кадра. Скорее, декодер 10 способен использовать второй синтаксический участок 26, чтобы выявить, имеет ли текущий кадр 14b данные 34 прямого подавления помех дискретизации. Другими словами, второй синтаксический участок предоставляет ясный критерий относительно того, применяет ли и гарантирует ли одна из альтернатив, т.е. данные FAC для границы для предсказываемого кадра, присутствующего или нет, что любой декодер может вести себя также независимо от их реализации, даже в случае потери кадра. Таким образом, вышеописанный вариант осуществления вносит механизмы для преодоления проблемы потери кадра.

Перед подробным описанием вариантов осуществления, представленным ниже, описывается кодер, способный генерировать поток 12 данных по фиг.1, со ссылкой на фиг.2. Кодер по фиг.2 в общем указан ссылочным обозначением 40 и служит для кодирования информационного сигнала в поток 12 данных, так что поток 12 данных содержит последовательность кадров, в которую кодируются временные сегменты с 16a по 16c информационного сигнала соответственно. Кодер 40 содержит конструктор 42 и устройство 44 вставки. Конструктор выполнен с возможностью кодирования текущего временного сегмента 16b информационного сигнала в информацию текущего кадра 14b, используя первый выбранный один из режима кодирования с преобразованием с подавлением помех дискретизации во временной области и режима кодирования временной области. Устройство 44 вставки выполнено с возможностью вставки информации 28 в текущий кадр 14b, наряду с первым синтаксическим участком 24 и вторым синтаксическим участком 26, в котором первый синтаксический участок сообщает первый выбор, т.е. выбор режима кодирования. Конструктор 42, в свою очередь, выполнен с возможностью определения данных прямого подавления помех дискретизации для прямого подавления помех дискретизации на границе между текущим временным сегментом 16b и предыдущим временным сегментом 16a предыдущего кадра 14a, и вставляет данные 34 прямого подавления помех дискретизации в текущий кадр 14b, когда текущий кадр 14b и предыдущий кадр 14a кодированы с использованием разных режимов из режима кодирования с преобразованием с подавлением помех дискретизации во временной области и режима кодирования временной области, и воздерживается от вставки каких-либо данных прямого подавления помех дискретизации в текущий кадр 14b, когда текущий кадр 14b и предыдущий кадр 14a кодированы с использованием одинаковых режимов из режима кодирования с преобразованием с подавлением помех дискретизации во временной области и режима кодирования временной области. То есть всякий раз, когда конструктор 42 кодера 40 решает, что предпочтительно, в некотором смысле оптимизации, переключиться с одного из двух режимов кодирования на другой, конструктор 42 и устройство 44 вставки выполнены с возможностью определения и вставки данных 34 прямого подавления помех дискретизации в текущий кадр 14b, а если сохраняется режим кодирования между кадрами 14a и 14b, данные 34 FAC не вставляются в текущий кадр 14b. Для того чтобы обеспечить возможность декодеру выявлять из текущего кадра 14b, без знания содержимого предыдущего кадра 14a, присутствуют ли данные 34 FAC внутри текущего кадра 14b, определенный синтаксический участок 26 задается в зависимости от того, являются ли текущий кадр 14b и предыдущий кадр 14a кодированными с использованием одинаковых или разных режимов из режима кодирования с преобразованием с подавлением помех дискретизации во временной области и режима кодирования временной области. Конкретные примеры для понимания второго синтаксического участка 26 будут обозначены ниже.

В дальнейшем описан вариант осуществления, согласно которому кодек, к которому принадлежат декодер и кодер вышеописанных вариантов осуществления, поддерживает специальный тип структуры кадра, согласно которой сами кадры с 14a по 14c являются субъектами для образования подкадров, и существуют две версии режима кодирования с преобразованием с подавлением помех дискретизации во временной области. В частности, согласно этим вариантам осуществления, дополнительно описанным ниже, первый синтаксический участок 24 ассоциирует соответствующий кадр, из которого он был считан, с первым типом кадра, называемым в дальнейшем режимом FD-кодирования (частотной области), или со вторым типом кадра, называемым в дальнейшем режимом LPD-кодирования, и, если соответствующий кадр принадлежит ко второму типу кадра, ассоциирует подкадры подразделения соответствующего кадра, составленного из числа подкадров, с соответствующим одним из первого типа подкадра и второго типа подкадра. Как будет подробнее обозначено ниже, первый тип подкадра может задействовать соответствующие подкадры, которые следует кодировать посредством TCX, тогда как второй тип подкадра может задействовать эти соответствующие подкадры, которые следует кодировать с использованием ACELP, т.е. линейного предсказания возбуждения адаптивной кодовой книги. Либо любой другой режим кодирования с линейным предсказанием возбуждения кодовой книги может также быть использован.

Реконструктор 22 по фиг.1 выполнен с возможностью обработки возможностей этих разных режимов кодирования. К этому моменту реконструктор 22 может быть сконструирован так, как изображено на фиг.3. Согласно варианту осуществления по фиг.3, реконструктор 22 содержит два переключателя 50 и 52 и три модуля 54, 56 и 58 декодирования, каждый из которых выполнен с возможностью декодирования кадров и подкадров конкретного типа, как будет подробно описано ниже.

Переключатель 50 имеет вход, на который поступает информация 28 декодируемого в текущий момент кадра 14b, и вход управления, посредством которого переключатель 50 является управляемым в зависимости от первого синтаксического участка 25 текущего кадра. Переключатель 50 имеет два выхода, один из которых присоединен ко входу модуля 54 декодирования, ответственного за FD-декодирование (FD = частотная область), а другой присоединен ко входу подпереключателя 52, который имеет также два выхода, один из которых присоединен ко входу модуля 56 декодирования, ответственного за декодирование с линейным предсказанием кодированного с преобразованием возбуждения, а другой - ко входу модуля 58, ответственного за декодирование с линейным предсказанием возбуждения кодовой книги. Все модули с 54 по 58 декодирования выводят сегменты сигнала, реконструируя соответствующие временные сегменты, ассоциированные с соответствующими кадрами и подкадрами, из которых эти сегменты сигнала были получены посредством соответствующего режима декодирования, и обработчик 60 перехода принимает сегменты сигнала на соответствующие его входы, чтобы выполнить обработку перехода и подавление помех дискретизации, описанные выше и описанные более подробно ниже, чтобы вывести на свой выход реконструированный информационный сигнал. Обработчик 60 перехода использует данные 34 прямого подавления помех дискретизации, как проиллюстрировано на фиг.3.

Согласно варианту осуществления по фиг.3, реконструктор 22 работает следующим образом. Если первый синтаксический участок 24 ассоциирует текущий кадр с первым типом кадра в режиме FD-кодирования, переключатель 50 пересылает информацию 28 на модуль 54 FD-декодирования для использования декодирования частотной области в качестве первой версии режима декодирования с преобразованием с подавлением помех дискретизации во временной области для реконструкции временного сегмента 16b, ассоциированного с текущим кадром 15b. В противном случае, т.е. если первый синтаксический участок 24 ассоциирует текущий кадр 14b со вторым типом кадра в режиме LPD-кодирования, переключатель 50 пересылает информацию 28 на подпереключатель 52, который, в свою очередь, работает над структурой подкадра текущего кадра 14b. Точнее, в соответствии с режимом LPD, кадр разделяется на один или более подкадров, подразделение, соответствующее подразделению соответствующего временного сегмента 16b на неперекрывающиеся подучастки текущего временного сегмента 16b, как будет описано более подробно ниже со ссылкой на следующие фигуры. Синтаксический участок 24 сообщает для каждого из одного или более подучастков, ассоциирован ли таковой с первым или вторым типом подкадра соответственно. Если соответствующий подкадр принадлежит к первому типу подкадра, подпереключатель 52 пересылает соответствующую информацию 28, принадлежащую этому подкадру, на модуль 56 TCX-декодирования, чтобы использовать декодирование с линейным предсказанием кодированного с преобразованием возбуждения в качестве второй версии режима декодирования с преобразованием с подавлением помех дискретизации во временной области для реконструкции соответствующего подучастка текущего временного сегмента 16b. Если, однако, соответствующий подкадр не принадлежит ко второму типу подкадра, подпереключатель 52 пересылает информацию 28 на модуль 58 для того, чтобы выполнить кодирование с линейным предсказанием возбуждения кодовой книги в качестве режима декодирования временной области для реконструкции соответствующего подучастка текущего временного сегмента 16b.

Сегменты реконструированного сигнала, выводимые модулями с 54 по 58, помещаются обработчиком 60 перехода в правильном (презентационном) временном порядке с помощью выполнения соответствующей обработки перехода и добавления перекрытия и обработке по подавлению помех дискретизации во временной области, как описано выше и описано более подробно ниже.

В частности, модуль 54 FD-декодирования может быть сконструирован, как показано на фиг.4, и работает, как описано ниже. Согласно фиг.4, модуль 54 FD-декодирования содержит устройство 70 деквантования и устройство 72 повторного преобразования 72, последовательно присоединенные друг к другу. Как описано выше, если текущий кадр 14b является FD-кадром, таковой пересылается на модуль 54, и устройство 70 деквантования выполняет деквантование с изменяющимся спектром информации 74 коэффициентов преобразования внутри информации 28 текущего кадра 14b, используя информацию 76 масштабного множителя, также содержащуюся в информации 28. Масштабные множители были определены на стороне кодера, используя, например, психоакустические принципы, чтобы удерживать шум квантования ниже порога защиты человека.

Устройство 72 повторного преобразования затем выполняет повторное преобразование информации деквантованных коэффициентов преобразования, чтобы получить сегмент 78 повторно преобразованного сигнала, продолжающийся во времени в пределах и за пределами временного сегмента 16b, ассоциированного с текущим кадром 14b. Как будет обозначено более подробно ниже, повторным преобразованием, выполняемым устройством 72 повторного преобразования, может быть IMDCT (Обратное модифицированное дискретное косинусное преобразование), задействующее DCT IV, за которым следует операция развертки, в которой после того, как выполнена обработка методом окна с использованием окна повторного преобразования, которое могло бы быть равным или отклоняться от окна преобразования, используемого при генерировании информации 74 коэффициентов преобразования посредством использования вышеупомянутых этапов в обратном порядке, а именно обработка методом окна, за которой следует операция свертки, за которой следует DCT IV, за которым следует квантование, которое может управляться психо-акустическими принципами, чтобы удерживать шум квантования ниже порога защиты человека.

Следует отметить, что объем информации 28 коэффициентов преобразования, ввиду природы TDAC повторного преобразования устройства 72 повторного преобразования, меньше, чем число сэмплов, которое соответствует длине сегмента 78 реконструированного сигнала. В случае IMDCT число коэффициентов преобразования внутри информации 47 скорее равно числу сэмплов временного сегмента 16b. То есть лежащее в основе преобразование может быть названо критическим преобразованием дискретизации, делающим необходимым подавление помех дискретизации во временной области, чтобы подавить помехи дискретизации, возникающие из-за преобразования на границах, т.е. передних и задних краях текущего временного сегмента 16b.

В качестве дополнительного примечания следует обратить внимание, что аналогично структуре подкадра LPD-кадров, FD-кадры могли тоже быть субъектом подкадровой структуры. Например, FD-кадры могли принадлежать режиму длинного окна, в котором одиночное окно используется для обработки методом окна участка сигнала, продолжающегося за пределы переднего и заднего края текущего временного сегмента, чтобы кодировать соответствующий временной сегмент, или принадлежать режиму короткого окна, в котором соответствующий участок сигнала, продолжающийся за пределы границ текущего временного сегмента FD-кадра, подразделяется на меньшие подучастки, каждый их которых подвергается соответствующей обработке методом окна и преобразованию по отдельности. В этом случае модуль 54 FD-кодирования вывел бы сегмент повторно преобразованного сигнала для подучастка текущего временного сегмента 16b.

После описания возможной реализации модуля 54 FD-кодирования возможная реализация модуля TCX LP-декодирования и модуля декодирования LP возбуждения кодовой книги 56 и 58, соответственно, описана по отношению к фиг.5. Другими словами, фиг.5 имеет дело со случаем, где текущий кадр является LPD-кадром. В этом случае текущий кадр 14b структурирован на один или более подкадров. В настоящем случае проиллюстрировано структурирование на три подкадра 90a, 90b и 90c. Могло бы быть, что структурирование, по умолчанию, ограничено определенными подструктурирующими способностями. Каждый из подучастков ассоциирован с соответствующим одним из подучастков 92a, 92b и 92c текущего временного сегмента 16b. То есть один или более подучастков c 92a по 92c покрывают без промежутков, без перекрытия, весь временной сегмент 16b. Согласно порядку подучастков c 92a по 92c внутри временного сегмента 16b последовательный порядок задается среди подкадров c 92a по 92c. Как проиллюстрировано на фиг.5, текущий кадр 14b не полностью подразделен на подкадры c 9

Кодер, использующий прямое подавление помех дискретизации

Патент 2575809