Устройство для записи или воспроизведения мультимедийных данных с использованием иерархической информационной структуры и информационный носитель данных для него
Иллюстрации
Показать всеИзобретение относится к области записи и воспроизведения мультимедийных данных. Техническим результатом является расширение функциональных возможностей. Носители мультимедийных данных содержат от двух до трех уровней, каждый уровень хранится в файлах, отделенных друг от друга, причем первый уровень предназначен для хранения мультимедийных данных, на втором уровне записываются мультимедийные данные, разделенные на данные записи и данные воспроизведения, и описываются с помощью языка разметки информация атрибутов элемента записи и взаимосвязь между каждым элементом записи и элементом воспроизведения, третий уровень хранит навигационные данные. Устройство воспроизведения мультимедийных данных, хранящихся на носителе мультимедийных данных, содержит контроллер, выбирающий элементы воспроизведения для воспроизведения на основе навигационных данных, при этом он обнаруживает местоположение мультимедийных данных и воспроизводит их. 8 н. и 17 з.п. ф-лы, 19 ил.
Реферат
Область техники
Настоящее изобретение относится к записи и воспроизведению мультимедийных данных, а более конкретно - к устройству записи и/или воспроизведения мультимедийных данных с использованием иерархической информационной структуры и к информационному носителю данных для него.
Предшествующий уровень техники
Устройство записи/воспроизведения мультимедийных данных требует дополнительной информации, такой как атрибуты мультимедийной информации или последовательность воспроизведения данных, для записи мультимедийной информации на носитель данных или для воспроизведения мультимедийной информации с носителя данных. Фиг. 1 показывает обычное устройство 200 записи/воспроизведения мультимедийных данных, включающее в себя носитель 100 данных и связанное с пользовательским устройством 300 вывода. Устройством 200 записи/воспроизведения мультимедийных данных можно управлять, используя пользовательское устройство 400 ввода данных, такое как пульт дистанционного управления. В общем случае для записи дополнительной информации формируют дополнительные информационные таблицы в конкретном местоположении или в конкретном файле существующего носителя данных. Примерами носителей данных могут служить компакт-диски (CD), видео CD (VCD) и цифровые универсальные диски (DVD). В дополнительной информационной таблице информация описывается посредством местоположения и длины поля данных. Таким образом, новая информационная таблица должна создаваться всякий раз, когда разрабатывается новый тип носителя мультимедийной информации. В частности, навигационная информация для выбора элемента воспроизведения или для определения последовательности воспроизведения записывается в табличных форматах на DVD. Однако такая навигационная информация смешивается с информацией, которая определяет элементы воспроизведения, таким образом затрудняя выполнение навигации.
Ниже описана структура данных обычного DVD. Согласно фиг. 2, DVD включает в себя область администратора видеоданных (VMG) и множество областей наборов заглавий видеоданных (VTS). Управляющая информация и информация выбора заглавий хранятся в области VMG, где информация заглавий из элементов воспроизведения хранится в множестве областей VTS. Область VMG включает в себя два или три файла, и каждая область VTS включает в себя от трех до двенадцати файлов.
Область VMG подробно показана на фиг. 3. Область VMG включает в себя область информации администратора видеоданных (VMGI) для хранения дополнительной информации, относящейся к области VMG, область набора видеообъектов (VOBS) для хранения информации видеообъектов для меню и область резервирования VMGI. Каждая из указанных выше областей включает в себя один файл. Область VMG может включать в себя или может не включать в себя область VOBS, но другие две области, область VMGI и область резервирования VMGI, необходимы.
Информация заглавий и VOBS хранятся в области VTS. Множество заглавий может быть записано в области VTS. Область VTS подробно показана на фиг. 4.
Согласно фиг. 4, в области VTS #n записывается информация набора заглавий видеоданных (VTSI), VOBS для меню, который является набором видеообъектов VTS для меню, VOBS для заглавия, который является набором видеообъектов для заглавия в VTS, и данные резервирования VTSI. Однако область VTS #n может не включать в себя VOBS для заглавия. Каждый VOBS делится на видеообъекты (VOB) из ячеек, которые являются элементами записи. Каждый VOB включает в себя ячейки. Согласно одному из аспектов настоящего изобретения, ячейка определяется как самый наименьший элемент данных.
Элемент воспроизведения представляется иерархической структурой, в которой заглавие присутствует на соответствующем верхнем уровне. Заглавие включает в себя одну программную цепочку (PGC) или множество PGC, связанных друг с другом.
В данном случае первая PGC называется входной PGC. Фиг. 5 показывает элемент воспроизведения one_sequential_PGC_title, который включает в себя только одну PGC (входную PGC). Фиг. 6 показывает элемент воспроизведения, в котором заглавие связано с множеством PGC. После воспроизведения PGC воспроизводится другая PGC путем выбора по меньшей мере одной из нескольких PGC. В этом случае команда выбора может храниться в информации программной цепочки (PGCI). Управление последовательностью воспроизведения PGC называется навигацией. Фиг. 7 показывает структуру PGC. PGC хранится в информационной структуре, описанной как формат PGCI. PGCI включает в себя команду, расположенную перед цепочкой программ, в которой хранятся навигационные команды, команду, расположенную после цепочки программ, и множество элементов информации программы. Команда, расположенная перед цепочкой программ, выполняется до воспроизведения соответствующей PGC, а команда, расположенная после цепочки программ, выполняется после воспроизведения PGC. Каждый элемент информации программы включает в себя множество элементов информации «ячейка», каждая ячейка связана с ячейкой в VOB, которая является элементом записи. Каждая ячейка, которая включает в себя каждый элемент воспроизведения, имеет команду ячейки, которая выполняется после воспроизведения данной ячейки. Поэтому PGCI представляет иерархическую структуру воспроизведения PGC, т.е. элемент воспроизведения, в котором самый наименьший элемент воспроизведения «ячейка», связан с самым наименьшим элементом записи «ячейка».
Фиг. 8 показывает случай выполнения перехода к новой PGC с использованием информации команд навигации во время или после воспроизведения PGC. Другими словами, можно легко управлять последовательностью воспроизведения PGC, используя навигационные команды, такие как LinkPrevPGC, LinkTopPGC, LinkNextPGC, LinkTailPGC, LinkGoUpPGC и LinkPGCN. Таким образом, PGC имеет элементы воспроизведения, а также навигационную информацию.
К программе в PGC обращаются с помощью ссылки, называемой частью заглавия (PTT).
В случае DVD указанная выше информация хранится в двоичном табличном формате, т.е. информация записывается в табличном формате, причем информация записывается в пределах предопределенной длины в битах в конкретном местоположении таблицы.
Фиг. 9 показывает структуру данных информационной таблицы TT_SRPT, которая является информацией заглавия в VMGI. Согласно фиг. 9, первые два байта информации TT_SRPT указывают общее количество заглавий n. Следующие два байта информации TT_SRPT зарезервированы для информации расширения, которая будет определена в будущем стандарте. Другие байты после этих двух байтов представляют информацию TT_SRP, которая описывает отдельные заглавия. В частности, номер VTN, определяемый с помощью соответствующего заглавия, и номер заглавия в соответствующем VTS записываются с помощью предопределенной длины в битах в конкретном местоположении VTSN и VTS_TTN соответственно.
Фиг. 10 показывает структуру информации VTS_PTT_SRPT в VTSI. Согласно фиг. 10, информация VTS_PTT_SRPT включает в себя TTU_SRP, соответствующие количеству заглавий соответствующего VTS. Соответствующие TTU_SRP включают в себя информацию для определения одного из PTT_SRP, следующих после TTU_SRP. Поэтому PTT_SRP, расположенный между PTT_SRP, который определяется с помощью TTU_SRP, и PTT_SRP, который определяется с помощью следующего TTU_SRP, формируют заглавие. Таким образом, множество указателей поиска Part_of_Title (PTT-SRP) присутствует в каждом заглавии, что приводит к делению заглавия на несколько PTT. Для более простого понимания PTT можно рассматривать как раздел. Фиг. 11 показывает содержимое PTT_SRP, которое определяет PGC и программу в PGC. В заключение заглавие делится в несколько PTT и каждая PTT связывается с программой в PGC.
Фиг. 12 показывает структуру данных VTS PGCIT_PGCIT, которая представляет таблицу PGCI в VTSI. Согласно фиг. 12, общее количество программ и ячеек, которые принадлежат PGC, хранится в VTS_PGCITI. Кроме того, VTS_PGCIT хранит столько VTS_PGCI, сколько существует VTS_PGC, которые принадлежат VTS. Фиг. 13 показывает подробную структуру данных VTS_PGCI. В VTS_PGCI различная информация записана в пределах конкретной длины в битах в конкретном местоположении в табличных форматах, которые включают в себя PGC_CMDT, который описывает команду, расположенную перед цепочкой программ, команду, расположенную после цепочки команд, команду ячейки и т.д. Кроме того, VTS_PGCI включает в себя PGC_PGMAP, который указывает столько ячеек начала программы, сколько существует программ, и C_POSIT, который является информацией для связи соответствующих ячеек с соответствующими элементами записи.
Как описано выше, в случае обычного DVD, который является носителем мультимедийных данных, данные видеообъектов и данные, относящиеся к элементам воспроизведения и к навигации, записываются как заглавия и PGC. Однако дополнительные данные в PGC хранятся в табличном формате в пределах конкретных длин в конкретном местоположении. Команды для навигации также хранятся в ограниченной области вместе с дополнительными данными, которые определяют элементы воспроизведения. Поэтому появление нового элемента воспроизведения приводит к изменению расположения таблицы, таким образом затрудняя реализацию расширения для нового воспроизведения. Чтобы решить эту проблему, в множестве областей формируют зарезервированные промежутки, что все равно ограничивает любое расширение для будущего. В худшем варианте структура таблицы может быть переопределена. На самом деле существующие носители мультимедийных данных, такие как CD, VCD, MD (минидиски) и DVD, имеют собственные структуры таблиц.
Между тем, развитие технологии Интернет приводит к развитию персональных компьютеров (ПК), способных обрабатывать мультимедийные данные. Например, данные видеообъектов или аудиоданные могут быть вставлены в документ с помощью языка разметки гипертекста (HTML) или могут воспроизводиться во время воспроизведения HTML. В этом случае навигационные данные описывают с помощью языка сценариев или подобным образом. Поэтому навигационные данные могут описываться отдельно от данных воспроизведения. Если существуют два типа навигационных данных, например одни, которыми управляют с использованием языка сценариев, и другие, описанные в табличном формате, то сложно управлять обоими типами навигационных данных.
Описание изобретения
Согласно одному из аспектов настоящего изобретения, обеспечивается носитель данных и устройство воспроизведения данных. Предполагая, что устройство воспроизведения данных работает так, как определено в настоящем изобретении, устройство записи записывает на носителе данных информацию, которая соответствует структуре данных, которая определена в настоящем изобретении, и мультимедийные данные. В данной работе операции сохранения понимаются идентично операциям записи.
Мультимедийные данные и дополнительные данные записываются на носителе данных согласно одному из аспектов настоящего изобретения. Настоящее изобретение предлагает раздельную запись двух различных типов дополнительных данных: дополнительной информации, относящейся к элементам записи, атрибутам и элементам воспроизведения мультимедийных данных, и навигационной информации, относящейся к выбору элемента воспроизведения и к последовательности воспроизведения. Дополнительная информация, относящаяся к элементу записи, атрибутам или элементу воспроизведения для мультимедийных данных, описывается с использованием языка разметки. Соответственно возможно воплощение, поддерживающее расширение для будущего стандарта, даже когда добавляется новый тип мультимедийных данных или предписывается новый вид элемента записи или воспроизведения, независимо от принятого стандарта. Альтернативно дополнительная информация может храниться в двоичном табличном формате.
Кроме того, оба или один из языка разметки и языка сценариев могут использоваться для описания навигационных данных, которые представляют выбор последовательности воспроизведения или элемента воспроизведения. Язык разметки также используется для описания данных представления, которые представляют экранное меню для выбора элемента воспроизведения и компоновку экрана для воспроизведения данных, таким образом предоставляя возможность создания структуры меню и навигации с высокой степенью гибкости.
Согласно одному из аспектов настоящего изобретения, обеспечивают носитель мультимедийных данных, на котором хранятся мультимедийные данные. Носитель мультимедийных данных включает в себя первый уровень, на котором хранятся мультимедийные данные, такие как изображения видеообъектов, неподвижные изображения, голос, графика и тексты; и второй уровень, на котором с помощью языка разметки с использованием элементов и атрибутов описываются информация, относящаяся к атрибутам элемента записи и взаимосвязям между элементом записи и элементом воспроизведения, когда мультимедийные данные делятся на элемент записи и элемент воспроизведения.
Навигационные данные, которые используются для управления выбором элемента воспроизведения и последовательностью воспроизведения, могут записываться на третьем уровне с использованием языка разметки или языка сценариев, в дополнение к информации, записанной на первом и втором уровнях.
Дополнительные аспекты и/или преимущества данного изобретения сформулированы частично в последующем описании и частично поясняются в описании или могут быть изучены при практической реализации изобретения.
Краткое описание чертежей
Указанные выше и/или другие аспекты и преимущества настоящего изобретения поясняются в подробном описании предпочтительного варианта его осуществления со ссылкой на чертежи, на которых представлено следующее:
фиг. 1 - обычное устройство записи/воспроизведения мультимедийных данных;
фиг. 2 - структура данных обычного DVD;
фиг. 3 - область VMG;
фиг. 4 - область VTS;
фиг. 5 - элемент воспроизведения one_sequential_PGC_title, который включает в себя только одну PGC;
фиг. 6 - элемент воспроизведения, в котором заглавие связано с множеством PGC;
фиг. 7 - структура PGC;
фиг. 8 - иллюстрация случая выполнения перехода к новой PGC с использованием информации команды навигации во время или после воспроизведения PGC;
фиг. 9 - структура данных информационной таблицы TT_SRPT;
фиг. 10 - структура данных VTS_PTT_SRPT информации в VTSI;
фиг. 11 - содержимое PTT_SRP, определяющее PGC и программу в PGC;
фиг. 12 - структура данных VTS PGCIT_PGCIT, представляющая таблицу PGCI в VTSI;
фиг. 13 - подробная структура данных VTS_PGCI;
фиг. 14 - file1.mpg и file2.mpg в соответствии с одним из аспектов настоящего изобретения;
фиг. 15 - два видеообъекта «клип» в соответствии с одним из аспектов настоящего изобретения;
фиг. 16 - расположение данных видеообъекта относительно временных интервалов, записанное в табличном формате в соответствии с одним из аспектов настоящего изобретения;
фиг. 17 - файл видеообъекта в соответствии с одним из аспектов настоящего изобретения;
фиг. 18 - устройство воспроизведения в соответствии с одним из аспектов настоящего изобретения; и
фиг. 19 - способ формирования экранного меню для навигации в соответствии с одним из аспектов настоящего изобретения.
Предпочтительный вариант осуществления изобретения
Ниже подробно описаны аспекты настоящего изобретения, примеры которого показаны на чертежах, на которых одинаковые ссылочные позиции относятся к соответствующим элементам по всему документу. Данные аспекты описаны ниже для объяснения настоящего изобретения со ссылками на чертежи.
Согласно одному из аспектов настоящего изобретения, носитель данных, на котором записан видеообъект «заглавие», поддерживается множеством типов голоса и подзаголовков. Дополнительная информация может записываться в иерархическом порядке, и язык разметки используется для реализации каждого уровня для расширяемости. Язык разметки, который описывает элементы записи и элементы воспроизведения, называют языком описания мультимедийной информации.
Согласно фиг. 14, file1.mpg, который является первой половиной данных, представляющих видеообъект «заглавие», и file2.mpg, который является другой половиной, записывают на первом уровне. Заглавие может делиться на множество файлов, учитывая ограничение на размеры раздела или файла. Данные видеообъекта кодируются со сжатием для уменьшения количества данных. Способ сжатия стандарта MPEG, который является одним из самых популярных способов сжатия движущихся изображений, поддерживает способ кодирования с переменной битовой скоростью (VBR), в котором скорость потока изменяется согласно количеству видеоинформации. Поиск во времени, который определяет точку начала воспроизведения данных относительно заданного момента времени, требует, чтобы информация табличного типа отображала время и местоположение данных. Данную информацию используют для обнаружения местоположения требуемых данных через предопределенное время после начала воспроизведения данных. В общем случае информация табличного типа включает в себя информацию, относящуюся к местоположению данных, определенную для каждого предопределенного момента времени. Например, информация табличного типа может быть информацией таблицы времен, которая представляет информацию, связанную с местоположением во времени, которая указывает местоположение данных, измеренное относительно начала файла каждые 10 секунд. Однако из-за того, что объем информации таблицы времен является значительным, информация записывается в двоичном табличном формате вместо использования языка разметки и сохраняется на первом уровне. Фиг. 14 показывает информацию таблицы времен file1timemap.dat и file2timemap.dat, относящуюся к данным видеообъекта file1.mpg и file2.mpg соответственно. Согласно одному из аспектов настоящего изобретения фактическая информация таблицы времен показана на фиг. 16.
Дополнительные данные, относящиеся к мультимедийным данным, записанным на первом уровне, записываются на втором уровне. Дополнительные данные определяют элемент воспроизведения для соответствующего воспроизведения мультимедийных данных на первом уровне. В данном случае элемент воспроизведения может делиться на элементы записи или элементы хранения, которые описываются в двоичном табличном формате или в альтернативном аспекте настоящего изобретения, используя язык разметки, и сохраняться как файл description.xml. Навигационная информация, которая должна быть добавлена к дополнительным данным, записывается на третьем уровне как файл menu.xml. Сохраненная навигационная информация определяет выбор и последовательность воспроизведения данных с помощью управления элементом воспроизведения, записанным на втором уровне.
В общем случае экранное меню организовано на носителе записи, на котором записано множество заглавий или разделов, для предоставления возможности произвольного доступа к конкретному заглавию или разделу по выбору пользователя и для немедленного воспроизведения с указанного места. В экранном меню обычно формируются неподвижные изображения и кнопки. Кроме того, может воспроизводиться музыкальный фон. Когда пользователь выбирает кнопку, выполняется функция, связанная с данной кнопкой. Согласно фиг. 14, неподвижные изображения и музыкальные данные, которые включает в себя экранное меню, записываются как файлы file3.jpg и file4.mp3 на первом уровне.
Дополнительные данные, записанные на втором уровне, описывают информацию, относящуюся к данным, записанным на первом уровне. Данные видеообъекта мультиплексируются в поток данных для синхронизации видео, аудио и графических данных. Атрибуты элементов записи данных видеообъекта описываются как description.xml с использованием атрибутов видео, аудио и графических данных, и номера аудио, видео и графических данных. Кроме того, дополнительные данные обеспечивают информацию, относящуюся к элементам воспроизведения, которые генерируют с помощью объединения или выбора элементов записи.
В одном из аспектов настоящего изобретения, «клип» используется как элемент записи и «ячейки», «разделы» и «заглавия» используются как элементы воспроизведения. Последующее описание обеспечивает объяснение этих элементов (см. фиг. 15). Клип - объект, описанный по отношению к записи мультимедийных данных. Фиг. 15 показывает два видеообъекта «клип». Видеообъект «клип» содержит информацию о времени и расположении. Данные, принадлежащие клипу, могут непрерывно воспроизводиться. Таким образом, файл «mpg», включающий в себя данные видеообъекта, и файл таблицы времен, включающий в себя информацию расположения во времени, объединяются для формирования клипа. Файл таблицы времен включает в себя дополнительную информацию, которая предоставляет возможность быстрого поиска требуемого расположения во времени данных видеообъекта, когда видеообъект закодирован с помощью VBR.
Таким образом, если файл видеообъекта закодирован с помощью VBR, как показано на фиг. 17, то местоположение данных видеообъекта относительно временных интервалов, определяемое с помощью количества предопределенных интервалов времени от исходной позиции, записывается в табличном формате, показанном на фиг. 16. Если местоположение данных в таблице определить как запись, то общее количество записей и временных интервалов может записываться в начале таблицы. Поиск необходимого местоположения данных относительно предопределенного момента времени может быть выполнен путем обнаружения местоположения временного интервала, ближайшего к предопределенному моменту времени, записанному в таблице. Требуемые данные могут точно воспроизводиться путем считывания данных, начиная с найденного местоположения. Если данные записаны с постоянной скоростью потока (кодирования) (CBR), то можно поддерживать постоянное количество закодированных данных, генерируемое в течение предопределенного времени. В этом случае клип может создаваться только с помощью данных видеообъекта, потому что можно обнаруживать местоположение требуемых данных с использованием вычисления времени согласно CBR без информации таблицы времен.
Следующая информация используется для определения видеообъекта «клип», который включает в себя видеоданные, множество групп аудиоданных и множества групп графических данных:
(a) общие атрибуты: информация идентификации клипа, файлы видеообъекта «клип» и файл информации расположения клипа во времени (файл таблицы времен);
(b) видео: размер экрана (например, 1920 × 1080, 1280 × 720 и 720 × 480), средняя скорость потока (например, 4 Мбит/с, 6 Мбит/с, 10 Мбит/с и 20 Мбит/с), частота вывода на экран (например, 60 Гц, 30 Гц и 24 Гц), тип развертки (например, прогрессивная и чересстрочная);
(c) аудио: информация идентификации аудиопотока, информация кодирования аудиоданных, лингвистические атрибуты каждой группы аудиоданных (например, корейский язык и английский язык) и атрибуты применения каждой группы аудиоданных (например, основные аудиоданные, дополнительные аудиоданные и комментарий); и
(d) графическое изображение: информация идентификации графического потока, информация кодирования графики, лингвистические атрибуты каждой группы графических данных (например, корейский язык и английский язык), атрибуты применения каждой группы графических данных (например, субтитры и анимация).
Однако приведенная выше информация может изменяться в соответствии с типом записи, типом кодирования и типом мультиплексирования мультимедийных данных. Кроме того, элемент записи может формировать иерархическую структуру и, таким образом, может существовать элемент записи более низкого уровня, чем клип. Для удобства согласно одному из аспектов настоящего изобретения определено, что элементом записи является клип.
В общем случае элемент воспроизведения имеет иерархическую структуру, т.е. элемент воспроизведения включает в себя множество подэлементов (нижестоящих элементов) воспроизведения. В этом случае подэлемент воспроизведения определяется как элемент последовательности воспроизведения или точка произвольного доступа.
Согласно фиг. 15, ячейка - это элемент воспроизведения, который описывается в связи с воспроизведением мультимедийных данных, каждая ячейка определяет клип или часть клипа. Ячейка представляет самый младший уровень элемента воспроизведения. Таким образом, ячейка, т.е. элемент воспроизведения, связана по меньшей мере с одним клипом, т.е. элементом записи, при воспроизведении мультимедийных данных.
Ячейка определяется использованием идентифицирующей информации о начальном и конечном времени соответствующего клипа. Однако, если ячейка обозначает весь клип, а не его часть, то начальное и конечное время дополнительно не определяют.
Согласно фиг. 15, раздел - это элемент воспроизведения, который описывается в связи с воспроизведением данных, каждый раздел включает в себя по меньшей мере одну ячейку. В общем случае раздел определяется с помощью названия раздела, информации идентификации раздела и информации, относящейся по меньшей мере к одной ячейке, принадлежащей данному разделу.
Согласно одному из аспектов настоящего изобретения, раздел можно понимать как точку воспроизведения, которая позволяет пользователю выполнять произвольный доступ. Таким образом, для конкретного заглавия пользователь может искать или воспроизводить необходимые данные разделами. В общем случае экранное меню обеспечивает меню, в котором необходимые данные могут выбираться разделами.
Согласно фиг. 15, к заглавию относится множество разделов. На носителе данных множество заглавий может храниться и может последовательно воспроизводиться согласно последовательности признаков (обозначений) идентификации заглавий. В общем случае экранное меню обеспечивает меню, которое позволяет выбирать заглавие, данное заглавие определяется именем заглавия, признаком идентификации заглавия и информацией, относящейся по меньшей мере к одному разделу, относящемуся к данному заглавию.
На фиг. 15 показана взаимосвязь между данными видеообъекта, записанными на первом уровне, и клипами, разделами и заглавиями, записанными на втором уровне.
Согласно одному из аспектов настоящего изобретения, информация, относящаяся ко второму уровню, описывается в элементах двух типов, т.е. в элементах записи и элементах воспроизведения, в то время как данные, относящиеся к навигации, отсутствуют. В общем случае данные описываются в двоичном табличном формате или через язык разметки. В одном из аспектов настоящего изобретения данные описываются с использованием языка разметки, потому что язык разметки более выгоден, чем двоичная таблица. Расширяемый язык разметки (XML), представляющий пример языка разметки, определен в стандарте консорциума по сети Интернет (W3C), который предписывает рекомендации для Интернет. С помощью XML можно описывать различные базы данных и документы. Если информация, относящаяся ко второму уровню, описывается с помощью XML, очень просто гарантировать расширяемость и совместимость в направлении вниз.
В дальнейшем основанный на XML язык будет определен описанием дополнительной информации, которая должна быть сохранена на втором уровне, согласно одному из аспектов настоящего изобретения. Основанный на XML язык упоминается как язык описания мультимедийных данных (ЯОМД, MDL). XML описывается комбинацией иерархических элементов. Кроме того, каждый элемент может иметь несколько атрибутов. Название элемента описывается в пределах знаков '<>'. Правила описания подэлементов приведены ниже.
Язык MDL, согласно одному из аспектов настоящего изобретения, имеет элементы и атрибуты, которые описаны ниже. В данном случае документ понимается как элемент данных, который описывается и сохраняется с использованием языка разметки.
(a) Самый верхний элемент документа MDL описывается с использованием <mdl> или эквивалентного значения.
(b) Элемент <mdl> может иметь следующие подэлементы:
- <head (заголовок)>
- <body (тело)>
(c) Элемент <заголовок> содержит всю информацию, относящуюся к элементу хранения, и может иметь следующий подэлемент:
- <meta (мета)>
(d) Элемент <мета> определяет пустой элемент, в котором определяются признаки документа и этим признакам присвоены соответствующие значения. Каждый элемент <мета> обозначает пару, включающую в себя атрибут и значение.
Атрибуты элементов, определяемых в элементе <мета>, следующие:
- Name (имя): имя обозначает признак документа, определенный в элементе <мета>. Имя является атрибутом, необходимым для элемента <мета>.
- Content (содержимое): содержимое обозначает значение признака, определенного в элементе <мета>. Содержимое также является атрибутом, необходимым для элемента <мета>.
Далее представлены примеры элемента <мета>, исключая обычные примеры элемента <мета>: например, (i) <meta name = «type (тип)» content = «mdl-диск»/>, который описывает диск, который изготовлен используя язык описания мультимедийных данных; и (ii) <meta name = «region (регион)» content = «1»/>, который указывает, что региональный код диска - 1.
(e) Элемент <тело> может иметь следующие подэлементы:
- <clip (клип)>, и
- <title (заголовок)>
(f) Элемент <клип> может иметь следующие атрибуты:
- Id (идентификатор (ИД)): представление идентифицирующей информации для каждого клипа. ИД изменяется в соответствии с типом носителя данных (например, 1, 2 или 3),
- src: представление файла данных видео объекта, например file1.mpg1, и
- tmap_src: представление файла, содержащего таблицу времен (например, file1timemap.dat).
Элемент <клип> может иметь следующие подэлементы:
- <video (видео)>,
- <audio (аудио)> и
- <graphic (графическое изображение)>
(g) Элемент <видео> может иметь следующие атрибуты:
- resolution (разрешение): показывает размеры в вертикальном и горизонтальном направлениях, например 1920 × 1080 или 1280 × 720,
- frame_rate (частота кадров): количество выводимых кадров в секунду, например 60, 30, 24 или 50,
- scanning (развертка): указывает, сканируется ли изображение последовательно или нет, т.е. применяется ли прогрессивная или чересстрочная развертка изображения,
- bit_rate (скорость потока): средняя скорость потока, например, vbr, 4 Мбит/с, 6 Мбит/с, 8 Мбит/с, 10 Мбит/с или 20 Мбит/с, и
- stream_id (ИД потока): ИД потока для потока MPEG PES, например 0×e0
(h) Элемент <аудио> может иметь следующие атрибуты:
- encoding (кодирование): представление способа кодирования, например стандарты mp1 (MPEG-1), mp2, mp3, ac3, lpcm (линейная импульсно-кодовая модуляция) или dts (технология окружающего звука цифрового (домашнего) театра),
- sampling_rate (частота дискретизации): частота дискретизации, например 48 Кбит/с, 96 Кбит/с или 192 Кбит/с,
- quantization (квантование): количество квантованных битов, например 16 или 24,
- bit_rate (скорость потока): скорость закодированного потока, например, vbr, 128 Кбит/с или 384 Кбит/с,
- channel_no (количество каналов): общее количество каналов, например 2, 5 или 7,
- language (язык): лингвистические атрибуты, например «нет», en (английский язык), ko (корейский язык), jp (японский язык) или fr (французский язык),
- application (применение): использование аудиопотока, например, основной аудиопоток, вспомогательный аудиопоток или комментарий,
- stream_id (ИД потока): ИД MPEG PES потока, например 0×c0 или 0×bd, и
- sub_stream_id (ИД субпотока): ИД нижестоящего потока для потока MPEG PES, например, «нет», 0×80 или 0×a0.
(i) Элемент <графическое изображение> может иметь следующие атрибуты:
- encoding (кодирование): представление способа кодирования, например dvd_subpicture,
- application (применение): использование потока суб-графики, например, анимация или субтитры,
- language (язык): лингвистические атрибуты, например «нет», en (английский язык), ko (корейский язык), jp (японский язык) или fr (французский язык),
- stream_id (ИД потока): ИД потока для потока MPEG PES, например, 0×BD, и
- sub_stream_id (ИД субпотока): ИД нижестоящего потока для потока MPEG PES, например 0×20.
(k) Элемент <заглавие> может иметь следующие атрибуты:
- name (имя): название заглавия, например Белый снег (White Snow),
- Id (ИД): информация идентификации заглавия, которая изменяется в соответствии с типом носителя данных, например 1, 2 или 3.
Кроме того, элемент <заглавие> может иметь следующие подэлементы:
- <chapter (раздел)>.
(l) Элемент <раздел> может иметь следующие атрибуты:
- name (имя): название раздела, например Карлик (Dwarf), и
- Id (ИД): информация идентификации раздела, которая изменяется в соответствии с типом носителя данных, например 1, 2 или 3.
Кроме того, элемент <раздел> может иметь следующий подэлемент:
- <cell (ячейка)>.
(m) Элемент <ячейка> может иметь следующие атрибуты:
- clip_id (ИД клипа): идентификационный номер клипа, с которым связана данная ячейка,
- start_time (время начала): время начала клипа clip_id, и
- end_time (время окончания): время окончания клипа clip_id.
Обобщение указанных выше атрибутов и элементов показано в таблице 1.
Таблица 1 | ||
Элемент | Атрибут | Подэлемент |
<mdl> | <заголовок>/<тело> | |
<заголовок> | <мета>* | |
<мета> | имя, содержимое | ПУСТОЙ |
<тело> | <клип>+/<заглавие>+ | |
<клип> | id, src, tmap_src | <видео>/<аудио>*/ <графическое изображение>* |
<видео> | разрешение, frame_rate, развертка, bit_rate, ИД потока | ПУСТОЙ |
<аудио> | кодирование, sampling_rate, quantization_bit, bit_rate, channel_no, язык, применение, ИД потока, ИД субпотока | ПУСТОЙ |
<графическое изображение> | кодирование, применение, язык, ИД потока, ИД субпотока | ПУСТОЙ |
<заглавие> | имя, ИД | <раздел>+ |
<раздел> | имя, ИД | <ячейка>+ |
<ячейка> | ИД клипа, время начала, время окончания | ПУСТОЙ |
Дополнительные данные на фиг. 15, согласно предпочтительному варианту осуществления настоящего изобретения, могут описываться с использованием приведенных выше элементов и атрибутов следующим образом:
<?xml version=«1.0»?>
<!DOCTYPE mdl
PUBLIC «http://mdl-disc.org/mdl1/mdl.dtd»>
<mdl>
<head>
<meta name=«type» content=«mdl-disc» />
<meta name=«title» content=«White Snow Special» />
<meta name=«region» content=«1» />
</head>
<body>
<clip id=«1» src=«file1.mpg» tmap_src=«file1tmap.dat»>
<video resolution=«1920×1080» frame_rate=«24»
scanning=«progressive» bit_rate=«vbr» stream_id=«0×e0» />
<audio encoding=«ac3» sampling_rate=«48k» quantization_bit=«16»
bit_rate=«384k» channel_no=«5» language=«en»
application=«main» stream_id=«0×bd» sub_stream_id=«0×80» />
<audio encoding=«ac3» sampling_rate=«48k»
quantization_bit=«24»
bit_rate=«384k» channel_no=«5» language=«ko»
application=«main» stream_id=«0×bd» sub_stream_id=«0×81» />
<audio encoding=«ac3» sampling_rate=«48k» quantization_bit=«24»
bit_rate=«384k» channel_no=«5» language=«jp»
application=«main» stream_id=«0×bd» sub_stream_id=«0×84» />
<audio encoding=«mp1» sampling_rate=«48k» quantization_bit=«16»
bit_rate=«384k» channel_no=«2» language=«en»
application=«commentary» stream_id=«0×c0»
sub_stream_id=«none»/>
<graphic encoding=«dvd_subpicture» application=«sub_title»
language=«en» stream_id=«0×bd» sub_stream_id=«0×20» />
<graphic encoding=«dvd_subpicture» application=«sub_title»
language=«ko» stream_id=«0×bd» sub_stream_id=«0×21»/>
<graphic encoding=«dvd_subpicture» application=«sub_title»
language=«jp» stream_id=«0×bd» sub_stream_id=«0×22» />
</clip>
...
<clip id=«5» src=«file5.mpg» tmap_src=«filek5map.dat»>
<video resolution=«1920×1080» frame_rate=«24»
scanning=«progressive» bit_rate=«vbr» stream_id=«0×e0» />
<audio encoding=«ac3» sampling_rate=«48k» quantization_bit=«16»
bit_rate=«384k» channel_no=«5» language=«en»
application=«main» stream_id=«0xbd» sub_stream_id=«0×80» />
<audio encoding=«mp1» sampling_rate=«48k» quantization_bit=«16»
bit_rate=«384k» channel_no=«2» language=«en»
application=«commentary»stream_id=«0×bd»
sub_stream_id=«0×83» />
</clip>
<title id=«1» name=«White Snow»>
<chapter id=«1» name=«Mirror»>
<cell clip_id=«1» start_time=«0:00:00» end_time=«0:05:00»/>
</chapter>
<chapter id=«2» name=«7 Dwarves»>
<cell clip_id=«1» start_time=«0:05:00» end_time=«0:20:00»/>
<cell clip_id=«2» start_time=«0:00:00» end_time=«1:00:00»/>
</chapter>
...
</title>
<title id=«2» name=«White Snow Supplementary»>
<chapter id=«1» name=«How to make Snow White»>
<cell clip_id=«5» start_time=«0:00:00» end_time=«0:20:00»/>
</chapter>
</title>
</body>
</mdl>
В одном из аспектов настоящего изобретения фактические данные видеообъекта включают в себя пять клипов, представленных в элементах записи, и два заглавия, представленных в элементах воспроизведения.
В случае данных видеообъекта VBR, клип описывается как данные информации местоположения во времени, которые включают в себя часть информации таблицы времен. Таким образом, в одном из аспектов согласно настоящему изобретению, каждый клип описывается с использованием двух атрибутов src и tmap_src так, что данные клипа и заглавия связаны друг с другом. Кроме того, каждый клип включает в с