Паноптическая визуализация документа в соответствии с его структурой

Изобретение относится к средствам визуализации документа. Технический результат заключается в расширении арсенала технических средств визуализации документа. Способ визуализации документа содержит: прием и разборку электронного документа на множество составляющих страниц; связывание страниц, включая предоставление связанных метаданных для каждой страницы из указанного множества, причем связанные метаданные для каждой страницы соответствуют схеме метаданных и предоставляют структурированную информацию, идентифицирующую связь между указанной страницей и одной или более остальными страницами из указанного множества; создание компоновки страниц документа, при этом связанные метаданные по меньшей мере для одной страницы указанной компоновки содержат информацию, идентифицирующую одну или более связей между соответствующей страницей и остальными страницами указанной компоновки, иерархическое отношение между соответствующими страницами; и передачу указанной компоновки. 3 н. и 12 з.п. ф-лы, 23 ил.

Реферат

Область техники

[001] Настоящее изобретение относится в общем к паноптической визуализации документов и, в частности, к паноптической визуализации документов или их компонентов с отражением логических отношений между документами/компонентами согласно их структуре.

Уровень техники

[002] Распечатанная информация по теме часто печатается на многих страницах, потому что она не помещается на одной странице и/или более эффективно представляется посредством многочисленных страниц. Многочисленные страницы могут принадлежать одному и тому же источнику или многочисленным источникам. Например, технические чертежи воздушного судна могут быть распечатаны так, что различные части одной и той же схемы могут быть расположены на разных страницах.

[003] Распечатанная информация может быть также распечатана так, что один документ содержит один уровень детализации объекта, в то время как другой документ содержит другой уровень детализации того же самого объекта. Например, схема воздушного судна может быть распечатана так, чтобы планер этого судна был виден на чертеже. Другая схема того же воздушного судна может быть распечатана так, что воздушное судно скрыто, а интерьер воздушного судна представлен. Таким образом, специалист может использовать различные схемы для изучения различной информации об одном и том же объекте.

[004] В качестве другого примера можно привести схемы систем электропроводки, которые часто распечатываются на многих страницах, потому что графическая и текстовая информация, представленная на схеме электропроводки, слишком большая, чтобы разместить ее на одной странице. Таким образом, специалист может многократно менять документы, чтобы полностью изучить информацию о системе электропроводки.

[005] Документы, такие как технологические схемы, технические чертежи, схемы электропроводки и другие подходящие типы документа могут быть использованы для технического обслуживания воздушного судна. Документы создаются для просмотра в распечатанном виде. Однако такие документы обычно хранятся в электронном виде и рассматриваются на дисплее системы обработки данных. В результате, специалист просматривает различные документы, которые могут находиться на различных типах носителя. Этот тип просмотра может быть более продолжительным, чем это требуется для получения информации о воздушном судне.

[006] Документы, касающиеся сложных систем, таких как воздушное судно, могут, следовательно, содержать большое количество информации, касающейся сложной системы и их компонентов, подсистем и частей, связей и отношений между соответствующими элементами сложной системы. Сложность системы и большое количество информации, часто необходимое для описания системы, могут привести к увеличению не только времени, необходимого для изучения документов, но и к возрастанию трудности в понимании сложной системы и их элементов. Пользователю может потребоваться время не только для обзора документов, содержащих большое количество информации, но может также потребоваться время для преодоления трудности в изучении информации, чтобы понять каким способом сложная система и ее элементы соотносятся друг с другом.

[007] Таким образом, могут быть востребованы способ и устройство, которые учитывают по меньшей мере некоторые из проблем, описанных выше, а возможно и другие проблемы.

Раскрытие изобретения

[008] Иллюстративные варианты осуществления настоящего изобретения в общем относятся к системе компоновки паноптически визуализируемого документа и соответствующему способу, и машиночитаемому запоминающему носителю. В соответствии с иллюстративными вариантами осуществления медиаконтент коллекции документов может быть паноптически упорядочен с отражением логических отношений в контенте, например в соответствии со структурой документа. Упорядочение может предоставить возможность пользователю увидеть контент изолировано и в компоновке, что способствует лучшему пониманию отношений между контентом и объектами или элементами, изображенными посредством контента, которые иначе понять может быть сложно. Применительно к сложной системе, такой как воздушное судно, включающий ряд компонентов, подсистем и частей, упорядочение может не только сократить время, необходимое для обзора документов, содержащих большое количество информации, но может также сократить необходимое время и облегчить изучение информации, чтобы понять схемы, по которым сложная система и ее элементы соотносятся друг с другом. Многие схемы отношений могут выбираться пользователем, когда при их отражении в паноптической компоновке они могут дополнительно способствовать взаимопониманию многих пользователей. Иллюстративные варианты осуществления могут, следовательно, уменьшить проблему и сократить время, необходимое для поиска даже в самом большом массиве информации, содержащимся в некоторых коллекциях документов.

[009] В одном из иллюстративных вариантов осуществления система обеспечивает паноптическую визуализацию документа, имеющего структуру, заданную в соответствии с конкретной схемой, структура которой в одном из примеров может быть отражена в медиаконтенте одной или более страниц документа или зашифрована в этом документе. Система включает в себя синтаксический анализатор документа, связывающее устройство и компоновочный движок. Синтаксический анализатор документа выполнен с возможностью приема и разбора электронного документа на множество составляющих страниц, каждая из которых включает в себя соответствующий медиаконтент. Связывающее устройство выполнено с возможностью связывания страниц, включая возможность предоставления связанных метаданных для каждой страницы множества. Связанные метаданные определяют связь между страницей и одной или более другими страницами множества, и эта связь устанавливает логическое отношение между соответствующими страницами в соответствии со структурой документа. Компоновочный движок, в свою очередь, выполнен с возможностью получения компоновки страниц документа и осуществляет передачу компоновки. В этом смысле компоновка включает в себя паноптическое упорядочение визуальных представлений страниц компоновки в соответствии со связанными метаданными соответствующих страниц.

[0010] Система может также включать поисковый движок, соединенный с компоновочным движком и выполненный с возможностью приема запроса на предоставление медиаконтента и идентификации страницы, включающей запрошенный медиаконтент, с идентифицированной страницей, принадлежащей документу. В этом примере компоновочный движок может быть выполнен с возможностью извлечения страниц документа, включая идентифицированную страницу и другую страницу(ы), идентифицированную в соответствии со связанными метаданными идентифицированной страницы. В этом смысле соответствующие связанные метаданные могут дополнительно включать информацию, идентифицирующую связь(и) между идентифицированной страницей и соответствующей другой страницей(или страниц). Также в этом примере компоновочный движок может быть выполнен с возможностью создания компоновки извлеченных страниц.

[0011] В одном из примеров система может дополнительно включать навигационный движок, соединенный с компоновочным движком и выполненный с возможностью выбора навигационной опции(й) из множества навигационных опций для перемещения визуального представления компоновки. В одном из примеров навигационный движок выполнен с возможностью выбора навигационной опции(й) в соответствии со связанными метаданными страниц компоновки. Навигационный движок может быть также выполнен с возможностью передачи выбранных навигационных опций.

[0012] В одном из примеров связанные метаданные каждой страницы также включают в себя информацию, указывающую размер, местоположение и/или глубину визуального представления соответствующей страницы в компоновке, в соответствии с которой компоновочный движок может быть выполнен для создания этой компоновки. В дополнительном примере каждая из одной или более страниц компоновки может быть в конфигурации, включающей визуальные представления с соответствующими разрешениями страницы, и связанные метаданные могут предоставлять информацию, указывающую по меньшей мере размер визуального представления соответствующей страницы в компоновке. Кроме того, компоновочный движок, выполненный с возможностью создания компоновки, может извлечь каждую из одной или более страниц компоновки для визуального представления с разрешением, которое соответствует размеру, указанному в информации, содержащейся в связанных метаданных. В одном из примеров для каждой из одной или более страниц компоновки связанные метаданные могут предоставлять информацию, указывающую по меньшей мере размер визуального представления соответствующей страницы в компоновке, с указанием размера относительно одной или более других извлеченных страниц.

[0013] В другом из иллюстративных вариантов осуществления предлагается способ и машиночитаемый запоминающий носитель для паноптической визуализации документа. В соответствии с одним из вариантов настоящего изобретения предлагаются машиночитаемый запоминающий носитель, который в предпочтительной модификации имеет машиночитаемые сегменты программного кода, записанные с целью получения электронного документа и его разбора на множество составляющих страниц, каждая из которых включает в себя соответствующий медиаконтент, и документ, имеющий структуру, заданную в соответствии с конкретной схемой.

[0014] Машиночитаемый программный код в предпочтительной модификации также приведет к связыванию страниц, включая предоставление связанных метаданных каждой странице множества. Связанные метаданные в предпочтительной модификации определяют связь между страницей и одной или более другими страницами множества, причем эта связь устанавливает логическое отношение между соответствующими страницами в соответствии со структурой документа. В альтернативной модификации машиночитаемый код приведет к созданию компоновки страниц документа, причем компоновка эта включает паноптическое упорядочение визуальных представлений страниц компоновки в соответствии со связанными метаданными соответствующих страниц, и в предпочтительной модификации передает компоновку. Определенное преимущество обеспечивается тем, что структура документа отражается в медиаконтенте одной или более страниц документа или шифруется в документе.

[0015] В предпочтительной модификации, машиночитаемый запоминающий носитель дополнительно имеет сегменты машиночитаемого программного кода, сохраненные в нем, которые, при исполнении их процессором, приводят к тому, что устройство дополнительно принимает запрос на предоставление медиаконтента и идентифицирует страницу, включающую запрошенный медиаконтент, причем идентифицированная страница принадлежит документу; и извлекает страницы документа, включающие идентифицируемую страницу и одну или более других страниц, идентифицируемых в соответствии со связанными метаданными идентифицируемой страницы, причем соответствующие связанные метаданные дополнительно включают информацию, идентифицирующую одну или более связей между идентифицируемой страницей и соответствующей одной или более остальными страницами, при этом устройство в предпочтительной модификации создает компоновку страниц, включающую создание компоновки извлеченных страниц.

[0016] В альтернативной модификации машиночитаемое хранилище данных дополнительно имеет сегменты машиночитаемого программного кода, сохраненные в нем, которые при исполнении их процессором приводят к тому, что устройство дополнительно выбирает одну или более навигационных опций из множества навигационных опций для перемещения визуального представления компоновки, причем навигационные опции выбираются в соответствии со связанными метаданными страниц компоновки; и для передачи выбранных навигационных опций.

[0017] В предпочтительной модификации связанные метаданные каждой страницы также включают в себя информацию, указывающую одну или более величин из размера, местоположения или глубины визуального представления соответствующей страницы в компоновке, и при этом для каждой из страниц компоновки, устройство создает компоновку в соответствии с одной или более величинами из размера, местоположения или глубины, указанных в информации, содержащейся в связанных метаданных.

[0018] В предпочтительной модификации, машиночитаемое хранилище данных дополнительно имеет сегменты машиночитаемого программного кода, сохраненные в нем, которые порождают визуальное представление одной или более страниц компоновки с соответствующими разрешениями страницы, и связанные метаданные предоставляют информацию, указывающую по меньшей мере размер визуального представления соответствующей страницы в компоновке.

[0019] Определенное преимущество обеспечивается тем, что устройство создает компоновку, включая извлечение страницы для визуального представления с разрешением, которое соответствует размеру, указанному в информации, содержащейся в связанных метаданных. Преимущество также обеспечивается тем, что одна или более страниц компоновки и связанные метаданные предоставляют информацию о размере визуального представления соответствующей страницы в компоновке и размер этот указан относительно другой или более других извлеченных страниц.

[0020] Признаки, функции и преимущества, описанные в данном документе могут быть достигнуты независимо в различных иллюстративных вариантах осуществления или могут сочетаться еще и в других иллюстративных вариантах осуществления, дополнительные сведения о которых можно узнать из следующего описания и чертежей.

Краткое описание чертежей

[0021] Рассмотрев, таким образом, приведенные в качестве примера варианты осуществления изобретения в общем виде, обратимся теперь к прилагаемым чертежам, которые выполнены необязательно в масштабе и среди которых:

[0022] фиг. 1 представляет собой изображение системы паноптической визуализации в соответствии с одним из иллюстративных вариантов осуществления;

[0023] фиг. 2 представляет собой изображение системы коллекции паноптически визуализируемых документов в соответствии с одним из иллюстративных вариантов осуществления;

[0024] фиг. 3 представляет собой изображение системы компоновки паноптически визуализируемого документа в соответствии с одним из иллюстративных вариантов осуществления;

[0025] фиг. 4 представляет собой изображение системы навигации паноптически визуализируемого документа в соответствии с одним из иллюстративных вариантов осуществления;

[0026] фиг. 5-16 представляют собой упрощенные изображения примеров подходящих схем компоновки в соответствии с иллюстративными вариантами осуществления;

[0027] фиг. 17 представляет собой схему последовательности операций, которую можно осуществить посредством системы паноптической визуализации в соответствии с одним из иллюстративных вариантов осуществления; и

[0028] фиг. 18-23 представляют собой изображения иллюстративных компоновок страниц, которые могут быть выведены на дисплей GUI, имеющий предопределенную видимую область и управляемый пользователем в соответствии с иллюстративным вариантом осуществления настоящего изобретения.

Осуществление изобретения

[0029] Некоторые варианты осуществления настоящего изобретения далее описаны полнее со ссылкой на прилагаемые чертежи, в которых показаны не все, а только некоторые варианты осуществления изобретения. Конечно же различные варианты осуществления изобретения могут быть реализованы в различных формах и не носят ограничительный характер для вариантов осуществления, изложенных в данном документе; точнее, эти приведенные в качестве примера варианты осуществления поданы так, чтобы данное изобретение было полным и исчерпывающим и чтобы эти варианты полностью передавали объем изобретения специалистам в данной области техники. Например, если не указано иное, то описание чего-то, следующего первым, вторым и т.д., не следует истолковывать как содержащее конкретный порядок. Также, нечто, описанное как находящееся выше по тексту чего-то другого (если не указано иное), может вместо этого находиться ниже по тексту, и наоборот; и аналогично, нечто, описанное как находящееся слева по тексту от чего-то другого, может вместо этого находиться справа по тексту, и наоборот. Одинаковые ссылочные номера соответствуют одинаковым элементам по всему тексту.

[0030] Варианты осуществления настоящего изобретения, приведенные в качестве примера, относятся в общем к паноптической визуализации документов, а в частности к паноптической визуализации документов или их документных компонентов способом, который отражает логические связи между документами/компонентами согласно их структуре. Варианты осуществления, приведенные в качестве примера, главным образом описаны с привязкой к авиакосмической области применения. Однако следует понимать, что варианты осуществления, приведенные в качестве примера, могут быть использованы и в ряде других областей применения как в авиакосмической промышленности, так и вне ее.

[0031] На фиг. 1 представлена паноптическая система 100 визуализации согласно приведенным в качестве примера вариантам осуществления настоящего изобретения. Система может включать в себя любое количество разных подсистем (каждая подсистема - отдельная система) для осуществления одной или более функции или операций в соответствии одним или более электронными документами. Как показано, например, система может включать в себя систему 102 сбора документов, систему 104 компоновки документа и/или систему 106 навигации по документам. Хотя одна система или более из системы сбора документов, системы компоновки документов и/или системы навигации документов показана как часть паноптической системы визуализации, она может вместо этого находится отдельно от паноптической системы визуализации, но взаимодействовать с ней. Следует также понимать, что одна подсистема или более может функционировать или работать как отдельная система независимо от других подсистем. И еще, следует понимать, что система паноптической визуализации может включать в себя одну дополнительную или альтернативную подсистему или более из тех, что показаны на фиг. 1.

[0032] Как описано в данном документе, электронный документ (или просто документ) может представлять собой любой электронный медиаконтент, допускающий визуализацию в электронной и/или печатной форме. Медиаконтент документа может включать в себя один или более из текстового, графического или другого визуального контента, такого как фотоизображения, видеоизображения или им подобные. Документ может состоять из ряда разнотипных документов, в которых тип документа может быть задан посредством одной характеристики документа или более, такой как его формат, медиаконтент или аналогичной характеристики. Примеры подходящих типов документов включают в себя автоматически спроектированные документы (например, CAD, CATDrawing, CATPart, CATProduct, CATProcess, cgr, DWG, DXF, DWF и т.д.), текстовые документы (например, ANS, ASC, DOC, DOCX, HTML, PDF, RTF, TXT, WPD и т.д.), документы презентаций (например, PDP, РРТ и т.д.), графические документы (например, BMP, GIF, JPEG, JP2, PNG, PSD, PSP, RAW, TIFF и т.д.), видеодокументы (например, AVI, MPEG, QuickTime, WMV и т.д.) или аналогичные им. Другие примеры подходящих типов документов включают в себя отдельные нормативно-правовые документы или их коллекции (например, решения суда, записки по делу, патенты и т.д.), книги, инструкции, журналы или профессиональные издания, статьи, web страницы, скриншоты, бюллетени по техническому обслуживанию, технологические схемы, гарантии, технические чертежи, схемы электропроводки или аналогичные им. Еще примеры подходящих типов документов включают в себя файлы данных, такие как данные по техническому проекту, данные электропроводки, данные диагностики, коммерческие данные или аналогичные им.

[0033] Документ может быть составлен из одного или более составляющих документных компонентов, которые могут представлять собой группы их медиаконтента, например, между основными местами разрыва. Документные компоненты могут зависеть от типа документа и могут включать в себя, например, электронные страницы, слайды, схемы, чертежи, фотоизображения, видеоизображения или аналогичные им. Документный компонент обычно называется "страницей," хотя он необязательно должен быть электронной страницей, поскольку может включать в себя другие типы компонентов. В случаях, когда документ включает в себя только один компонент, документ и его компонент может быть одним и тем же.

[0034] Как описано в настоящем документе, ссылка может быть сделана на документ, образованный из составляющих страниц. Однако следует понимать, что иллюстративные варианты осуществления могут быть в равной степени применены к группе (коллекции) документов, образованных из составляющих документов, которые могут или не могут быть также образованы из составляющих страниц. Таким образом, функции, осуществляемые по отношению к документу, могут быть в равной степени осуществимы по отношению к группе документов, а функции, осуществляемые по отношению к странице, могут быть в равной степени осуществимы по отношению к составляющему документу.

[0035] Каждая страница может быть образована в виде данных, из которых может быть получено ее визуальное представление (вернее сказать ее медиаконтент) в электронном и/или печатном (или печатаемом) виде. Визуальное представление страницы обычно называется просто страницей или "изображением", хотя страница необязательно должна включать в себя фотоизображение, поскольку она может содержать другие типы медиаконтента.

[0036] Страница может включать в себя медиаконтент, который содержит один объект или более, и включать в себя один элемент или более, отражающий, или иначе образующий объект(ы). Следовательно, иногда можно сказать, что страница изображает свой объект(ы) и/или элемент(ы) своего объекта(ов). Например, страница может содержать воздушное судно в качестве ее объекта и включать в себя изображение планера или интерьера или частей изображения планера или интерьера воздушного судна в качестве элемента(ов), или страница может содержать изображение планера или интерьера в качестве ее объекта и включать в себя части изображения планера или интерьера в качестве элементов. В качестве другого примера страница может содержать приборную панель воздушного судна в качестве ее объекта и включает в себя приборы приборной панели в качестве элементов.

[0037] В различных примерах документ может быть структурирован согласно конкретной схеме, а в по меньшей мере отдельных случаях может быть структурирован в иерархическом порядке. Например, книга или инструкция может быть структурирована по главам, каждая из которых включает в себя разделы, параграфы или аналогичные им. В каждой главе, разделе или параграфе книга/инструкция может включать в себя медиаконтент, который, в свою очередь, может включать в себя текстовый, графический или другой визуальный контент, такой как фотоизображения, видеоизображения или аналогичные им. В другом примере журнал или профессиональное издание может быть структурировано по статьям, каждая из которых может включать в себя медиаконтент. В еще одном примере коллекция нормативно-правовых документов может быть структурирована в соответствии с судебным делом, и в этом случае документы могут быть структурированы во временной последовательности согласно их датам.

[0038] Структура документа может быть отражена различными способами. В одном примере структура может быть задана пользователем. В другом примере структура может быть отражена в медиаконтенте одной или более страниц самого документа, например в таблице контентов. В еще одном примере структура может кодироваться в документе, например посредством подходящих закладок, разметки или аналогичных средств. Примеры подходящей разметки включают в себя разметки на основе стандартного языка обобщенной разметки (SGML), включающий язык гипертекстовой разметки (HTML), расширяемый язык разметки (XML), расширяемый HTML (XHTML) или аналогичные им. Схема, по которой документ может быть структурирован, может быть любой из ряда разнообразных схем, таких как определение типа документа (DTD), XML схема, описание структуры документа (DSD), регулярный язык для XML следующего поколения (RELAX NG) или аналогичные им.

[0039] В авиационной промышленности, например, Airlines for Americ (A4A), ранее Air Transport Association of Americ (ATA), выпустила ряд спецификаций, включающих схему структурирования документов по техническому обслуживанию и эксплуатации самолета. ATA iSpec 2200, например, описывает схемы DTD для таких документов, как aircraft illustrated parts catalog (AIPC), aircraft maintenance manual (AMM), aircraft recovery manual (ARM), component maintenance manual (CMM), component maintenance manual parts list (CMMIPL), consumable products manual (CPM), engine (shop) manual (EM), engine cleaning inspection and repair manual (CIR), engine illustrated parts catalog (EIPC), engine parts configuration management section (EPCM), fault reporting and fault isolation manual (FRM/FIM), flight crew operations manual (FCOM), illustrated tool and equipment manual (ITEM), intelligent graphics exchange (IGEXCHANGE), maintenance planning document (MPD), maintenance review board report (MRB), maintenance steering group (MSG-3), master minimum equipment list (MMEL), non-destructive testing manual (NDT), power plant build-up manual (PPBM), power plant build-up manual illustrated parts list (PPBMIPL), production management database (PMDB), service bulletin (SB), service bulletin index (SBI), service description section (SDS), structural repair manual (SRM), system description sections (SDS), tool and equipment manual (ТЕМ), weight and balance manual (WBM), wiring diagram manual (WM) или аналогичные им.

[0040] Обычно, документы и/или их страницы, согласно приведенным в качестве примера вариантам осуществления, могут иметь одно или более логических отношений друг с другом. Далее, согласно последующему более подробному описанию система 102 сбора документов как часть системы 100 паноптической визуализации может быть в основном выполнена с возможностью приема документов и сбора страниц согласно этим логическим отношениям со страницами, собираемыми в качестве коллекции документов для паноптической визуализации (коллекции паноптически визуализируемых документов). Система 104 компоновки документа может быть в общем выполнена с возможностью получения компоновки паноптически упорядоченных, логически связанных страниц коллекции паноптически визуализируемых документов, такой как коллекция, полученная системой сбора документов. Система 106 навигации документа может быть в общем выполнена с возможностью выбора и предоставления навигационной опции(й) для осуществления перемещения визуального представления компоновки паноптически упорядоченных, логически связанных страниц коллекции паноптически визуализируемых документов, такой как компоновка, полученная системой компоновки документа. Визуальное представление компоновки в общем называется просто компоновкой.

[0041] В приведенных в качестве примера вариантах осуществления настоящего изобретения возможен, следовательно, сбор страниц документа(ов) согласно логическим отношениям между страницами, который в одном примере применительно к сложной системе, такой как воздушное судно, может отражать структурные отношения между ее элементами. Страницы могут быть паноптически упорядочены с отражением логических отношений и, в различных примерах, структурных отношений. Упорядочение может предоставить возможность пользователю увидеть страницы по отдельности и в виде, способствующем лучшему пониманию отношений, которые в противном случае могут быть сложными для понимания. Применительно к сложной системе в качестве примера упорядочение может не только сократить время требуемое для обзора документов, содержащих большое количество информации, но может также сократить требуемое время и облегчить изучение информации для понимания того, каким образом сложная система и ее элементы связаны друг с другом.

[0042] На фиг. 2, 3 и 4 представлены более конкретные примеры подходящей системы сбора документа, системы компоновки документа и системы навигации документа, соответственно, согласно вариантам осуществления настоящего изобретения, приведенным в качестве примера.

[0043] На фиг. 2 показана система 200 сбора документов согласно одному варианту осуществления, приведенному в качестве примера. Как показано, система сбора документов может включать в себя синтаксический анализатор 202 документа, выполненный с возможностью приема одного или более электронных документов и разбора их на множество составляющих страниц (документных компонентов), каждая из которых включает в себя соответствующий медиаконтент. Документы в одном примере могут разбираться в соответствии с типом документов (например, автоматически спроектированные документы, документы презентаций, графические документы, видеодокументы, нормативно-правовые документы, книги, статьи, веб-страницы, технологические схемы, технические чертежи, схемы электропроводки и т.д.). Следовательно, синтаксический анализатор документов может быть также выполнен с возможностью определения типа документов, например, на основе формата документов, бизнес-правил или посредством пользовательских данных.

[0044] Система 200 сбора документов может также включать в себя связывающее устройство 204, соединенное с синтаксическим анализатором 202 документа и выполненное с возможностью связывания страниц. В этом смысле связывание страниц может включать в себя (для каждого из одной или более страниц множества) связывающее устройство, выполненное с возможностью идентификации одной или более связей между страницей и одной или более другими страницами множества. Связь(и) в одном примере может идентифицироваться в соответствии с документами, типом документов и/или медиаконтентом страницы и другой страницы (или страниц). В более конкретном примере связь(и) может идентифицироваться в соответствии со структурой документа, которую, как указано выше, можно задать в соответствии с конкретной схемой. Еще в одном примере связь(и) можно задать разными способами, например в соответствии с одним или более бизнес-правилами, логической схемой или аналогичными способами. Эта связь(и) может установить одно или более логических отношений между страницей и другой страницей(ами).

[0045] В одном примере связь может быть идентифицирована между страницами, входящими в общий документ (составляющие одного и того же документа). В одном примере связь может быть идентифицирована между страницами, смежными друг к другу в предопределенной последовательности, такой как временная последовательность, пространственная последовательность или порядковая последовательность в общем документе или коллекции документов. В ряде случаев связь может быть идентифицирована в соответствии с объектом(ами) или элементом(ами) страниц. Например, связь может быть идентифицирована между страницами, имеющими общий объект или общий элемент. В одном примере связь может быть идентифицирована между страницами, среди которых элемент одной (страницы) является объектом другой (элемент-объект) или среди которых объект одной (страницы) является элементом другой (объект-элемент).

[0046] В одном примере связь может быть идентифицирована между страницами, связанными отношением родитель-потомок прямо или косвенно посредством потомков, имеющих общего родителя. В одном примере связь может быть идентифицирована между страницами в случаях, в которых одна из страниц включает в себя ссылку на другую страницу или связь с ней в своем медиаконтенте. В этом смысле решение суда может включать в себя ссылку на другое решение суда (например, в теле решения суда, или в сноске, примечании или аналогичном элементе), или страница может включать в себя гиперссылку на другую страницу. И в еще одном примере связь может быть идентифицирована между страницами посредством пользовательских данных, указывающих связь между страницами.

[0047] В более конкретном примере связь(и) может быть идентифицирована в соответствии со структурой документа. Структура документа может показывать связь между страницами, принадлежащими к общему документу (составляющие того же документа). Структура документа может также показывать связь(и) между страницами, находящимися в отношении родитель-потомок прямо или косвенно посредством потомков, имеющих общего родителя. Структура книги/инструкции может показывать связь между их страницами, а также связь(и) между страницами соответствующих глав. Далее, структура книги/инструкции может показывать связь(и) между страницами соответствующих разделов, параграфов или аналогичных частей. Эта связь(и), полученная посредством структуры, может быть определена в дополнение или вместо других связей, которые могут быть идентифицированы, например любым из предложенных выше способов.

[0048] В дополнение к идентификации связи(ей) между страницами связывающее устройство 204 может быть также выполнено с возможностью извлечения, создания или другого предоставления каждой из одной или более страниц и метаданных, связанных с этой страницей. Метаданные, связанные со страницей, могут предоставить любое количество разных единиц информации об этой странице. Например, метаданные, связанные со страницей, могут предоставить информацию, определяющую связь(и) между этой страницей и другой страницей(ами). Эта информация может включать в себя наименования или другие идентификаторы другой страницы(или страниц), связанной с этой страницей, и может также включать указание на логическое отношение(я,) установленное посредством связи(ей) между ними (например, наличие общего документа, объект и/или элемент, смежность, элемент-объект объект-элемент, родитель-потомок, ссылка/связь, указанное пользователем и т.д.).

[0049] В дополнение к связи(ям) связанные метаданные страницы могут включать в себя одну или более других единиц информации о странице. Например, метаданные могут предоставлять информацию о документе или типе документа, для которого страница является составляющей. Информация, относящаяся к документу, может включать в себя наименование или другой идентификатор документа, и/или автора, размер, и/или время создания или последней модификации документа. Метаданные могут предоставлять информацию, относящуюся к структуре документа и/или схеме, в соответствии с которой документ структурирован. Также, например, метаданные могут предоставлять информацию об одном или более контентных ограничениях, которые применяются или должны быть применены к странице, таких как запрет доступа, запрет редактирования или модификации и/или шифрование страницы.

[0050] Метаданные могут также предоставлять информацию о медиаконтенте страницы. Эта информация может включать в себя, например, идентификацию объекта(ов) страницы и/или элемента(ов), сегмента страницы, включающей один из элементов или более, и/или уровень детализации одного из элементов на странице или более. В ряде случаев связь между страницами, имеющими общий объект, элемент или находящиеся в отношении элемент-объект или объект-элемент, может быть выведено из метаданных, определяющих соответствующий объект(ы) и/или элемент(ы) документов. В этих случаях описание объекта(ов) и/или элемента(ов) страницы может быть достаточным для информации, идентифицирующей соответствующую связь(и) между страницами.

[0051] В одном примере связывание страниц может дополнительно включать связывающее устройство 204, выполненное с возможностью идентификации одной или более схем компоновки по меньшей мере некоторых страниц. В этом примере связанные метаданные, извлеченные, созданные или другим способом предоставленные связывающим устройством для некоторой страницы, могут дополнительно включать информацию, указывающую компоновку соответствующей страницы в каждой из одной или более схем компоновки. Для соответствующей схемы компоновки они могут включать в себя, например, указание размера, местоположения и/или глубины (z-порядка) страницы (или конкретнее ее визуальное представление). Схема(ы) компоновки может быть идентифицирована и размер, местоположение и/или глубина могут быть указаны любым способом, например, в соответствии с одним или более бизнес-правилами, логической схемой или аналогичными способами.

[0052] Примеры подходящих схем компоновки (иногда называемых стилями п