Создание политики управления доступом на основе предпочтений конфиденциальности клиента

Иллюстрации

Показать все

Изобретение относится к созданию политики управления доступом и конфигурированию системы управления доступом с помощью политики управления доступом. Техническим результатом является повышение точности определения набора документов, к которым применяется политика доступа. Система для формирования политики управления доступом содержит пользовательский интерфейс (1) для предоставления пользователю возможности указывать тему (10) и набор разрешений (15), анализатор (2) документов, подсистему (3) ассоциации, средство (5) поиска свойств и средство (6) выбора документов. Анализатор (2) документов анализирует содержимое множества документов (11), чтобы найти набор документов (13), имеющих отношение к теме (10). Средство (5) поиска свойств анализирует содержимое документов (11), чтобы найти отличительное свойство (12) документов, имеющих отношение к теме (10). Средство (6) выбора документов выбирает набор документов (13), основываясь на отличительном свойстве (12). Подсистема (3) ассоциации ассоциирует набор разрешений (15) с набором документов (13), чтобы получить политику (4) управления доступом. 4 н. и 8 з.п. ф-лы, 5 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение имеет отношение к созданию политики управления доступом. Кроме того, настоящее изобретение имеет отношение к конфигурированию системы управления доступом с помощью политики управления доступом.

УРОВЕНЬ ТЕХНИКИ

Электронные медицинские записи, а также электронные персональные медицинские записи все чаще используются, чтобы заменить записи на бумаге в профессиональной медицине и при оказании медицинской помощи на дому.

Информированное согласие является очень важным процессом в профессиональном здравоохранении, в котором пациент принимает некоторые решения в отношении, в частности, использования его данных о здоровье медицинскими работниками. Во многих странах пациент имеет законные права скрывать или ограничивать доступ к определенным частям его электронных медицинских записей. Например, пациент может ограничить доступ к документам, касающимся психического здоровья или злоупотребления наркотиками, так, чтобы только психиатр пациента имел доступ к этим документам. В еще одном примере, такой ограниченный доступ препятствует тому, чтобы другие имели доступ к записям пациента, имеющим отношение к СПИДу. Различные механизмы безопасности были разработаны, чтобы технологически способствовать этому праву, такие как использование запечатанных конвертов в системе Spine NHS в Великобритании или аналогичного механизма в системе NICTIZ в Нидерландах.

В сфере личных медицинских записей пациент несет полную ответственность за определение, кто имеет доступ к его записям. Очень часто пациент желает реализовать очень сложные политики, особенно в том случае, если пациент желает предоставить доступ определенным медицинским работникам, семье или друзьям. В некоторых случаях пациент может пожелать заблокировать их от возможности получить доступ к определенным частям его записей.

HL-7, IHE и HITSP стандартизируют взаимодействия, связанные с согласием пациента, а также форматы, в которых согласие может быть задано. HL-7 определяет директиву согласия CDA R2, в то время как IHE разработал профиль основных положений конфиденциальности согласия пациента. Рабочая группа предпочтений конфиденциальности HITSP собрала требования, имеющие отношение к предпочтениям конфиденциальности пациента в отношении медицинских записей. HL-7 также стандартизировала словари, используемые для управления доступом, такие как объектный словарь, который описывает отличающиеся типы данных электронных медицинских записей. Эти типы данных используются системой управления доступом, которая назначает разрешения/ограничения для разных пользователей в отношении этих типов данных.

"Patient-centric authorization framework for sharing electronic health records", Jing Jin и др., SACMAT'09, 3-5 июня, 2009, Стреза, Италия, раскрывает потребность в безопасном, удобном и простом механизме, который позволяет пользователям быстро и легко авторизировать различные медицинские филиалы для получения доступа к их критически важным записям или подгруппе данных в них. В статье раскрыта модель, в которой семантика и структурный состав документов EHR формулируется в виде иерархической структуры, где внутренние вложенные объекты отмечены и ассоциированы со свойствами, чтобы адресовать важные критерии для совместного использования медицинских данных, таких как типы данных, намеченные цели и информация критической важности. И отдельные примеры EHR, и агрегированная виртуальная составная EHR одинаково моделируются в виде маркированной иерархической структуры. Соответствующие свойства распределяются по категориям в трех аспектах: источник, критическая важность и тип объекта.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

Было бы полезно иметь улучшенную систему для создания политики управления доступом. Для более эффективного решения этой задачи первый аспект настоящего изобретения предоставляет систему, содержащую

пользовательский интерфейс для предоставления пользователю возможности указывать тему и набор разрешений;

анализатор документов для анализа содержимого множества документов, чтобы найти набор документов, имеющих отношение к теме; и

подсистему ассоциации для ассоциации набора разрешений с набором документов, чтобы получить политику управления доступом.

Поскольку система принимает во внимание содержимое множества документов, система имеет возможность более точного определения набора документов, к которым пользователь намеревается применить набор разрешений. Это может обеспечить лучший результат, чем подход, который принимает во внимание только структуру или глобальную классификацию документов или записей. Пользователь может быть более уверенным, что тема хорошо преобразуется в набор документов, которые относятся к этой теме. Кроме того, становится легче для пользователя создавать детальную политику управления доступом, потому что пользователь меньше связан с любой иерархической структурой, в которой хранятся документы, и, таким образом, пользователю необходимо менее подробно знать структуру информационной системы.

Анализатор документов может содержать средство поиска свойств для анализа содержимого множества документов, чтобы найти, по меньшей мере, одно отличительное свойство документов, имеющих отношение к теме. Анализатор документов может дополнительно содержать средство выбора документов для выбора набора документов, основываясь на отличительном свойстве. Средство поиска свойств помогает улучшить выбор соответствующих документов. Найдя отличительное свойство документов, относящихся к теме, становится возможным выбрать набор документов посредством поиска документов, имеющих это свойство. Посредством анализа содержимого документов, чтобы найти отличительное свойство, нет необходимости определять все возможные свойства всех возможных тем заранее, что было бы трудоемкой и способствующей ошибкам работой. Кроме того, средство поиска свойств может дать более надежные результаты в среде, где темы и свойства документов, относящиеся к ней, подвергаются изменениям. Более того, во многих случаях невозможно определить общий шаблон для конкретной темы, так как каждый экземпляр записи может отличаться. Например, может быть проблематичным заранее идентифицировать все возможные типы данных электронной медицинской записи, в которой информация о СПИДе в случае конкретного пациента, больного СПИДом, может быть сохранена. Поэтому решение, которое может найти их во время работы, является предпочтительным.

Анализатор документов может содержать средство предварительного выбора для выбора множества документов, которые анализируются посредством средства поиска свойств, основываясь на теме. Это помогает определить это множество документов. Например, средство предварительного выбора документов выбирает множество документов, имеющих отношение к теме. Такой выбор может быть выполнен посредством сравнения типа документа с темой, либо посредством анализа содержимого документов и выбора документов, содержимое которых содержит одно или более слов, имеющих отношение к теме.

Анализатор документов может содержать средство выбора типа данных для выбора, по меньшей мере, одного типа данных, основываясь на теме. Средство предварительного выбора документов может быть выполнено с возможностью выбора множества документов выбранного типа данных. Это эффективный способ найти множество документов, которые применимы, чтобы найти, по меньшей мере, одно отличительное свойство.

Пользовательский интерфейс может быть выполнен с возможностью предоставления пользователю возможности адаптировать набор документов, найденных посредством анализатора документов, чтобы получить адаптированный набор документов, при этом подсистема ассоциации выполнена с возможностью ассоциировать политику управления доступом с адаптированным набором документов. Это позволяет системе принимать во внимание точную настройку выбора, сделанного пользователем. Система может быть выполнена с возможностью, основываясь на сделанном пользователем выборе, получать дополнительные отличительные свойства и повторно искать эти отличительные свойства на основе методов машинного обучения для улучшения будущего использования системы.

Пользовательский интерфейс может быть выполнен с возможностью предоставлять пользователю возможность внести изменения, по меньшей мере, в одно отличительное свойство, найденное посредством средства поиска свойств, при этом средство выбора документов выполнено с возможностью выбора набора документов, основываясь на модифицированном отличительном свойстве. Это предоставляет пользователю возможность уточнить свойства, используемые для выбора документов, с которыми пользователь не согласен, например, чтобы откорректировать свойство, найденное посредством средства поиска. Такие изменения могут быть использованы для улучшения алгоритмов, используемых в средстве поиска, при будущем использовании, используя метод машинного обучения, например.

Изменение может содержать удаление одного или более отличительных свойств, по меньшей мере, одного отличительного свойства. Например, если пользователь предполагает, что одно из свойств не имеет отношения к нему, пользователь может просто удалить это свойство так, чтобы удаленное свойство не использовалось в это время для выбора документов.

Тема может содержать ключевое слово. Это позволяет анализатору документов использовать методы соответствия строк, чтобы найти тему, если ключевое слово встречается в документе. В качестве альтернативы, тема может быть представлена посредством, например, иконки, которая может быть отображена на экране, предоставляя возможность пользователю выбрать одно из множества графических представлений тем, например. Внутри тема может быть представлена посредством ключевого слова в системе. Тема может быть также представлена посредством совокупности ключевых слов, например слов, которые являются синонимами, или слов, которые семантически тесно связаны друг с другом. Тема также может содержать тип документа.

Анализатор документов может быть выполнен с возможностью поиска ключевого слова в содержимом документов. Это способствует эффективной реализации анализатора документов.

Анализатор документов может быть выполнен с возможностью находить дополнительные ключевые слова, основываясь на содержимом документов, содержащих ключевые слова, и выбирать набор документов, основываясь на дополнительных ключевых словах. Это нахождение дополнительных ключевых слов может быть основано на анализе частоты или на другой информации и/или методах обработки естественного языка, чтобы найти дополнительные ключевые слова, которые имеют отношение к ключевым словам, изначально указанным пользователем.

По меньшей мере, одно отличительное свойство может содержать тип данных или ключевое слово. Эти два вида свойств являются весьма подходящими для реализации тщательного и/или эффективного процесса выбора.

Средство поиска свойств может быть выполнено с возможностью применения обработки естественного языка и/или способа поиска информации по содержимому множества документов. Такие методы, в сущности известные в данной области техники, могут быть применены, чтобы успешно найти отличительное свойство.

Система может содержать подсистему управления доступом, выполненную с возможностью быть сконфигурированной посредством политики управления доступом, полученной посредством подсистемы ассоциации. Подсистема управления доступом, сконфигурированная с помощью политики контроля доступа, может осуществлять управление доступом, следуя желаниям пользователя.

В еще одном аспекте изобретение предоставляет рабочую станцию, содержащую систему, описанную выше.

В еще одном аспекте изобретение предоставляет способ создания политики управления доступом, содержащий этапы, на которых

создают политику управления доступом, включающую в себя предоставление пользователю возможности указывать тему и набор разрешений;

анализируют содержимое множества документов, чтобы найти набор документов, имеющих отношение к теме; и

ассоциируют набор разрешений с набором документов, чтобы получить политику управления доступом.

В еще одном аспекте изобретение предоставляет компьютерный программный продукт, содержащий инструкции, предписывающие процессорной системе выполнять способ, описанный выше.

Специалистам в данной области техники будет понятно, что два или более вариантов осуществления, реализаций и/или аспектов настоящего изобретения могут быть комбинированы любым подходящим способом.

Модификации и разновидности, рабочей станции, системы, способа и/или компьютерного программного продукта, которые соответствуют описанным модификациям и разновидностям системы, могут быть осуществлены специалистом в данной области техники на основе настоящего описания.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Эти и/или другие аспекты изобретения очевидны и будут объяснены со ссылкой на варианты осуществления, описанные ниже. На чертежах:

фиг.1 - блок-схема системы для создания политики управления доступом посредством системы управления доступом;

фиг.2 - блок-схема еще одной системы для создания политики управления доступом посредством системы управления доступом;

фиг.3 - блок-схема последовательности операций способа создания политики управления доступом;

фиг.4 - блок-схема системы управления доступом, включающей в себя систему для создания политики управления доступом; и

фиг.5 - схематичное изображение пользовательского интерфейса для создания политики управления доступом.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

Способы поиска информации могут быть основаны на статистике терминов в сборнике текстовых документов, то есть, используя количество вхождений термина в документе (частота термина) и/или в совокупности (частота в сборнике), и количестве документов, содержащих термин. Это объяснено в "Baeza-Yates, R., и Ribeiro-Neto, B. (1999). Modern Information Retrieval. Эссекс, Великобритания: ACM Press (далее: Baeza-Yates и др.)". Кроме того, поиск информации, такой статистической информации, наряду с доступными онтологиями, может быть полезным, помогая пользователю определять различные свойства, относящиеся к сбору данных, о которых идет речь.

Клиенты/пациенты обычно имеют предпочтения конфиденциальности с очень высоким уровнем и не знакомы со структурой электронных медицинских записей (EHR) и объектными словарями, используемыми системой EHR, такой как система HL-7, описанная выше. Они испытывают трудности в определении их политик конфиденциальности и разрешений, так как существует большое расхождение между их предпочтениями, с одной стороны, и словарями, используемыми в системах управления доступом, с другой стороны. Таким образом, существует необходимость преобразования их предпочтений высокого уровня в машиночитаемые политики, которые ограничивают использование их медицинских данных, с помощью хорошо управляемого, детального метода.

Например, пациент/клиент может пожелать настроить его предпочтения для его личной медицинской записи (PHR), импортируемой из электронной медицинской записи из его госпиталя. Например, предположим, что он хочет совместно использовать его записи с несколькими пользователями, но хочет скрыть некоторую информацию, такую, как тот факт, что он имел определенное заболевание (например, психическое расстройство, наркомания или СПИД). Он не хочет пересматривать все свои записи в базе данных одну за другой и исключать и/или задавать разрешения для каждого экземпляра своей записи в базе данных, которые содержат критически важную информацию. Не достаточно исключить конкретные типы данных, так как пациент/клиент не может предусмотреть все типы данных и записей, которые могут содержать критически важную информацию. Вместо этого пациент хочет донести до системы IT в очень простой форме, что он хочет скрыть все записи, относящиеся к критически важной информации, например все записи, из которых третье лицо могло бы понять, что у пациента/клиента СПИД. Пациент/клиент хотел бы, чтобы система преобразовала эту высокоуровневую политику (например, ключевое слово "СПИД") в машиночитаемую политику управления доступом, которая определяет разрешения или ограничения на уровне экземпляров типов данных (объектов), заданных посредством, например, словаря HL-7. Политика управления доступом, сформированная посредством системы, может быть определена на уровне типов данных. Однако она также может быть определена на уровне экземпляров объектов данных, например, указывая разрешения для отдельных документов. Например, электронная медицинская запись может содержать, среди других типов данных, также тип данных "предписание назначения", и электронная медицинская запись может иметь несколько экземпляров этого типа данных. Возможно, что только один экземпляр типа "предписание назначения" содержит критически важную информацию, например информацию, имеющую отношение к СПИДу. Только этот конкретный экземпляр типа "предписание назначения" ассоциируется с отдельными разрешениями, имеющими отношение к СПИДу. Другие экземпляры типа "предписание назначения" могут быть ассоциированы с набором разрешений, применимых в целом к экземплярам типа "предписание назначения".

Система и способ, раскрытые в этом описании, могут быть использованы, чтобы преобразовать вводимую клиентом/пациентом информацию (предпочтение конфиденциальности) в машиночитаемую политику управления доступом. Вводимая клиентом информация, т.е. предпочтения конфиденциальности, может быть в виде набора записей (идентификатор пользователя, разрешение, ключевое слово). Например, набор записей (Доктор Джон Смит, Чтение, СПИД) будет означать, что доктор Джон Смит может читать записи клиента, имеющие отношение к СПИДу. Машиночитаемая политика может быть в виде набора записей (идентификатор пользователя, разрешение, идентификатор объекта данных). Последняя запись может указывать объект данных, к которому пользователь имеет конкретное разрешение. Методы, раскрытые в этом описании, могут быть использованы, чтобы преобразовывать ключевое слово или тему, указанные пациентом, в набор объектов в электронной медицинской записи, которые содержат информацию, относящуюся к ключевым словам.

Фиг.1 иллюстрирует аспекты системы для формирования политики управления доступом. Прямоугольниками (например, 1) обозначены функциональные блоки системы. Параллелограммы (например, 10) представляют элементы данных. Стрелки указывают потоки информации между функциональными блоками. Разделение функциональности между функциональными блоками представлено только в качестве примера. Система может быть реализована, по меньшей мере, частично на компьютерной системе. Такая компьютерная система может быть реализована в виде отдельной рабочей станции, которая имеет предпочтительный доступ к оперативной базе данных. Система также может быть реализована на сервере и может быть предоставлена посредством веб-интерфейса или пользовательского интерфейса на основе клиент-сервер. Другие реализации также возможны. Общие элементы компьютерной системы, такие как жесткий диск, клавиатура, дисплей, коммуникационный порт и тому подобные, известны специалистам в данной области техники и не будут описаны здесь более подробно.

Система может содержать пользовательский интерфейс 1 для предоставления возможности одному или более пользователям взаимодействовать с системой. Этот интерфейс может быть основан на технологии веб или реализован другим подходящим способом. Пользовательский интерфейс может иметь много других элементов пользовательского интерфейса и обеспечивать другие функциональные возможности, которые не описаны в данном описании. В данном описании описываются только те элементы пользовательского интерфейса, которые необходимы для правильного понимания методов, раскрытых в этом описании. Пользовательский интерфейс 1 может быть выполнен с возможностью предоставления пользователю возможности указывать тему 10 и набор 15 разрешений. Например, пользовательский интерфейс может отображать список тем в виде текстового или графического представления (иконок), представляющего различные темы, которые могут быть объектом управления доступом, и предоставлять пользователю возможность выбирать одну или несколько тем посредством прикосновения или нажатия на текстовое или графическое представление. В качестве альтернативы, пользователю может быть представлено текстовое поле, в котором пользователю предоставляется возможность ввести текстовое выражение, например, одно или несколько ключевых слов или, например, фраз. Тема 10 или темы, полученные таким образом, могут быть сохранены во временной памяти и/или переданы через сеть к компьютерной системе, содержащей анализатор 2 документов. Набор 15 разрешений доступа может быть указан пользователем таким же образом, например, посредством предоставления пользователю возможности выбрать один набор разрешений из списка представлений наборов разрешений. В качестве альтернативы, пользователю может быть представлен список отдельных разрешений и предоставлена возможность выбрать одно или несколько разрешений, показанных для включения или исключения из набора разрешений. В качестве альтернативы, пользователю может быть предоставлена возможность вводить набор разрешений в текстовой форме. Примеры разрешений: разрешения на чтение, запись, изменение, создание, удаление, печать или пересылку. Пользовательский интерфейс 1 дополнительно может быть выполнен с возможностью предоставления пользователю возможности указывать, по меньшей мере, одного пользователя 16, к которому набор 15 разрешений должен быть применен. Например, упомянутый, по меньшей мере, один пользователь 16 может быть отдельным пользователем, множеством конкретно указанных пользователей или группой пользователей. Такая группа пользователей может быть определена по их роли или по организации, например. Пользовательский интерфейс 1 дополнительно может быть выполнен с возможностью предоставлять пользователю возможность задавать множество пар, каждая пара ассоциирует набор 15 разрешений, по меньшей мере, с одним пользователем 16. Эти разрешения и пары, заданные пользователем, затем могут быть ассоциированы с набором выбранных документов, как будет описано ниже.

Система может дополнительно включать в себя анализатор 2 документов для анализа содержания множества 11 документов, чтобы найти набор 13 документов, имеющих отношение к теме 10. Например, может быть осуществлен поиск ключевого слова в документах, и все документы, содержащие ключевое слово могут быть включены в набор 13 документов. Множество 11 документов может состоять из всех документов в электронной медицинской записи, хранящейся в базе 14 данных пациентов. Однако также возможно, чтобы содержимое только подмножества документов в электронной медицинской записи анализировалось. Анализатор документов может выполнять свою задачу несколькими методами, которые будут пояснены ниже.

Система может дополнительно включать в себя подсистему 3 ассоциации для ассоциации набора 15 разрешений с набором 13 документов. Кроме того, по меньшей мере, один пользователь 16, которому набор 15 разрешений предоставляется, может быть ассоциирован с набором 15 разрешений. Таким образом формируется политика 4 управления доступом. Политика 4 управления доступом может содержать набор записей (UID, P, OID)=(ID пользователя, разрешения, ID объекта). Такой набор записей указывает, что пользователь, идентифицированный посредством UID, получил разрешение P в отношении объекта (например, документа или экземпляра типа документа), идентифицированного посредством OID. Например, копия набора 15 разрешений для каждого пользователя 16 или группы пользователей сохраняется в виде набора атрибутов с каждым документом в наборе 13 документов, чтобы сформировать политику 4 управления доступом. В качестве альтернативы сформированные наборы записей (UID, P, OID) могут быть сохранены как политика 4 управления доступом, например, в виде матрицы контроля доступа, набора логических правил или в формате XACML. Такие форматы, в которых политика 4 управления доступом может быть представлена и/или сохранена, в сущности, известны специалистам в этой области техники. Набор 13 документов также может быть зашифрован посредством подсистемы 3 ассоциации, если набор разрешений так предписывает.

Анализатор 2 документов может содержать средство 8 выбора типов данных для выбора, по меньшей мере, одного типа данных, основываясь на теме 10. Этот средство 8 выбора типов данных может быть объединено с пользовательским интерфейсом 1, например, в варианте осуществления, в котором пользовательский интерфейс 1 отображает список типов данных, из которого пользователь может выбрать. В качестве альтернативы пользователю может быть предоставлена возможность указать тему 10, которая преобразуется посредством средства 8 выбора типов данных в один или более соответствующих типов данных. Этот этап преобразования может быть основан на информации, хранящейся в онтологии, такой как SNOMED. Это преобразование или приведение в соответствие может быть достигнуто непосредственно или через этап морфологического поиска (известный, например, из Baeza-Yates и др., с. 168), чтобы лучше обрабатывать введенное без ограничений ключевое слово, т.е. путем сопоставления только основы слова вместо всего введенного без ограничений ключевого слова. Соответствие может быть приведено, например, с помощью существующей онтологии (например, соответствующей кодам SNOMED) и/или используя базу данных, содержащую все типы данных, выбранные другими клиентами, используя то же ключевое слово. Средство 8 выбора типа данных также может быть выполнено с возможностью поиска документов, содержащих ключевое слово, и выбора типов документов из документов, содержащих ключевое слово. Пользовательский интерфейс 1 может быть выполнен с возможностью отображения автоматически выбранных типов данных вместе с примером документа этого типа данных, чтобы предоставить пользователю возможность выбирать (отменять выбор) типы данных для дальнейшей обработки.

Анализатор 2 документов может дополнительно содержать средство 7 предварительного выбора документов для выбора, основываясь на теме 10, множества 11 документов, которые анализируются посредством средства 5 поиска свойств. Например, средство 7 предварительного выбора документов может быть выполнено с возможностью выполнять поиск по ключевому слову одного или более ключевых слов, имеющих отношение к теме 10. Например, сама тема 10 может быть представлена посредством ключевого слова, а средство 7 предварительного выбора документов может быть выполнено с возможностью находить документы, которые содержат это слово. Кроме того, дополнительные ключевые слова могут быть найдены, используя онтологию, и документы, содержащие эти дополнительные ключевые слова, также могут быть включены в это множество документов.

В случае если система содержит средство 8 выбора типов данных, средство 7 предварительного выбора документов может быть выполнено с возможностью выбора множества 11 документов с выбранными типами данных.

Анализатор 2 документов может содержать средство 5 поиска свойств для анализа содержимого множества 11 документов, чтобы найти, по меньшей мере, одно отличительное свойство 12 документов, имеющее отношение к теме 10. Таким отличительным свойством 12 может быть присутствие конкретного ключевого слова в содержимом и/или метаданных документа. Поскольку множество 11 документов, сформированное посредством средства 7 предварительного выбора документов, имеют, по меньшей мере, некоторое содержимое, имеющее отношение к данной теме 10, то можно извлечь из этого содержимого свойства документов, имеющие отношение к теме 10. Например, СПИД имеет отношение к некоторым конкретным препаратам, например, ламивудин, этравирин, типранавир и/или энфувиртид. Поскольку эти термины могут встречаться во множестве 11 документов, система может сделать вывод, что документы, содержащие термины ламивудин, этравирин, типранавир и/или энфувиртид, имеют отличительное свойство документов, имеющих отношение к СПИДу, потому что третье лицо может сделать вывод, что у пациента заболевание, имеющее отношение к СПИДу, если он знает, что эти препараты предписаны.

Такое соотношение между заболеванием и соответствующими препаратами может быть уже включено в онтологию, а если нет, такое соотношение может быть получено из множества 11 документов, и будет несколько документов, в которых диагноз заболевания связан с предписанными препаратами. Следовательно, система может узнать такие ассоциации из документов. В целом, это может быть сделано, используя характерные лексические и информационно-поисковые алгоритмы.

Поиск синонимов ключевого слова. Синонимы могут быть найдены в словаре общего применения, а также в конкретном медицинском словаре, который охватывает медицинскую терминологию. Каждому синониму может быть присвоен номер, представляющий его релевантность по отношению к теме, указанной клиентом.

Поиск наиболее часто используемых терминов во множестве 11 документов, выбранном посредством средства 7 предварительного выбора документов. Наиболее часто используемые термины могут быть выбраны с помощью способа поиска информации, основываясь, например, на частоте термина в документе и/или обратной частоте документа. Например, ряд документов, содержащих термин, например, такой как tf.idf, BM25, языковые модели, см. Baeza-Yates и др., глава 2: Моделирование. Кроме того, информация о близости термина (фраз) может быть использована для оценки релевантности терминов для пользователя, используя методики, известные, например, из "Term Proximity Scoring for Keyword-Based Retrieval Systems", Rasofolo, Y. и Savoy, J., Advances in Information Retrieval (2003). В результате этой стадии список ключевых слов (и/или фраз) с ассоциированной вероятностью релевантности может быть определен.

Повторная оценка верхних k наиболее релевантных терминов, используя релевантный словарь, например медицинский словарь, который содержит основанный на медицинской базе данных список стоп-слов и статистическое распределение медицинского термина. Этот этап полезен, поскольку распределение термина в медицинских отчетах может существенно отклоняться по сравнению с общим распределением термина. В результате, новая оценка релевантности для верхних k терминов может быть определена. Возможно продолжать только c l терминами с наиболее высокой релевантностью, при этом l<k.

Параметры k и l, упомянутые выше, могут быть заданы администратором, клиентом или определены эмпирически, например.

Пользовательский интерфейс 1 может быть выполнен с возможностью отображения списка дополнительных ключевых слов и предоставления пользователю возможности выбрать те, которые он хотел бы включить во вторичный поиск. В необязательном порядке релевантность каждого термина должна быть отображена. В качестве альтернативы, выбор дополнительных ключевых слов выполняется автоматически, и ключевые слова перенаправляются к средству 6 выбора документов без взаимодействия с пользователем.

Отличительные свойства, кроме наличия ключевых слов, также могут поддерживаться, например, могут быть сформированы более сложные логические выражения, включающие в себя одно или нескольких ключевых слов (например, наличие ключевого слова А, но не ключевого слова B), или свойства, имеющие отношение к метаданным или атрибутам документов. По меньшей мере, одно отличительное свойство 12 также может включать в себя тип данных. Средство 5 поиска свойств может быть выполнено с возможностью применения обработки естественного языка и/или способа поиска информации к содержимому множества 11 документов.

Анализатор 2 документов может дополнительно содержать средство 6 выбора документов для выбора набора 13 документов, основываясь на отличительном свойстве 12. В случае если в отличительном свойстве 12 присутствует ключевое слово, поиск по ключевому слову может быть выполнен по всем документам в электронной медицинской записи. В случае логического выражения, это логическое выражение может быть проанализировано во всех документах в электронной медицинской записи.

Средство 6 выбора документов может быть выполнено с возможностью выполнения дополнительного поиска документов, основываясь на отличительном свойстве, например выбранных ключевых словах, в виде расширения запроса (см., например, "Query Expansion", Efthimiadis, E. N., 1996, in: Annual Review of Information Systems and Technology (ARIST)). Этот дополнительный поиск может быть выполнен, используя способ поиска информации, который может быть таким же или аналогичным тому, который использовался на предыдущем этапе. Однако в этом случае законченные записи могут быть проанализированы на основе выбранных ключевых слов, используя способ поиска информации.

Первые, верхние m записей, которые наиболее релевантны выбранным ключевым словам, могут быть идентифицированы (при этом оценивается степень релевантности). Эти записи могут быть ранжированы в порядке убывания в соответствии с релевантностью и, в необязательном порядке, представлены пользователю для выбора. После этого релевантность записей может быть агрегирована, основываясь на их ассоциации с типами данных. Список верхних n типов данных может быть представлен пользователю в порядке убывания. Как и на предыдущем этапе, выбор m и n может быть либо определен эмпирически, либо предварительно выбран пользователем. Пользователю может быть предоставлена возможность выбрать, какие типы данных и/или записи он также хотел бы добавить к набору ограниченных типов данных. При выборе типа данных автоматический выбор записей, принадлежащих к этому типу данных, может быть реализован, например.

Пользовательский интерфейс 1 может быть выполнен с возможностью отображения множества 13 документов, найденных посредством анализатора 2 документов. Пользовательский интерфейс дополнительно может быть выполнен с возможностью предоставлять пользователю возможность адаптировать набор 13 документов для получения адаптированного набора 13' документов. Подсистема 3 ассоциации может быть, соответственно, выполнена с возможностью ассоциировать набор 15 разрешений с адаптированным набором 13' документов. В качестве альтернативы, набор 13 документов обрабатывается посредством подсистемы 3 ассоциации без вмешательства пользователя.

Как упоминалось выше, пользовательский интерфейс 1 может быть выполнен с возможностью предоставлять пользователю возможность внести изменения, по меньшей мере, в одном отличительном свойстве 12, найденном посредством средства 5 поиска свойств, а средство 6 выбора документов может быть выполнено с возможностью выбора набора 13 документов, основываясь на модифицированном отличительном свойстве 12'.

Система может дополнительно включать в себя подсистему 9 управления доступом, выполненную с возможностью быть сконфигурированной посредством политики 4 управления доступом, полученной посредством подсистемы 3 ассоциации. Подсистема 9 управления доступом может быть выполнена с возможностью принудительно применять набор 15 разрешений в отношении множества 13 документов и, по меньшей мере, одного пользователя 16. Такие системы управления доступом, в сущности, известны в данной области техники и могут быть построены специалистом в данной области техники, принимая во внимание настоящее описание.

Фиг.2 иллюстрирует аналогичную систему для формирования политики управления доступом. Только отличия от системы на фиг.1 описаны здесь. Аналогичные объекты указаны на фиг.2 с использованием тех же ссылочных номеров. В системе на фиг.2 тема содержит ключевое слово 210. Анализатор 202 документов выполнен с возможностью поиска ключевого слова 210 в содержимом документов 214 электронной медицинской записи, чтобы получить множество 211 документов, содержащих ключевое слово 210. Анализатор 202 документов может быть выполнен с возможностью находить дополнительные ключевые слова 212, основываясь на содержимом документов 211, содержащих ключ