Способ поиска патентных документов при помощи цифровых вычислительных систем
Иллюстрации
Показать всеРеферат
305479.
ОПИСАНИЕ
ИЗОБРЕТЕН ИЯ и АВТ6РсиОму свидетельстВу
Союз Советских
Социалистических
Республик
Зависимое от авт. свидетельства №
1 1 ПК G 061 !5,/40 "У.
Заявлено 15.1Х.1969 (№ 13611,31/18-24),: с присоединением заявки №
Приоритет
Опубликовано 04.Ъ !.197!. Бюллетень № 18Дата опубликования описания 11.Х. 1971
Комитет по делам изобретений и открытий при Совете Министров
СССР
УДК 681.3:026.! 35(088.8) Авторы изобретения
В. А. Субботин, В. H. Майдан и Е. В. Вавилииа
Заявитель
СПОСОБ ПОИСКА ПАТЕНТНЫХ ДОКУМЕНТОВ
ПРИ 11ОМО111И ЦИФPOBblX ВЬ1ЧИСЛИТЕЛЬНЬ1Х СИСТЕМ
Известны способы поиска патентных документов при помощи цифровых систем обработки информации, когда документы и запросы представлены в виде совокупности цепочек слов, объединяемых при помощи логических операторов «И», «ИЛИ».
При известном способе производят упорядочение слов запросов и документов. Упорядоченные по алфавиту списки слов сравнивают с учетом логических операторов, в результате чего вычисляют вес документа с использованием весового критерия соответствия.
Предлагаемый способ позволяет. решать такие задачи, как поиск ближайшего прототипа и проверка объекта на патентную чистоту.
Он отличается тем, что анализируют цепочки слов и разделителей запроса и в зависимости от их структуры преобразуют разделители запроса в логические операторы; по адресу каждого слова цепочки в словаре считьТвают группы данных, задающие номера документов, содержащих данный адрес слова; осуществляют над группами данных логические операции, полученные в результате преобразсвания, и в том случае, когда результат очередной логической операции над очередной группой данных для слова и промежуточным результатом не задает номера документов, содержащих заданную совокупность слов, объединенных заданными логическими операторами, данный оператор и слово опускают и,переходят к обработке очередного слова. По окончании обработки всех слов по номерам документов, заданных результатом, считывают таблицы соответствий упорядоченных по величине пар разделителя и слова и номеров, характеризующих положение данной пары по отношению к началу набора однозначно выбранных цепочек слов и разделителей документа. Из цепочек слов и разделителей запроса выделяют цепочки однозначно выбранных подцепочек
15 слов и разделителей и формируют номера позиций пар слов и разделителей по отношению к началу однозначно выбранных подцепочек слов запроса, по которым выбирают соответствующие строки таблицы документа .и
2Э по результатам сопоставления элементов таблицы для пар слова и разделителя запроса и документа формируют результирующий вектор соответствия, документа запросу. При гоиске ближайшего прототипа суммируют
25 элементы результирующего вектора, формируют окончательные номера документов, соответствующие максимальной сумме единиц результирующего вектора. При проверке объекта на патентную чистоту суммируют коли30 честно нулей результирующего вектора, формируют окончательные номера документов, соответствующие минимальной сумме нулей результирующего вектора; выводят на печать тексты документов пд ". оюнчательным номерам. 5
С целью повышения точности нахождения ближайшего прототипд или патентов, порочащих патентную чистоту данного объекта запроса, путем анализа слов и разделителей запроса формируют однозначно заданную 1р для запроса последовательность разделителей, слов и специальных индексов, à TBK?Kp. набор последовательностей разделителей, слов и специальных индексов для каждого документа, для которого определены окончательные номера, сравнивают последовательность символов запроса с каждой последовательностью символов документа; выбирают из набора окончательных номеров уточненные номера документов для документов с
iliаксимальной c ммоЙ элементов уточненных результирующих векторов при поиске ближайшего прототипа; формируют уточненные номера документов для, документов, соответствующих минимальной сумме нулевых элементов уточненных результирующих векторов, выводят на печать тексты документов по уточненным номерам.
На чертеже представлена блок-схема размещения массивов в памяти системы: обработки данных, при помощи которой может быгь реализован предлагаемый способ.
Реализация способа рассматривается по отношению к цифровым системам обработки 35 данных, содержащим массову1о память на магнитных дисках и магнитных лентах и оперативную память большого объема.
Как документы, так и запросы представлены в системе с использованием специального 40 информационно-поискового языка, позволяющего описывать объект, его составные части, взаимодействие составных частей (отношения включения, соединения, взаимного расположения) и отношение между взаимодействия- 45 ми (альтернативой одновременности и последовательностч), что требуется для детальной переда ш информации патентной формулы.
Словарь информационно-поискового языка (ИПЯ) содержит определенные фиксирован- 5р ные формы слов русского языка, интерпретация ко" îðûõ зависит от разделителя, предшествующего данному слову в цепочке слов и р азделителей. Отношения между частями и объектом задаются при помощи цепочек 55
cJIop,, общий вид которьгх задается соотношением (1): индивидуальный или групповой индексатор
S, 60
WISP W2 ° .. 5О%,д или Рщ
S>W +?... S>W> индивидуальный или групповой индгксатор. 65 где:W, — слово из словаря, а индексаторы и разделители SII — S> позволяют задать смысл цепочки слов (1).
Документы и запросы представляют собой совокупность раздельных цепочек лиоо цепочек, объединяемых при помощи дополнительных разделителей S4 и 5;, задающих отношения. между взаимодействиями.
Для сокращения записей документов мо?кег быть также использован служебный разделитель SG, позволяющий объединить однородные члены по определенным правилам.
Отметим, что индексаторы служат для различения эквивалентных объектов или их частей, задания группы эквивалентных объектов и выделения подгруппы эквивалентных объектов или частей. Индексаторы подразделяются на индивидуальные и групповые. Первые эквивалентны порядковым числительным естественного русского языка, последние служат для группового перечисления. Разделители So — S> задают определенные семантические отношения между словами W,. Несмотря на простоту синтаксиса ла уровне информац ионно-поискового языка возможны неоднозначности, которые далее устраняются при автоматической обработке запросов и документов. Эти неоднозначности определяются возможностью использования во входных текстах синонимов, возможностью произволь,ного помещения пары разделителя и слова по отношению к цепочке слова и разделителя, возможностью выражения одного и того же смыслового содер?кания при помощи различных наборов разделителей и слов в цепочках слов и разделителей.
Документы, записанные на указанном информационно-поисковом языке, вводятся в вычислительную систему с перфокарт. Запросы могут вводиться с помощью машинки с пульта оператора.
Документы и запросы представлены на входе системы в форме последовательностей двоичных символов. Прежде чем детально рассмотреть последовательность действий в соответствии с данным способом, рассмотри;I основные элементы системы и требования к ней,. Для устранения неодн той информационно-поискового языка используется автоматический словарь слов В,, в котором синонимы получают одинаково ежа.ые коды, а информация в виде специальных меток в словаре и отсылки к сжатому коду синонима в совокупности позволяет осуществить унификацию не только слов запросов и документов, но и разделителей, т. е. осущестзить унификацию цепочек (1), выражающих определенные смысловые отношения.
С другой стороны использование сжатых кодов понятий в системе позволяет повысить ее быстродействие при выборе однозначно задаваемых цепочек слов и разделителей при анализе текстов запросов и документов, так как все слова представляются последовательностями двоичных знаков постоянной длины.
Путем выделекия разделителей из ь «едкого текста и е o госледовательного a!!ализа .. ожНо выделить каждое слово входного текста и направи-.ь его нa вход автоматического с;оваря.
Лвтоматический слоьарь мсжет оы?ь орг".НН30ВаН нг ocHGBe любых иЗВест:lых Hp;? ILi?iПОВ с упорядо-:ение м слов В памяти с !CTexlb!, причем каждому слову присваивается сжатый код, равкый адресу первого байта зтогo слова в словаре pH отсутствгии отсыл«:1. к синониму, или а -pec первого байта сино»??мг.
Для поиска сжа GLG кода слова в автоматическом слОВгре может ист?ользсВ2ться как известный поиск по дереву, так и кох бинированные методы, основг«i ûå ка адресации 110
КОМбккацИ И IrepBb!X двух буКВ, ПО.?уЧ31?Г?1 параметроВ массива (верхний и нижний а,реса), проверяемых делекием массива ис. лам и сраьнением.,??ОГ т так?же исполl.зо ьаться другие извес! Hb!e методы, основан ь е на случайном преобразовании кода несжатого слова в адрес, Iio иоторому хранится исходкое с.:ово. Для корректировки автоматического словаря используются извести?ь;е методы поиска в слова,e и добавления слов, отсутствующ?х в словаре, в специа. ьную его часть с использованием одпссвязных cl!Hci Ов и привязок к определенным словам. Сжать;и
«од слова так?ке однознач.о згдает "-.",, ес данных, задаюп их номера докуме?тон данным сжатым кодом.
Пр и нципи алько возмож??ы дв а способа хранения информапии о номерах доку:,eHTGB, содержащих данный адрес:
1) хранение позиционного года по данному адресу, в котором единица в i-ой г.озиции слова свидетельствует о присутствии сжатого кода B I-ом документе, а ноль об О-.сутствии документа.
2) Хранение упорядоче?п?ого списка;-:омеров документов, н которых используется дгн1?ый адрес.
Эта информация может бь;ть Го-,ó÷e:a на зт апе ввода документов, нахождения адреcGB в аваоматическом словаре и коррекции позиционного кода или упорядоченного ст;иска известными методами — анализа илп сравнения и внесения текущего номера .:ли ед.:ницы. Информацию о номерах документов с данньв адресом целесообраз??о хранить па магнитных дисках, так как все адреса, от;?осящиеся к одному затросу, могут быть опрошены и соответствующие массивы могут быть переписаны В От!ергтивн7ю п2мять систех?ь*. за одно обращение к д?.ску.,po.,re Toão, д?.с« позволяет xp2!iHTb 60.3»UJH масс1;В,I и:-lформации, 06ecrilечивгя достаточно быстрый гон ск.
Отметим, что автÎматический слОEapl, мо жет храниться кап B Оператив?1ой памят:1 сиcTehtbI, T2K 1l На ? i2I HHTHbIx 62р2банах.
Вводимая инфорxiaLLHH о документа. . храHIHTCH Н2 I 21 IIHTI!OII JleHTe, Так же, ка?: Ipea варительпо подготовленные:и этапе ввода
305479 . „. ь,;скумектcB таблицы, о.носящиеся к данно:.. у до«уме ту. До«ух;екты на мггнитной ленте хранятся в I.G ядке их ввода B систему.
Рас?1; еделекae основHblx массивов в основной и расшкpeHHo?! Памяти системы для одного и"- возможных вариантов реализации с«осо6а представлеко на чертеже.
В основной памяти 1 гомещаются автома.1" .ес«ий словарь, рабочие ячейки памяти, j 0 H He H K1 iI p G E» a r?r r?r b! 0 6 р 2 6 0 к и, я ч е и к и и р ограмi:û диспетчера. Лвтоматический словарь размещен в б;;Оке 2 ссновной памяти, проГраммы СГО ОрГ2H?:32,!iH — В ЗОНе 8. ЗОН 2 4 .;;Сжет ис;ользозать я для буферного хране15,:- я до«уме:-тон зап осов при их вводе. Рабочая п=orpaмма "а«ится в зоне 5 основной
;гмят 1. В:опе 5, рабочей, динамически размещаю ся дапкь?е, сч?;тываемые с дисков, 1. ад ко 1opыxrH осуществляются логические
20 о .е ации. Слово в автоматическом словаре
::ожет занима;ь ряд ячеек, например, ячей?и 7 и 8. Для x.".а?;ен? я слов переменной длины мс:.:ет ис;ользоваться часть слова 9. чac. ь слова 10 используется для отсылок к
25 с?л скимам, 2 чгcTь слова 11 может использоваться для о-сылок к новым корректируемым массив ам.
Б зоне 5 хр: нятся программы ввода доку..:3?он, по!cка ближайшего прототипа и проь=э«3 a ia;:. .Гкую чистоту объекта запроса. а также п,огргмма-дис?етчер для дина:,м?ческото .:.ерераспределекпя массивов в памя?и и вызовг подпрограмм обработки. При кахотк.енин адреса записи по данному сжа35 TÎ r) ко„у может . cпользоваться один из индека::=..; perHCTpoB 12 вычислителя 18, назначен::е 1, GTopolo — счет, сравнечие, анализ и побай?оные операции. Для обмена информац?;е?1 между ос?:GB«ой памятью 1, вычислите40 ле., 18, маги. I кымH д;.Скамп И и накопите;г,"..;:H 15 !а магн .THG?I ленте служит канал связи . 6. В зоке 17 блока запп:и 18 может хр2Н iTься сжатый код слова для поиска информац? и о ко.; ep2x документов. Каждый до45 «умен-.:a маг??ит ?ой ленте занимает массив
l r !!ÅÐÅÌe!?IlO;"! ДЛИНЫ С тЕМ жЕ НОМЕРОМ i, ".о и поря новый номер документа. Номер хранится в ."còH 20 записи на магнитной ленте. 1-1епосредствекно за номером могут
50 с. сдор=?ь часть 1 для храпения длины масс:Ba и часть 22 для хранения длины (1 — 1)-го
i: ace?r B à.
Для 6о;!ее детального понимания способа ос?гн.-:нимся:2 математ??ческих моделях до55 к, мс н? ОВ H 32.1p c GB, Hc!10.. b3уе мых B систе, 2 та!;; е «а постановке задач поиска ближгйшc?3 I?pGTGT!11!2 H IlpÎBcpHH объекта На
i1aòeнтку 10 чистoTv, связанных ." указанными моделями. Оппсгни?О запроса и документа
60: :0:!.. бы ть I!GCT; в;lек в coÎтветстВис Граф, i.oòîpо. о состьетствуюГГ цепочки (1), 32 тающ r н" аи. !GGTrrolrBeния ООъект2 и еГО сос;ав??ых чгсте?1, а гершпнам графа соответствуют общие !аaсти дуг, идентичных даш ой
65 E шике. Кроме того для сопоставимых дуг
3054!9
c„„ и или (S,) С,.„(21 или или и или и . (4) C, (S,) C, (S) или или
Qi l l или
С,, 10
Qi.I
Я?21 или 02" 1 или ИЛИ или или и или и (S) С22 2 (S8) или и или (S;) C;„(в) с,, Q 211 или
Q1 1
15 (6) или или
О„,г
QlIÄ;
Q1». или или или пли илп или или с,.„„ или . и C, (c) (;.) или с» или и
С„„ или
С„,, и
Q-."
Q;., Q,а„ или или
ИЛИ
25 (5ь) ИЛИ или
CI Jk
С...г.U, ) и
Vp(, „и
С,, „(S„) Цепочки разделителей и сжатых кодов слов
4(а), 4(в) и 4(с) представляют собой п-.paллельно-гослсдовательные цепи из конструкции типа (3), Дополп:Iтгльпы= Отношения между Взaп. :Одействиями задаются цепочками вида: (5) С!1,,5 и С..., и также представляют собой параллельнопоследовательные цепочки.
Модель объекта, задаваемая соотношгипями (4) и (5), может быть преобразована в более простые соотношения, используемые для промежуточного поиска, путем заме.!ы разделителей в каждой из цепочек на логический оператор «И» для неповторяющихся разделителей и на логический оператор
«ИЛИ» для повторяющихся раз; лителей, объединяемых в скобках при задании порядка выполнения логических операций, операторов (S?;) — «И» гна «ИЛИ» в соотношениях (4), разделителеч S4 или Я„на «ИЛИ» в соотношениях (4), а также соответству?ощих А; на У;, где V; — группы данных, зада?огщ:= номера доку меитОВ, содгпжящих даl- ный адрес А; слова, позволяют получ ITb программу, зада?сщую предварительный поиск 107(óментов, удовлетворяющих данному запросу.
Когда У1, представляет собой вектор дл::пoi, в N двоичных разрядов, в котором в 71-Ом разряде содержится «1», если данное слово 1; содержится в k-ом документе (Л вЂ” количестго -,окуiicnTOBE, соэтиошгппя (3), (4), (5) ..Ог т оьгть ",«еоб Я-.OB21!bi В поограм.лг обоаб07ТКП ВСКтарОВ 1;,г;, ГдЕ l — ГОПядКОВЫй? ПОмс11 с,.ова в ц .?О:.к Г".OB li рЯЗдглитслг1! (31.
5 ЭTà Ilpccðàм а задается соотпошгн:!ем ш;или или или . . или, . или
Ят!< С.,::,.
Qil7717г1 и QI 7 !г
1 1
О,, ?,7 ! 1
1177 r7n rn i 1,7г
0 где Q;, = Vi,"., и (U,-, или
?11!.;7(, ц и Vi,1;(,,> пли, 177!г (— 1) " 11, 7)
B c0oTBBTcTBи11 с ссотпошгнигхl (3), 06Р 200Th2
ГО ЧЯСТЯМ В COOTBBTCTB?IИ С ПРОГР 2М Мой, 32Д240 ваемсй соотношением (6), слева направо.
Когда V задается списком номеров докумеIITOB, операция «И» эквивалентна нахождению общих злемPIIToB соответству!Ощих списков, а операцгия «ИЛИ» — слиянию двух
45 списков.
Как видно из соотпошгн lя (6), последоваТгibHOCTb Qi;,.r, 32давягмуЮ Нгl(OTOpon МВТрИцей, целесообразно обрабатывать, пробегая всг 3.. ачг:11?я j и /г для 7 = const, а затем уве50 ли -?ива"-. i на единиц . п!О СпяsanО " .ЕМ, ЧтО ОПЕР "öÈÿ «И» На:Ождгi èÿ Одинаl OBb .. . э IÐI.ÃíTOВ списков пропроизводит" я -ñOëbêo в гределах Q;;I, 7.plinBú? 0H2 . .?Ожет сВрсТН множестВО номгрОВ
55 доку:?c:ITOB., -"-="ПЯВBåìblê ее результатом, к пу;!гному. Сднакс, когда такиг результаты по;, ч2ю-.ся 1: . с бp яоoткe, 1! 2пр их?Вр, последне? о I.î по„ядку Q)71, общение потребите".ÿ " Bblni,c.II Tå;.bnoé системой станов:?тся б0 1.".PBcoi Ожпым, т21 как М2шпн2 нг Выдает ни
К . ? 7?т .
C; (!Ice-.Bo c.1o 02 cBo3ElTcEI K то. ?;7, 2;1a;173117 Я Ц -On;:.n С..ОВ И ЯЗДР III e.iг11 32 проса, 1?ПфрoBBEI шг -?ПслитеibII2H система б5 пресбргзует цело?ки слов запроса в адреса
305479
5
Таблица
Последовательность разделителей в частном виде конструкции (3) Разделитель идентификатора 7 Я Я 1 (7) а ° ° о (с ) S7 з . 3зд
S S S S ()) р) 5з зд 7 Sl S7 (1) (а) (7) 7 Я Я 1 37 (7) о ° ° о Р ) (1) 57 дно . So
S, или S
S правый S, или 1
2,1
2,3
3,4
2,1
2, 3, 4
3,4 г) при госледовательном движении идентификаторов с групповым индексатором или
S7 каждому элементу расширенной матрицы в скобках ставится в соответствие единичный элемент весового вектора, если порядковый номер перед скобками меньше номера сопоставляемого элемента в скобках или равен ему, и нуль — в противном случае; д) путем анализа идентификаторов вдоль столбца для запроса для всех элементов, кроме элемента с первым слева групповым индексатором или S7 в конструкциях вида (3), проверяют выполнение равенства суммы ноВ этой таблице 1 — групповой индексатор; скобки означают присоединение данной конструкции через «ИЛИ»; элементы таблицы соответствуют поправкам. е) после разделителя S4 следующему элементу в скобках расширенной матрицы присваивается «1» весового вектора, когда для первого идентификатора после данного выполняется условие «в», а для последующих— согласно пункту «г» или «д»; ж) после А-го разделителя Яа в их последовательной цепочке требуется, чтобы сумма данного номера вне скобок плюс все поправки, определяемые с. цепочками разделителей, согласно таблице, вплоть до данного разделителя соответствовала номеру данного элемента в скобке, что позволяет преобразовать последний в единичный элемент весового вектора в соответствующей позиции. Таким образом, каждый элемент расширенной матриты преобразуется в соответствующий весовой вектор, содержащий наборы «1» и «О». Далее все векторы вдоль каждого столбца поразрядно перемно>каются. Это позволяет выделить частично сов падающие параллельно-последовательно цепочки для документа и запроса. Затем все векторы столбцов суммируют по mod 2, что позволяет выделить количество совпадающих цепочек, и получают результирующий, вектор соответствия документа запросу. Этот вектор определяется моделями (4) и (5). Суммируют все элементы результирующего вектора, количество которых совпадает с количеством параллельно-последовательных цепочек. Сумма единиц этого вектора может быть принята за меру совпадения. документа запросу. Для каждого документа хранят эту меру и .номер документа.
50 мера первого слева идентиф.:катора с групповья индексатором или S7 документа, задагаеа;ого номером в скобках расширенного вектора, с поправкой гз таблицы, B зависимости от вида разделителя и частного вида конструкции (3), и для всех элементов, для которых выполняется равенство, проверяют, больше данный элемент элемента геред скобками или равен ему. При выполнении этих ус.-.овий в весовом векторе в соответствующей позиции, для которой выполняется данное условие, устанавливается «1», а при невы.толнении их — «0».
Далее документы сортируют по величине этой меры, и все номера документов, для которых мера максимальна, представляют собой окончательные номера, по которым информация о тексте документа, хранимая на магнитной ленте, может быть выведена на печать. Сумма нулей результирующего вектора является мерой несовпадения документа и запроса. Для каждого документа хранят эту меру и номер документа в виде таблицы. Сортируя по величине меры таблицу, можно получить номера всех документов, для которых мера минимальна. Когда мера равна нулю, документ порочит патентную чистоту объекта запроса. Матрицы, таблицы и векторы могут храниться на магнитной ленте в виде односвязанных списков. Обрабатывать эти списки с их преобразованием в результирующие векторы можно по частям.
Запросы можно обрабатывать с высоким быстродействием, так как матрицы документов могут быть предварительно погдотовлены на этапе ввода. документов, когда не требуется существенного быстродействия системы.
По окончательным номерам входнь.е тексты, также хоанимые на магнитной ленте, могут быть выведены на печать.
Обладая высоким быстродействием, данный способ поиска ближайшего прототипа или объектов, горочащих патентную -.èñòîòó объекта запроса, позволяет вывести все документы, относящиеся к запросу, на печать, однако вследствие неучета индивидуальныx индексаторов, а также привязок отношений между взаимодействиями (5) с результатами сравнения, полученными для однозначно сформированных цепочек слов и разделите305479
17 мой кодирования (имеются еще какие-либо наборы циклов, содержащие дуги, не лежащие 1а сравниваемых максимальных циклах), то специальные индексы задгнот указанные участки, которые далее могуT сыть сопоставлены, отделько. Для документа составляют последовательность 2, где а — длина цикла последователькостей, начиная с каждой дуги на цикле и перечисляя дуги как по часовой стрелке, так и прогив нее. Последовательность может быть составлена один раз, а все остальные могут быть получены циклическими перестановками и реверсированием порядка. Правила кодирования англогичны уже рассмотренным.
Каждую последовательность для запроса сопоставляют с каждой из последовательностей для документа путем Выбора по привязкам к соответстствующим спискам кодов для дуг запроса и документа соответствующих списков, их слияния и сравнения результирующего списка с исходными по ксличеству элементов.
Если дуги сопоставимы, ни одна из них не является фиктивной, лежат они па максимальных циклах и имеют одинаковы=- привязки с разделителем S<(Sq) к позиции дуги, связанной с данной разделителями S„(S„;) (см. соотношение (5) ), то в результирующую последовательность вносят элемент аь в противном случае — нуль. Если дуги сопоставимы,.ни одна из них не является фиктивнои, но дуги не лежат на максимальных ц11клгх, имея оба конца на максимальных циK;Iax, проверяют принадлежность дуги одинаковым наборам базовых независимых циклов микимальной длины по их длинам, и, если эти наборы идентичны, вносят элемент а,/2. Здесь также требуется учить:вать привязки между дугами с учетом их переменных позиций, а также соотношение (5) .
При наличии наборов циклов вне максимального сопоставления наборов требуется найти наиболее близкие по длине макси..11гльные циклы для этих частей и получить соответствующие а; и а;/2 в составляющи.; результирующих векторах, которые вставля1отся вместе с нулем в позиции этих сравнивгемых наборов. Инами словами, 7от жг процесс составления и сопоставления кодовых последовательностей касается частей, которые не вошли в первую результирующу10 последовательность.
РгЗультирующая псследОВателы10сть — beKтор, содержащий наборы а,, а;/2 и част1:ые суммы а, и а, /2, не вошедшие в первый i:aêсимальный цикл. Количество таких последовательностей определяется Величгпкою 2Г,,", где r — количество максимaльных ц гклов данного запроса.
От етим, что а; в результирующей последовательности при учете одного лишь пересечения дуг принимает значение «1». Это це18 лесообразно при проверке объектов на па-.::-пкую чисто-,у. Для поиска прототипа может потребоваться учет позиции дуги в дереВе включения. При обрасоткг модели, задаваемой сооткошгпиям:1 (4) и (5), дугам могут быть прип:1саны веса а; в зависимости от их 1-.рикадлежности определенному уровню в н г Ilp àâaåííîì дереве включения.
Пусть и хм1нимальный номер уров;1я, на
10 котором появляется данная, дуга. Тогда а; =
= 2 — ". В отделы1ых случаях можно сч1пать а; = 1 для всех дуг (для упрощения послгдовг.елы ости действий). При поиске ближайшего прототипа для каждого результирующг15 го вектора вычисляют сумму всех а; и а;/2
Г. О ВСЕМ ЗН2ЧЕНИЯХI I (ПОРЯДКОВОМУ НОМЕРУ
;уг при их квазиупорядочении) и для данноГО документа Выбир210т максиrtaльну ю су Atму. С еди всех доку»1е1пов выбирают доку20 мгпт с IBI
При проверке объекта на патентную чистоту вычисляют сумму нулевых членов но всем
i и Вь;oHpaloT ми1.имум такой суммы. Среди
25 всех документов выбирают документы с минималы;ым или нулевым значекием такой суммы.
Уточненнь. г значения результирующих векторов соответствия документа запросу полу30 чают для малого колпчества документов, обнаруженных в результате обработки по упроще1ным моделям, вследствие чего быстродействие системы СН11жается кесуществг11но.
Предмет и=обретения
1. Способ поиска патентных документов при помощи цифровых вычислительных си4Q с ем, при котором патентные документы и запросы представлены В виде совокупности цепочек слов, объединяемых при помощи логических операторов «II», «ИЛИ», от,гача1ощиася ie», что с целыс решения таких Зад2ч, 45 как поиск ближгйшего прототипа и проверка объекта на пате:ппую чистоту, анализируют
I1eпочки слсВ и р23дслите7ей запроса и В 32впспмости QT структу-ы цепочек слов и разделнтелей преобраз ют разделители запроса
50 в логические операторы, го гдресу каждого слова цепочки в словаре считывают группы данных, задаюп;ие нî»epa,äot!óìåíòoâ, содержащих данный адрес слова, осуществляют 1ад Группами анных логические операции, 55 полученные i3 резмльтате преобразования, и в том случае, когда результа-. очередной лоГ11 -:ескo:! onграции I.an, очередной группой данных для слова и промежуточным результатом не задает номера документов, содсржа6О щих aàäàнную совокупность слов, объединен11ь1", Задa»1 ы 1«лоГическими опepaTор2ми TО данный 01!е;, тор и слово опускают и переходят к обргсотке очгредного слова; по окончании ОбГ2ботк1i Всех слОВ пс номерам дску65 ментов, згда1гкых результатом, считывают из
305479
19 памяти таблицы соответствий упоря;,очг!Нных го величине liap разделителя и слова и номеров, характерпзу1ощих положение данной пары fo GTIIoøåH»lî к началу наоора однозначно выбранных цепочек слов и разделителей документа; из цегочек слов и pàçäå;IHTåëåé з проса выделяют цепочки однозначно выбраниb.х подцепочек слов и разделителей и форм!:рдеют гомера г!оз»ций пар слов и раздели елей г!o отношению к началу однозначно выбранных подцепочек слов запроса, по которым выбирают соответствующие строки таблицы документа и по результатам сопостав.!ения элементов таблицы для пар слова и разделителя запроса и документа форм:!руют результирующий вектор соответствия документа запросу; при поиске ближайшего прототипа сумм11р IQT элементы ргзультиp) ющгго вектора, формируют окончательные помгиа документов> соо1 ветствую щпе маl cul малы!ой сумме единиц результирующего вектора; при проверке объекта на патентную чистоту суммируют количество нулей результирующего вектора, формируют окончательные номера документов, соответствующие минимальной сумме нулей резуль!ирующего век Top a; Вь. водят на печат ь тгкс l ы док ментов по окон-1атгс!ы11.!м !омерам,., 2. Способ bio п. 1, отличаюи,ийся тем, что, с целью новь:IlieHHH точности нахождения ближайшего прототипа или патентов, гороча:цих патентную чистоту данного объек!а 32проса, путем анализа слов и разделителей запроса формиру1от однозначно заданную для запроса последовательность разделите10 лей, слов и спгциальньгх индексов, а также набор последовательностей раздглителей, слсв и специальных ин!дексов для каждого документа, для которого определены окончательные номера, сравнивают последователь15 ность символов запроса с каждой последователь:!остью символов документа, вь;бирают из набора окончательных номеров уточненные номера документов для документов с максимальной суммой элементов уточненl ых ре
20 зу I»THpl IoKHx векторов щего прототипа; формируют уточненные; омера документов для документов, соответствующих минимальной сумме пулевых элементoB уто гненных результиру1ощих векторов;
25 вы)водят на печать тексты доку енто в по уточненным номерам. °