Устройство вычисления подобия и программа вычисления подобия

Иллюстрации

Показать все

Изобретение относится к устройствам вычисления подобия, предназначенным для вычисления показателя, по которому судят о техническом подобии между группами технических документов. Техническим результатом является создание устройства и способа вычисления подобия, которые предоставляют возможность сравнения групп технических документов в широкой области, не ограниченной публикациями патентов или подобными документами. Устройство вычисления подобия содержит средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов, подлежащих сравнению; средство ввода технической информации, предназначенное для ввода технической информации; средство кластерного анализа, предназначенное для поиска технических документов, содержащихся в первой группе технических документов и во второй группе технических документов и содержащих введенную техническую информацию, и для разложения найденных технических документов на кластеры для каждой технической информации; средство вычисления подобия, предназначенное для вычисления отношения общего количества кластеров, полученных в результате кластерного разложения, к количеству смешанных кластеров, содержащих технические документы из первой группы технических документов и из второй группы технических документов; и средство вывода, предназначенное для вывода вычисленного подобия. 27 н. и 6 з.п. ф-лы, 19 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ

Настоящее изобретение относится к устройству вычисления подобия и к программе вычисления подобия, которые сравнивают группы технических документов и судят об их подобии.

ПРЕДПОСЫЛКИ СОЗДАНИЯ ИЗОБРЕТЕНИЯ

В обычных патентных картах патентные документы используют для сравнения содержания документов по одинаковой или по аналогичной научно-исследовательской тематике на предмет технологии, посредством чего, как полагают, могут быть выявлены общие тенденции и распределения. Исследуя патентную карту, руководитель может анализировать элементы, являющиеся существенными для управленческих решений, например тенденции развития рынка, тенденции развития технологии, тенденции развития предприятий, выходящих на рынок, и предприятий-конкурентов, перспективы на будущее и т.п.

Когда в патентной карте необходимо выполнить крупномасштабное сравнение группы А технических документов, относящихся к компании A, и группы B технических документов, относящихся к компании B, то ранее производили мелкомасштабные сравнения между отдельными техническими документами, связанными с группой А технических документов, и отдельными техническими документами, связанными с группой B технических документов, и из этих результатов получали результаты крупномасштабных сравнений между группами технических документов.

На Фиг.19 показана ситуация, имеющая место при сравнениях из известного уровня техники, включающих в себя отдельные мелкомасштабные сравнения между техническими документами, принадлежащими к группе A технических документов, и техническими документами, принадлежащими к группе B технических документов.

Как показано на Фиг.19, при сравнении технологии, описанной в группе B технических документов, для ее сравнения с технологией, описанной в группе А технических документов, обычно выполняют мелкомасштабные сравнения для всех комбинаций технических документов (публикаций патентов, технических отчетов и т.п.), содержащихся в группе А технических документов, и технических документов (публикаций патентов, технических отчетов и т.п.), содержащихся в группе B технических документов, результаты количественно определяли как подобия и сравнения численных значений для двух групп технических документов ранее выполняли путем вычисления среднего значения и дисперсии (см., например, документ "Руководство по патентной карте" Патентного ведомства Японии от 4 августа 2002 г. ("Patent Map Guidance", Japan Patent Office, August 4 2002), размещенный в сети Интернет по адресу http://www5.ipdl.jpo.go.jp/pmgsl/pmgsl/pmgs).

В выложенной патентной публикации Японии № 2000-348015 описано устройство определения ценности интеллектуальной собственности, способ определения ценности интеллектуальной собственности и т.п. для количественного определения ценности интеллектуальной собственности, связанной с изобретениями и т.п., при подаче заявки на изобретение или после регистрации. Это устройство определения ценности интеллектуальной собственности содержит средство ввода данных о прибыли от внедрения, предназначенное для ввода данных, относящихся к прибыли от внедрения; средство ввода данных о текущем значении нормы прибавочной стоимости, предназначенное для ввода данных, относящихся к текущему значению нормы прибавочной стоимости за каждый год; средство вычисления значения текущей стоимости, предназначенное для вычисления текущего значения ежегодной компенсации за каждый год путем умножения прибыли от внедрения на данные, связанные с текущим значением нормы прибавочной стоимости за каждый год, которые введены при помощи средства ввода данных; средство вычисления ценности интеллектуальной собственности, предназначенное для вычисления ценности интеллектуальной собственности за каждый год путем добавления текущих значений ежегодной компенсации, вычисленных средством вычисления значения текущей стоимости; и средство вывода, предназначенное для вывода значения ценности интеллектуальной собственности, вычисленного средством вычисления ценности интеллектуальной собственности.

В этом и в иных подобных устройствах определения ценности интеллектуальной собственности предпринята попытка выяснения стоимости активов в форме патентов, имеющихся на текущий момент времени, из-за снижения стоимости активов в форме зарегистрированных патентов и связанных с ними продаж и прибыли. В этих изобретениях при определении ценности каждого патента предполагают, что для вычисления стоимости актива в форме интеллектуальной собственности, для которого не была предусмотрена конкретная лицензия, может быть осуществлено ранжирование и ввод значения ценности, определенного самой компанией, и значений ценности, определенных другими компаниями, и что может быть произведена оценка вклада каждого из них.

В выложенной патентной публикации Японии № 2001-76042 приведено описание системы, способа и носителей записи для оценки оцениваемых объектов, которые могут изменяться с течением времени, на основании первых данных, имеющих заданный интервал обновления, и вторых данных, интервал обновления которых является более коротким, чем интервал обновления для первых данных. Эта система содержит (a) средство создания первой модели оценки в соответствии с вводом первых данных в качестве образца; (b) средство применения первых данных в качестве образца в первой модели оценки и вычисления первого результата оценки; (c) средство создания второй модели оценки в соответствии с вводом вторых данных в качестве образца и первым результатом оценки; (d) средство применения первых данных в первой модели оценки в соответствии с вводом первых данных в качестве образца и вычисления второго результата оценки; и (e) средство применения вторых данных в качестве образца и второго результата оценки во второй модели оценки и вычисления результата оценки в качестве оценки. Таким образом, производят оценку оцениваемых объектов, подлежащих оценке, которые могут изменяться с течением времени.

В этой системе считают возможным вычислять в надлежащие моменты времени оценки работы предприятия за последнее время за счет применения данных о предприятии для оценки в двух моделях оценки, которыми являются статическая модель, в которой оценки работы предприятия вычисляют с использованием данных о ранжировании, значений вероятности банкротства и т.п., вычисленных из первых данных со сравнительно длительными интервалами обновления, например из данных о финансовом положении, полученных из балансовых отчетов и отчетов о прибылях и убытках, обновляемых ежегодно или ежеквартально, и динамическая модель, в которой оценки работы предприятия вычисляют динамически, на основании ввода вторых данных со сравнительно короткими интервалами обновления, которыми являются, например, ежедневно изменяющиеся курсы акций, процентные ставки и курсы обмена валют, с прогнозами, основанными на таких изменениях.

Кроме того, в выложенных патентных публикациях Японии № 8-287081, № 2001-337992, № 10-74205, № 8-278982, № 11-73415 и № 2001-331527 описаны устройства поиска подобных друг другу документов, системы поиска подобия и т.п., которые при поиске документов или текста с содержанием, подобным содержанию определенных документов или текста, обеспечивают возможность точного поиска подобных друг другу документов с высокой степенью подобия между документами и текстом и с высокой надежностью.

РАСКРЫТИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Однако в патентной карте, описанной в "Руководстве по патентной карте" Патентного ведомства Японии от 4 августа 2002 г. ("Patent Map Guidance", Japan Patent Office, August 4 2002), и в изобретениях, описанных в выложенных патентных публикациях Японии № 8-287081, № 2001-337992, № 10-74205, № 8-278982, № 11-73415 и № 2001-331527, даже при наличии запроса на крупномасштабное сравнение содержания, изложенного в технических документах, например, между группой А технических документов, относящихся к компании A, и группой B технических документов, относящихся к компании B, в известном уровне техники выполняли мелкомасштабные сравнения между каждым из технических документов, принадлежащих к группе А технических документов и к группе B технических документов, а результат крупномасштабного сравнения этих двух групп технических документов получали из множества результатов вычислений, поэтому возникала проблема, заключающаяся в низкой эффективности этого процесса.

Кроме того, в случае патентной карты, описанной в "Руководстве по патентной карте" Патентного ведомства Японии от 4 августа 2002 г. ("Patent Map Guidance", Japan Patent Office, August 4 2002), при технических сравнениях считают возможным определять общие тенденции и распределения для содержания по каждой из одинаковых или аналогичных научно-исследовательских тематик. Однако поскольку невозможно вычислить относительные оценки для каждой технологии по всем предприятиям, используя все технические документы всех предприятий в качестве генеральной совокупности, то полученные количественные или качественные результаты не обеспечивают способ оценки стоимости нематериальных активов, и поэтому существует проблема, заключающаяся в том, что не может быть вычислен показатель, определяющий ценность технологии, для его использования при принятии решений относительно стратегии применения патентов в рамках предприятия, направленных на получение оценок доверительного управления имуществом и капиталовложениями.

Кроме того, при использовании способа вычислений, содержащего усреднение таких мелкомасштабных подобий, например, в случае, показанном на Фиг.19, когда группа А технических документов и группа B технических документов являются совершенно различными, вычисленное подобие равно 0. Кроме того, среднее значение подобия, вычисленное для всех комбинаций, также равно 0, поэтому кажется, что не возникает никакой проблемы.

Однако даже в том случае, когда первая группа технических документов и вторая группа технических документов являются в точности одинаковыми, при определении мелкомасштабных подобий между техническим документом A1, содержащимся в первой группе технических документов, и техническими документами B1, B2, B3, B4, содержащимися во второй группе технических документов, когда два технических документа являются в точности одинаковыми (например, A1=B1), то вычисленное значение подобия между A1 и B1 равно единице, но в других случаях значение подобия обычно не равно единице. Кроме того, среднее значение подобия, определенное для всех комбинаций иных документов, чем документ A1, например для A2, A3, A4 и т.п., является средним значением единицы и числовых значений, меньших, чем единица, поэтому возникает проблема, заключающаяся в том, что вычисленное значение подобия никогда не равно единице.

Кроме того, при вычислении подобия для большого объема технических документов, например, в тех случаях, когда общее количество технических документов составляет несколько десятков тысяч или более, необходимо вычислять подобия для всех комбинаций технических документов, поэтому для вычисления подобий необходим огромный объем вычислений, требуется большое время вычислений и существует дополнительная проблема, заключающаяся в том, что не может быть осуществлено быстрое отображение результата вычисления подобия.

К тому же, если при вычислении подобия согласно известному уровню техники используется способ, в котором исследуемый объект и совокупность технических документов подразделены по ключевым словам, то вычисляют отношения количества технических документов, содержащих каждое из ключевых слов, к общему количеству технических документов и производят усреднение вычисленных отношений для всех ключевых слов для вычислений подобий, если же не выполняют умножение на весовой коэффициент на основании важности ключевого слова, то существует проблема, заключающаяся в том, что может возникнуть несоответствие между вычисленными подобиями и фактически воспринимаемыми подобиями.

При использовании для вычисления подобия таких ключевых слов с весовыми коэффициентами оператор может присвоить весовые коэффициенты для всех ключевых слов для создания тезауруса, и подобия могут быть вычислены на основании этих весовых коэффициентов. Это теоретически возможно, но в действительности присвоение весовых коэффициентов каждому из огромного количества ключевых слов является весьма затруднительным (граничащим с невозможностью), и такая задача не позволяет осуществлять ее автоматизированную обработку. Кроме того, подобия вычисляют для каждого отдельного технического документа, поэтому отсутствует какое-либо решение проблемы выполнения мелкомасштабных сравнений технических документов.

Кроме того, в случае патентной карты, описанной в "Руководстве по патентной карте" Патентного ведомства Японии от 4 августа 2002 г. ("Patent Map Guidance", Japan Patent Office, August 4 2002), стоимость программного обеспечения для содействия созданию патентных карт составляет приблизительно от 150000 до 500000 японских иен, и для обеспечения функционирования такого программного обеспечения требуются технические навыки и знания высокого уровня не только по компьютерам, но также и по считыванию формул изобретения и чертежей патентов и т.п. И когда организация, производящая обзор патентов, запрашивается о выполнении таких задач, то затраты обычно составляют от 300000 японских иен и выше по каждому делу и время, требуемое для создания патентной карты, равно приблизительно одному месяцу или более.

Следовательно, ожидается, что использование патентных карт будет ограниченным при их использовании коммерческими предприятиями с ограниченным капиталом и с ограниченными бюджетами на развитие или в том случае, когда существует необходимость в своевременности подачи заявок на патенты.

Кроме того, в устройствах оценки интеллектуальной собственности и т.п. из известного уровня техники существовала проблема, заключающаяся в сложности сбора информации, начиная с прошлой информации и заканчивая самой последней информацией, в широкой области техники для выполнения анализа тенденций развития техники среди конкурирующих компаний и в сложности проведения исследований тенденций развития техники и т.п. для выяснения уровней развития технологии перед началом исследований и разработок продукции.

Поскольку за последние годы возросла доля стоимости нематериальных активов в стоимости предприятия, то стоимость нематериальных активов оказывает очень сильное воздействие на стоимость предприятий.

Следовательно, существует тенденция использования трастовыми компаниями, связанными с доверительным управлением собственностью, инвесторами, связанными с капиталовложениями, и предприятиями, связанными с изменениями стратегии применения патентов, которые увеличивают прибыль, созданную интеллектуальной собственностью, нематериальных активов в качестве показателя.

Однако на известном уровне техники отсутствовал какой-либо надлежащий показатель для сравнения нематериальных активов, держателем которых является предприятие, с использованием общих технических документов, на которые ссылаются при принятии инвестиционных решений.

В частности, в области корпоративного управления, когда жизнеспособность предприятия находится под угрозой, существенно важным является наличие показателя, доступного для использования при исследовании стратегий применения патентов, который характеризует, в том числе, достаточно ли ценной является область техники для обеспечения гарантии фондов развития предприятия на ранней стадии нового выхода на рынок или в начало разработки новой продукции, следует ли подать заявку на патент, следует ли подать запрос на экспертизу, вероятность получения прав на технологию, являются ли переговоры по предоставлению лицензии предпочтительными с точки зрения рентабельности и т.п.

Следовательно, с учетом вышеизложенной ситуации, существующей в известном уровне техники, задачей этого изобретения является создание устройства вычисления подобия, программы вычисления подобия и способа вычисления подобия, которые предоставляют возможность сравнения групп технических документов в широкой области, не ограниченной публикациями патентов или подобными документами, между различными предприятиями и вычисления надлежащего подобия, соответствующего человеческому восприятию, и тем самым вычисления показателя, дающего возможность производить количественные и качественные оценки, а также оценки относительной стоимости нематериальных активов.

Другой задачей этого изобретения является создание устройства вычисления подобия, программы вычисления подобия и способа вычисления подобия, которые обеспечивают вычисление результатов сравнения для крупномасштабного подобия между первой группой технических документов и второй группой технических документов, не требуя больших объемов вычислений в течение длительных промежутков времени, с небольшой вероятностью того, что вычисленные значения подобия могут изменяться вследствие произвольного решения, принятого анализатором, который вычисляет подобие таким образом, что оно равно 0 только в том случае, когда первая группа технических документов и вторая группа технических документов являются совершенно различными, и который вычисляет подобие таким образом, что оно равно единице только в том случае, когда первая группа технических документов и вторая группа технических документов являются в точности одинаковыми.

Еще одной задачей этого изобретения является создание устройства вычисления подобия, программы вычисления подобия и способа вычисления подобия, которые могут выполнять вычисления подобия за сравнительно короткое время вычислений даже в том случае, когда общее количество технических документов, подлежащих сравнению, составляет несколько десятков тысяч или более.

Еще одной задачей этого изобретения является создание устройства вычисления подобия, программы вычисления подобия и способа вычисления подобия, которые способны производить крупномасштабное сравнение групп технических документов.

Еще одной задачей этого изобретения является создание устройства вычисления подобия, программы вычисления подобия и способа вычисления подобия, с которыми могут легко работать даже инвесторы и предприниматели общего профиля, которым нужно исследовать стоимость предприятия, выраженную через нематериальные активы.

Для решения вышеупомянутых проблем в этом изобретении предложено устройство вычисления подобия, вычисляющее показатель, по которому судят о техническом подобии между первой группой технических документов и второй группой технических документов, которые содержат патентные документы, технические отчеты или иные технические документы, отличающие тем, что содержит средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов для их сравнения; средство ввода технической информации, предназначенное для ввода технической информации, например ключевых слов или индексов Международной патентной классификации (МПК); средство кластерного анализа, предназначенное для поиска среди технических документов, содержащихся в первой группе технических документов и второй группе технических документов, тех технических документов, которые содержат введенную техническую информацию, и для кластеризации найденных технических документов по каждой технической информации; средство вычисления подобия, предназначенное для вычисления в качестве подобия отношения количества смешанных кластеров, содержащих технические документы из первой группы технических документов и из второй группы технических документов, к общему количеству кластеров, полученному в результате кластерного анализа; и средство вывода, предназначенное для вывода вычисленного подобия в средство записи, в средство визуального отображения или в средство связи.

Также для обеспечения решения вышеупомянутых проблем настоящее изобретение содержит

средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов для их сравнения;

средство ввода технической информации, предназначенное для ввода технической информации, например ключевых слов или индексов МПК;

средство кластерного анализа, предназначенное для поиска среди технических документов, содержащихся в первой группе технических документов и во второй группе технических документов, тех технических документов, которые содержат введенную техническую информацию, и для кластеризации найденных технических документов по каждой технической информации;

средство вычисления подобия, предназначенное для вычисления общего количества кластеров, полученных в результате кластерного анализа, и количества смешанных кластеров, содержащих технические документы из первой группы технических документов и из второй группы технических документов, а также для вычисления по всем смешанным кластерам суммы произведений значения первой поправки, которая принимает значение, соответствующее количеству технических документов, содержащихся в каждом смешанном кластере, и значения второй поправки, которая принимает значение, соответствующее состоянию смешения технических документов из первой группы технических документов и технических документов из второй группы технических документов в каждом смешанном кластере, и деления этой суммы на вычисленное общее количество кластеров для вычисления подобия; и

средство вывода, предназначенное для вывода вычисленного подобия в средство записи, в средство визуального отображения или в средство связи.

Также для обеспечения решения вышеупомянутых проблем настоящее изобретение содержит

средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов для их сравнения;

средство ввода технической информации, предназначенное для ввода технической информации, например ключевых слов или индексов МПК;

средство кластерного анализа, предназначенное для поиска среди технических документов, содержащихся в первой группе технических документов и во второй группе технических документов, тех технических документов, которые содержат введенную техническую информацию, и для кластеризации найденных технических документов по каждой технической информации;

средство вычисления подобия, предназначенное для вычисления общего количества кластеров, полученных в результате кластерного анализа, и количества смешанных кластеров, содержащих технические документы из первой группы технических документов и из второй группы технических документов, а также для вычисления по всем смешанным кластерам суммы значений поправки, пропорциональных количеству технических документов в каждом кластере в степени α (где 0<α), и деления этой суммы на вычисленное общее количество кластеров для вычисления подобия; и

средство вывода, предназначенное для вывода вычисленного подобия в средство записи, в средство визуального отображения или в средство связи.

Также для обеспечения решения вышеупомянутых проблем настоящее изобретение содержит

средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов для их сравнения;

средство ввода технической информации, предназначенное для ввода технической информации, например ключевых слов или индексов МПК;

средство кластерного анализа, предназначенное для поиска среди технических документов, содержащихся в первой группе технических документов и во второй группе технических документов, тех технических документов, которые содержат введенную техническую информацию, и для кластеризации найденных технических документов по каждой технической информации;

средство вычисления подобия, предназначенное для вычисления общего количества кластеров, полученных в результате кластерного анализа, и количества смешанных кластеров, содержащих технические документы из первой группы технических документов и из второй группы технических документов, а также для вычисления по всем смешанным кластерам суммы значений поправки, полученных путем деления количества технических документов в каждом кластере в степени α (где 0<α) на нормировочный коэффициент, например на среднее значение количества технических документов во всех кластерах, и деления этой суммы на вычисленное общее количество кластеров для вычисления подобия; и

средство вывода, предназначенное для вывода вычисленного подобия в средство записи, в средство визуального отображения или в средство связи.

Также для обеспечения решения вышеупомянутых проблем настоящее изобретение содержит

средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов для их сравнения;

средство ввода технической информации, предназначенное для ввода технической информации, например ключевых слов или индексов МПК;

средство кластерного анализа, предназначенное для поиска среди технических документов, содержащихся в первой группе технических документов и во второй группе технических документов, тех технических документов, которые содержат введенную техническую информацию, и для кластеризации найденных технических документов по каждой технической информации;

средство вычисления подобия, предназначенное для вычисления общего количества кластеров, полученных в результате кластерного анализа, и количества смешанных кластеров, содержащих технические документы из первой группы технических документов и из второй группы технических документов, а также для вычисления по всем смешанным кластерам суммы значений поправки, пропорциональных вероятности того, что будет найдено m технических документов из первой группы технических документов и n технических документов из второй группы технических документов, в степени γ (где 0<γ), для введения поправки в соответствии с вероятностью того, что в каждом смешанном кластере, полученном в результате кластерного анализа, содержится определенное количество технических документов из первой группы технических документов и из второй группы технических документов, и деления этой суммы на вычисленное общее количество кластеров для вычисления подобия; и

средство вывода, предназначенное для вывода вычисленного подобия в средство записи, в средство визуального отображения или в средство связи.

Также для обеспечения решения вышеупомянутых проблем настоящее изобретение содержит

средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов для их сравнения;

средство ввода технической информации, предназначенное для ввода технической информации, например ключевых слов или индексов МПК;

средство кластерного анализа, предназначенное для поиска среди технических документов, содержащихся в первой группе технических документов и во второй группе технических документов, тех технических документов, которые содержат введенную техническую информацию, и для кластеризации найденных технических документов по каждой технической информации;

средство вычисления подобия, предназначенное для вычисления общего количества кластеров, полученных в результате кластерного анализа, и количества смешанных кластеров, содержащих технические документы из первой группы технических документов и из второй группы технических документов, а также для вычисления по всем смешанным кластерам суммы значений поправки, полученных путем деления вероятности того, что будет найдено m технических документов из первой группы технических документов и n технических документов из второй группы технических документов, в степени γ (где 0<γ) на нормировочный коэффициент, для введения поправки в соответствии с вероятностью того, что в каждом смешанном кластере, полученном в результате кластерного анализа, содержится определенное количество технических документов из первой группы технических документов и из второй группы технических документов, и деления этой суммы на вычисленное общее количество кластеров для вычисления подобия; и

средство вывода, предназначенное для вывода вычисленного подобия в средство записи, в средство визуального отображения или в средство связи.

Настоящее изобретение также может отличаться тем, что нормировочный коэффициент равен максимальному значению вероятности того, что будет найдено m технических документов из первой группы технических документов и n технических документов из второй группы технических документов, в степени γ (где 0<γ).

Также для обеспечения решения вышеупомянутых проблем настоящее изобретение содержит:

средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов для их сравнения;

средство ввода технической информации, предназначенное для ввода технической информации, например ключевых слов или индексов МПК;

средство кластерного анализа, предназначенное для поиска среди технических документов, содержащихся в первой группе технических документов и во второй группе технических документов, тех технических документов, которые содержат введенную техническую информацию, и для кластеризации найденных технических документов по каждой технической информации;

средство вычисления подобия, предназначенное для вычисления общего количества кластеров, полученных в результате кластерного анализа, и количества смешанных кластеров, содержащих технические документы из первой группы технических документов и из второй группы технических документов, а также для вычисления по всем смешанным кластерам суммы значений поправки, пропорциональных отношению коэффициента N/M состава и коэффициента n/m смешения в степени ζ (где 0<ζ), для коэффициента N/M состава, равного отношению количества N технических документов, содержащихся во второй группе технических документов, к количеству M технических документов, содержащихся в первой группе технических документов, и для коэффициента n/m смешения, равного отношению количества n технических документов из второй группы технических документов к количеству m технических документов из первой группы технических документов, которые содержатся в каждом смешанном кластере, полученном в результате кластерного анализа, и деления этой суммы на вычисленное общее количество кластеров для вычисления подобия; и

средство вывода, предназначенное для вывода вычисленного подобия в средство записи, в средство визуального отображения или в средство связи.

Также для обеспечения решения вышеупомянутых проблем настоящее изобретение содержит

средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов для их сравнения;

средство ввода технической информации, предназначенное для ввода технической информации, например ключевых слов или индексов МПК;

средство кластерного анализа, предназначенное для поиска среди технических документов, содержащихся в первой группе технических документов и во второй группе технических документов, тех технических документов, которые содержат введенную техническую информацию, и для кластеризации найденных технических документов по каждой технической информации;

средство вычисления подобия, предназначенное для вычисления общего количества кластеров, полученных в результате кластерного анализа, и количества смешанных кластеров, содержащих технические документы из первой группы технических документов и из второй группы технических документов, и для вычисления значения математического ожидания того, что будет найден технический документ из первой группы технических документов, путем умножения вероятности того, что в группе технических документов, охватывающей первую группу технических документов и вторую группу технических документов, будет найден технический документ из первой группы технических документов, на количество технических документов, содержащихся в каждом смешанном кластере, и вычисления в качестве разности значений математического ожидания разности между значением математического ожидания и количеством технических документов из первой группы технических документов, содержащихся в каждом смешанном кластере, а также для вычисления по всем смешанным кластерам суммы значений поправки, полученных путем установления разности значений математического ожидания в качестве отрицательной экспоненты для произвольной постоянной ξ (где 1<ξ), и деления этой суммы на вычисленное общее количество кластеров для вычисления подобия; и

средство вывода, предназначенное для вывода вычисленного подобия в средство записи, в средство визуального отображения или в средство связи.

Также для обеспечения решения вышеупомянутых проблем настоящее изобретение содержит:

средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов для их сравнения;

средство ввода технической информации, предназначенное для ввода технической информации, например ключевых слов или индексов МПК;

средство кластерного анализа, предназначенное для поиска среди технических документов, содержащихся в первой группе технических документов и во второй группе технических документов, тех технических документов, которые содержат введенную техническую информацию, и для кластеризации найденных технических документов по каждой технической информации;

средство вычисления подобия, предназначенное для вычисления общего количества кластеров, полученных в результате кластерного анализа, и количества смешанных кластеров, содержащих технические документы из первой группы технических документов и из второй группы технических документов, и для вычисления значения математического ожидания того, что будет найден технический документ из первой группы технических документов, путем умножения вероятности того, что в группе технических документов, охватывающей первую группу технических документов и вторую группу технических документов, будет найден технический документ из первой группы технических документов, на количество технических документов, содержащихся в каждом смешанном кластере, и вычисления в качестве разности значений математического ожидания разности между значением математического ожидания и количеством технических документов из первой группы технических документов, содержащихся в каждом смешанном кластере, а также для вычисления по всем смешанным кластерам суммы значений поправки, полученных путем деления разности значений математического ожидания на количество технических документов в каждом смешанном кластере, и установления результата деления разности значений математического ожидания в качестве отрицательной экспоненты для произвольной постоянной ξ (где 1<ξ), и последующего деления этой суммы на вычисленное общее количество кластеров для вычисления подобия; и

средство вывода, предназначенное для вывода вычисленного подобия в средство записи, в средство визуального отображения или в средство связи.

Согласно настоящему изобретению устройство вычисления подобия, вычисляющее показатель, по которому судят о техническом подобии между первой группой технических документов и второй группой технических документов, каждая из которых содержит патентные документы, технические отчеты или иные технические документы, содержит

средство ввода групп технических документов, предназначенное для ввода первой группы технических документов и второй группы технических документов для их сравнения;

средство ввода технической информации, предназначенное для ввода технической информации, например клю