Способ электронного анализа диалога и система для осуществления этого способа

Иллюстрации

Показать все

Изобретение относится к средствам электронного оценивания диалога. Технический результат заключается в повышении эффективности оценивания диалога. Получают видеоданные, отображающие, по меньшей мере частично, двух людей. Анализируют видеоданные с целью определения, имеет ли место визуальное взаимодействие, по меньшей мере, между указанными двумя людьми в процессе диалога, включающее определение того, смотрят ли друг на друга, по меньшей мере, двое указанных людей, путем детектирования положения их зрачков. Анализируют микродвижения глаз, по меньшей мере, двух людей с целью определить, являются ли направления микродвижений глаз однотипными. 2 н. и 23 з.п. ф-лы, 15 ил.

Реферат

Область техники

Изобретение относится к способам электронного анализа диалога и к системам для осуществления таких способов.

Уровень техники

Способ данного типа известен из заявки US 2003/0097268, в которой описаны система и способ для анализа и оценивания болезненных признаков в поведении человека. Данный способ находит применение в области медицины, более конкретно при анализе интервью психиатрических пациентов. С этой целью регистрируется аудио- и видеоинформация, генерируемая пациентом, на основе которой с помощью компьютерной диагностики вырабатывается в качестве помощи лечащему врачу информация, касающаяся лечения или прогноза.

Однако известный способ неприменим к подлежащим анализу ситуациям, в которых участвует несколько человек, а не только один человек, такой как пациент. Подобная ситуация имеет место, например, когда анализируется разговор в процессе совершения продажи (далее - разговор о продаже) или интервью при приеме на работу. До настоящего времени с целью облегчения анализа обычно беседа или интервью снимались с помощью кинокамеры. Затем снятый фильм просматривался пользователем, например преподавателем семинара по продажам; кроме того, он просматривался и обсуждался с людьми, участвующими в диалоге (далее именуемыми также участниками диалога). Во время обсуждения пользователь отмечал сильные и слабые стороны индивидуальных участников, связанные с их поведением в отношении другого участника обсуждения или интервью.

Поскольку съемка каждого участника продолжается около 30 мин, человек, проводящий анализ, должен расходовать много времени, просматривая фильмы по каждому участнику. В связи с этим время, резервируемое на объяснение того, как участники могли бы улучшить свою технику заключения сделок или повысить шансы быть принятыми на работу, оставалось ограниченным.

Раскрытие изобретения

В связи с изложенным одна из задач, решаемых изобретением, состоит в создании способа и устройства, обеспечивающих автоматическую поддержку анализа диалога.

Решение этой задачи обеспечивается способом с признаками согласно п.1 прилагаемой формулы изобретения. Диалог между двумя или более людьми включает различные идентифицируемые коммуникационные паттерны, которые могут быть - с позиции одного человека (далее именуемого первым человеком) - определены, как "выслушивание", "переформулирование", "реагирование", "изложение" и "молчание". Каждый коммуникационный паттерн характеризуется тем, как высказывания участников диалога распределяются между ними:

- "выслушивание": первый человек молчит, тогда как другой говорит,

- "переформулирование": говорит, в основном, другой человек, тогда как первый человек время от времени осуществляет краткое вмешательство,

-"реагирование": говорит первый человек, но другой человек прерывает его, чтобы вмешаться,

- "изложение": говорит, в основном, первый человек, тогда как другой человек осуществляет краткое вмешательство,

- "молчание": никто не говорит.

Путем анализирования зарегистрированных аудиоданных с построением распределения высказываний, извлеченных электронным путем из принятых данных, можно автоматически идентифицировать различные вербальные коммуникационные паттерны диалога и выдать их пользователю системы, что будет соответствовать осуществлению способа согласно изобретению. Основываясь на этой дополнительно извлеченной информации, относящейся к диалогу, можно найти оценку зарегистрированного диалога. При этом можно будет, в частности, указать коммуникационные паттерны, которые не были использованы, не были использованы в достаточной мере или были слишком широко использованы участником (участниками) диалога.

В этом контексте используемый в описании термин "электронное оценивание" относится к автоматическому извлечению, с помощью электронных средств, характеристик взаимодействий, имеющих место во время диалога. Такое извлечение не основывается на анализе "вручную", простым прослушиванием высказываний участников.

Решение поставленной задачи обеспечивается также способом согласно п.2 формулы, который также является способом автоматического, в частности электронного, оценивания диалога, по меньшей мере, между двумя людьми. Данный способ включает следующие шаги: а) получение аудиоданных, воспроизводящих диалог, по меньшей мере, между двумя людьми,

d) идентифицирование заранее установленных фаз взаимодействия в процессе диалога на основе скользящего среднего значения времени, в течение которого говорит один человек, участвующий в диалоге.

Диалоги коммерческого характера, в частности беседы при заключении сделки, включают типичные фазы взаимодействия, такие как фаза презентации в начале и фаза подведения итогов в конце. Между этими фазами могут иметь место фаза выявления потребности, в течение которой лицо, осуществляющее продажу (продавец), слушает покупателя, фаза аргументирования, в течение которой говорит преимущественно продавец, предлагающий продукт, и фаза ответов на возражения, в течение которой покупатель выдвигает возражения против предложенного продукта, а продавец должен противопоставить им свои аргументы. В зависимости от контекста диалог может включать все эти фазы или только некоторые из них. Перечисленные фазы будут рассмотрены далее более подробно.

При наличии этого дополнительного шага способ автоматически снабжает пользователя вспомогательной информацией, в частности о присутствующих или отсутствующих фазах взаимодействия и/или о длительности этих фаз по отношению к диалога в целом. Эта информация важна, поскольку может быть использована для обучения человека (людей), участвовавшего (участвовавших) в диалоге с целью улучшить его (их) технику продаж или повысить шансы быть принятым (принятыми) на работу. Скользящее среднее значение времени, в течение которого говорит один человек, является удобным и надежным параметром для автоматической идентификации различных фаз согласно изобретению, поскольку оно определяет, кто говорит больше, что, в свою очередь, указывает, какая именно фаза имеет место. Кроме того, подобный анализ может проводиться в ходе диалога, т.е. он обеспечивает быстрые результаты.

Согласно предпочтительному варианту оба описанных способа можно скомбинировать, что позволит автоматически извлекать из одного комплекта аудиоданных более ценную информацию о качестве диалога и коммуникативных умениях его участников. Разумеется, скользящее среднее продолжительности периода, в течение которого говорит один человек, можно получить из распределения высказываний.

Идентификация может быть основана на обнаружении, по меньшей мере, одного перехода от одной фазы взаимодействия к другой. При этом данное обнаружение производится определением первого момента, в который скользящее среднее принимает первое граничное значение, и второго момента, в который скользящее среднее принимает второе граничное значение, причем указанный переход происходит во второй момент. Выход за пределы первого граничного значения подтверждает наличие определенной фазы. При обнаружении второго граничного значения (которое также должно быть пройдено), указывающего, что должно произойти изменение распределения высказываний, способ делает вывод, что фаза, идентифицированная в первый момент, завершается во второй момент. Такой вариант обработки данных стабилизирует анализ и определение различных фаз взаимодействия.

Первое граничное значение предпочтительно составляет 60-80%, в частности 65%, для фаз, в течение которых один человек, участвующий в диалоге, говорит больше другого человека. Для фаз, в течение которых один человек, участвующий в диалоге, говорит меньше другого человека, это значение предпочтительно составляет 20-40%, в частности 35%. Второе граничное значение составляет 45-55%, в частности 50%. При таком выборе указанных значений обеспечивается стабильное определение перехода от одной фазы к следующей.

Указанное среднее значение рассчитывают на временном интервале, составляющем около 3-10% общей продолжительности диалога, в частности 5% указанной продолжительности. Такой выбор обеспечивает стабильное определение с целью идентификации перехода от одной фазы к следующей.

Описанные способы могут дополнительно включать шаг определения того, находится ли длительность фаз взаимодействия в заранее установленных пределах. В данном варианте способ не только позволяет автоматически получить качественную оценку качества диалога, но и ее количественную меру. Это позволит лицу, анализирующему диалог, возможность выделить слишком долгие или недостаточно долгие фазы.

Согласно предпочтительному варианту шаг е) способа по изобретению может включать также анализ аудиоданных с целью идентификации заранее выбранных слов в высказываниях, по меньшей мере, двух людей, в частности только в высказывании одного, заранее выбранного человека. Эта дополнительная информация в еще большей степени улучшает качество автоматически генерируемой оценки диалога. Употребление конкретных слов немедленно свидетельствует о том, используют ли участники диалога слова, наиболее подходящие к конкретной ситуации. Например, если продавец продает новый продукт, обычно существуют заранее подобранные слова, относящиеся к данному продукту, например торговое наименование, конкретные свойства и/или достоинства. В случае оценивания торговых умений продавца может оказаться достаточным анализировать только его высказывания.

Способ предпочтительно включает также шаг f) анализа, в частности подсчета, появлений заранее выбранных слов в одной или более идентифицированных фазах взаимодействия. Применительно к рассмотренной выше ситуации продажи конкретная терминология, относящаяся к продаваемому продукту, должна преимущественно появляться в фазах "аргументирования" и "ответов на возражения". Если этого не происходит, значит, диалог не очень хорошо организован продавцом. Эта важная информация, которая автоматически обеспечивается способом по изобретению, служит дополнительной поддержкой для пользователя системы при оценивании диалогов.

Аудиоданные предпочтительно включают потоки данных от различных микрофонов, в частности от микрофонов, каждый из которых ассоциирован только с одним человеком из указанных, по меньшей мере, двух людей и сконфигурирован таким образом, что интенсивность сигнала, поступающего от одного человека, когда он говорит, превышает интенсивность сигнала от остальных людей. Наличие более чем одного микрофона облегчает построение распределения высказываний. Чтобы идентифицировать, кто говорит в данный момент, достаточно проанализировать интенсивности сигналов потоков аудиоданных в предположении, что интенсивность сигнала превышает определенный порог, когда говорит человек, ближайший к соответствующему микрофону, а сумма шума и сигнала, генерируемого другим человеком (другими людьми), не превышает этого порога.

Способ по изобретению может включать также шаг g) получения видеоданных, отображающих, по меньшей мере частично, двух людей, и шаг h) анализа видеоданных с целью определения, имеет ли место визуальное взаимодействие, по меньшей мере, между указанными двумя людьми. Термин "визуальное взаимодействие" означает, что, по меньшей мере, один из участников диалога смотрит на другого участника. В этом случае оценивание диалога основывается не только на взаимодействии между людьми, участвующими в диалоге, согласно аудиоданным, но, в дополнение, на визуальном взаимодействии, по меньшей мере, между двумя людьми, которое также устанавливается автоматически, в частности электронным путем, с использованием видеоданных. Следовательно, пользователь получает более полный массив данных для оценивания диалога.

Решение задачи, поставленной перед изобретением, обеспечивается также способом согласно п.11. Лицо, анализирующее диалоги, использует не только анализ аудиоданных: видеоданные как самостоятельный источник также дают ценную информацию о правильном поведении людей во время диалога, например касающегося продажи. Автоматическое (электронное) определение наличия или отсутствия визуального взаимодействия может быть полезным для пользователя, поскольку визуальное взаимодействие дает информацию о каналах невербальной коммуникации. Так, оно может указывать на интерес одного человека к утверждениям другого или на способность одного человека привлечь внимание другого.

В описанных выше способах шаг h) предпочтительно включает также определение того, смотрят ли друг на друга, по меньшей мере, двое из людей, путем детектирования положения их зрачков. Ситуация, в которой один человек смотрит на другого, в дальнейшем именуется "фокусирование". Она соответствует состоянию, в котором поток вербальной информации, направленный от одного человека к другому, поддерживается невербальным взаимодействием. Наличие подобного взаимодействия обеспечивает анализатору диалога дополнительную поддержку. В разговоре, связанном с продажей (далее - разговор о продаже), важной информацией в отношении фокусирования является а) как долго продавец смотрит на покупателя, b) как долго покупатель смотрит на продавца и с) как долго они одновременно смотрят друг на друга. Когда участники ведут себя сходным образом в отношении фокусирования, принимается, что они находятся в синхронизированном состоянии.

Желательно также, чтобы описанные способы включали шаг i) анализа микродвижений глаз, по меньшей мере, двух людей с целью определить, являются ли направления микродвижений глаз однотипными. Микродвижения важны, когда наблюдается отсутствие фокусирования. Известно, что микродвижения глаз существуют и что они дают информацию о восприятии. Известно также, что возможна синхронизация микродвижений глаз двух человек во время диалога и что она способствует благоприятному исходу разговора. Фиксирование автоматически и электронным путем микродвижений глаз участников диалога и определение того, синхронизированы они или нет, снабжает пользователя способа дополнительным параметром, который он может использовать для оценивания. В частности, пользователь, например преподаватель на семинаре, может указать на отсутствие синхронизации в разговоре о продаже и отметить, что продавец не использовал возможное средство коммуникации. В этом контексте микродвижения глаз - это движения зрачка в одном из следующих шести направлений: вверх и влево, вверх и вправо, влево, вправо, вниз и влево; вниз и вправо.

Согласно предпочтительному варианту описанные способы могут включать определение того, являются ли направления микродвижений глаз однотипными, по меньшей мере, в одной заранее установленной фазе взаимодействия. Во время разговора о продаже различные фазы имеют неодинаковую важность для успеха переговоров. Поэтому, после того как из потока аудиоданных выделены различные фазы взаимодействия, становится возможным связать между собой синхронизированные - как путем фокусирования, так и микродвижениями одного типа - и несинхронизированные периоды данных фаз. Это позволяет снабдить пользователя еще более полными данными о диалоге.

Шаг h) предпочтительно включает шаг h_1) идентифицирования визуальных признаков в кадре в составе видеоданных с целью определения в кадре зоны, отображающей, по меньшей мере, часть лица, в частности, по меньшей мере, оба глаза, по меньшей мере, одного из двух людей, шаг h_2) изолирования в указанной зоне полосок, в частности вертикальных, и шаг h_3) поиска внутри полосок областей, соответствующих глазам. Путем разбиения шага анализа на три четко различимых шага процесс определения, имеет ли место визуальное взаимодействие, по меньшей мере, между двумя людьми, может быть реализован надежно и быстро. Указанные кадры предпочтительно отображают оба глаза, по меньшей мере, одного человека.

Согласно изобретению способ реализует простой, но надежный вариант идентификации в видеоданных области, соответствующей глазам, путем разбиения анализа на несколько дискретных шагов. Как уже упоминалось, эти шаги включают шаг h_1) идентифицирования визуальных признаков в кадре в составе видеоданных с целью определения в кадре зоны, отображающей, по меньшей мере, часть лица, в частности, по меньшей мере, оба глаза, по меньшей мере, одного из двух людей, шаг h_2) изолирования в указанной зоне полосок, в частности вертикальных, и шаг h_3) поиска внутри полосок области, соответствующей глазу.

Шаг h_1) описанных способов предпочтительно включает выявление в кадре, по меньшей мере, одной зоны, имеющей цвет, соответствующий цвету кожи, и выбор наибольшей зоны среди подобных зон. В этом случае поток видеоданных является цветным, так что наличие фонов различных цветов облегчает выполнение шага идентифицирования визуальных признаков. Для получения интересующих данных путем выделения пикселей, соответствующих цвету кожи, может быть использована соответствующая маска.

Шаг h_2) способов предпочтительно включает идентифицирование областей падения интенсивности в пределах выявленной наибольшей области. При этом интенсивность пикселей в таких областях должна быть меньше заранее установленного предельного значения, которое является функцией максимальной интенсивности в данной области, а каждая полоска включает одну область. Области падения интенсивности в изображении, обработанном посредством маски, имеющей цвет кожи, обусловлены присутствием глаз и, следовательно, являются надежными индикаторами их положения. Если идентифицирована только одна такая область, способ по изобретению заключает, что может быть определено положение только одного глаза.

Описанные способы предпочтительно включают идентифицирование контуров внутри полосок, в частности, путем их преобразования в формат по серой шкале. После того как полоски были идентифицированы, обрабатывают только эти области, причем с целью идентификации контуров определяют градиент по серой шкале. Таким образом, учитывается то обстоятельство, что глаза человека образуют контуры, легко идентифицируемые при использовании серой шкалы.

Согласно предпочтительному варианту шаг h_2) может включать также поиск возможных центров идентифицированных контуров путем поиска кругов, которые могут соответствовать зрачку. Такой поиск может производиться определением относительных весов их интенсивностей по серой шкале в видеоданных в пределах контуров с заранее установленным цветом, предпочтительно черным. Данный анализ основывается на гипотезе, что зрачок является более темным, чем другие элементы лица. Эта гипотеза позволяет различать области падения интенсивности, соответствующие глазам и другим артефактам, например присутствию волос или, например, таким элементам, как морщины. Тем самым обеспечивается надежный способ идентификации полосок, содержащих области, соответствующие глазу.

Способы предпочтительно включают также шаг h_4) идентифицирования (как это было описано выше) положения зрачка в области, соответствующей глазу, путем поиска кругов, которые могут соответствовать зрачку, в частности определением относительных весов их интенсивностей по серой шкале в видеоданных в пределах контуров с заранее установленным цветом, предпочтительно черным. Положение зрачка дает информацию, необходимую, чтобы определить, имеет ли место визуальное взаимодействие во время диалога и, в частности, когда определены положения зрачков двух людей, смотрят ли эти люди друг на друга.

Применительно, по меньшей мере, к следующему кадру в составе видеоданных повторяют только шаг h_4) с целью идентификации положения зрачка в области, соответствующей глазу, за исключением случаев, когда положение зрачка не детектируется. Такой подход ускоряет процесс вычислений, так как не требует повторения шагов h_1)-h_3) для каждого кадра. Данные шаги выполняют, только если при выполнении шага h_4) не удается детектировать положение зрачка.

Согласно предпочтительному варианту видеоданные содержат потоки данных от различных камер, установленных в различных положениях по отношению к людям, участвующим в диалоге. Такая схема дает достаточно данных, чтобы осуществить трехмерный анализ по двумерным видеоданным и тем самым повысить качество информации о визуальном взаимодействии, в частности, при определении, смотрят ли два человека друг на друга.

Каждая камера предпочтительно снимает только одного человека. Это дополнительно облегчает обработку данных и ускоряет процесс определения. Действительно, поскольку каждый поток данных гарантированно относится только к одному человеку, достаточно производить поиск только двух полосок, включающих контуры, которые могут соответствовать контурам глаз. Камеры предпочтительно устанавливают так, что каждая камера расположена под тем же или близким углом к углу поля зрения другого человека.

Шаги h) и/или i) могут выполняться во временном интервале, более коротком, чем временной интервал между двумя кадрами видеоданных. Это гарантирует, что пользователь будет иметь необходимую информацию о поведении участника (участников) диалога немедленно по завершении диалога.

Способы по изобретению могут дополнительно включать шаг j) хранения результатов, полученных на шагах с), и/или d), и/или h), и/или i). В результате пользователь может получать доступ к результатам, когда они ему нужны. В частности, желательно хранить результаты в базе данных, которая позволяет проводить сравнение различных диалогов одного и того же участника (одних и тех же участников) и/или различных людей, оценка диалогов которых была произведена ранее. Благодаря этому технику продажи одного и того же человека можно прослеживать на протяжении нескольких сессий.

Изобретение относится также к компьютерному программному продукту, содержащему одну или более машиночитаемых сред, в которых записаны компьютерные команды, обеспечивающие выполнение шагов описанных выше способов. Изобретение относится также к запоминающей среде, содержащей указанный компьютерный программный продукт.

Изобретение относится также к системам для осуществления любого из описанных способов. При этом при использовании системы согласно п.18 формулы изобретения задача, поставленная перед изобретением, решается столь же эффективно, как и посредством способа согласно п.1.

Устройство обработки данных предпочтительно сконфигурировано с возможностью идентификации заранее выбранных слов в высказываниях, по меньшей мере, двух людей. Появление конкретных слов немедленно указывает, что, по меньшей мере, один из участников диалога использует терминологию, наиболее подходящую к ситуации. Например, когда продавец продает новый продукт, заранее выбранные слова обычно относятся к этому продукту, например к его торговому наименованию, особым свойствам и/или преимуществам.

Желательно обеспечить по одному микрофону на каждого человека, участвующего в диалоге. В этом случае каждый микрофон сконфигурирован так, что интенсивность сигнала от соответствующего человека, когда он говорит, превышает интенсивность сигнала от остальных людей. Такое выполнение облегчает анализ, поскольку определить, говорит ли данный человек или нет, можно просто проверкой, превышает ли сигнал, генерируемый соответствующим микрофоном, заданный пороговый уровень, причем уровень шумов или сигнал от высказываний других людей находятся ниже этого уровня.

Согласно одному варианту система может дополнительно содержать, по меньшей мере, одну видеокамеру для генерирования видеоданных, по меньшей мере, частично отображающих, по меньшей мере, двух людей во время диалога. При этом устройство обработки сконфигурировано с возможностью определять, имеет ли место во время диалога визуальное взаимодействие, по меньшей мере, между двумя людьми. В данном случае становится возможным анализировать как вербальные, так и невербальные взаимодействия с целью получения более детальной оценки человека, участвующего в диалоге. В частности, могут быть выявлены синергетические эффекты между вербальными и невербальными взаимодействиями, а также коммуникационные каналы. Для этого, например, можно объединить информацию по распределению высказываний с параметром фокусирования и микродвижений, чтобы идентифицировать фазы, в которых оба участника находятся в синхронизированном состоянии, т.е. каждый участник, когда он слушает и говорит, обнаруживает тот же тип поведения, что и другой участник.

Желательно сконфигурировать устройство обработки данных с возможностью детектирования в видеоданных, содержащих множество последовательных кадров, положения глаз, в частности зрачков, человека, участвующего в диалоге. Этого можно достичь путем идентифицирования в кадре визуальных признаков с целью определения зоны кадра, отображающей, по меньшей мере, часть лица, в частности, по меньшей мере, оба глаза, человека, выделением в указанной зоне, в частности, вертикальных полосок и поиска внутри полосок областей, соответствующих глазам, при условии, что на шаге h_2) выделено более одной полоски. Благодаря разбиению шага анализа на несколько шагов можно сократить суммарное время, необходимое для определения положения глаза.

Согласно предпочтительному варианту для каждого человека, участвующего в диалоге, обеспечивается по одной видеокамере. При этом видеокамеры установлены так, что каждая камера снимает только одного человека. Это дополнительно облегчает обработку данных, поскольку один поток данных отображает только одного человека, так что поиск нужно производить только в отношении одной пары глаз.

Краткое описание чертежей

Конкретные варианты изобретения станут более понятны из нижеследующего описания и прилагаемых чертежей.

На фиг.1 представлен первый вариант системы согласно изобретению.

На фиг.2 представлена блок-схема, иллюстрирующая способ по второму варианту изобретения.

Фиг.3а-3е иллюстрируют различные коммуникационные паттерны, имеющие место во время диалога.

На фиг.4 представлена вторая блок-схема, иллюстрирующая способ по третьему варианту изобретения.

Фиг.5 иллюстрирует принцип определения переходов между фазами взаимодействия.

На фиг.6 представлена третья блок-схема, иллюстрирующая способ по четвертому варианту изобретения.

На фиг.7 представлена система согласно пятому варианту изобретения.

На фиг.8 представлена четвертая блок-схема, иллюстрирующая способ по шестому варианту изобретения.

На фиг.9 представлена пятая блок-схема, иллюстрирующая способ по седьмому варианту изобретения.

На фиг.10a-10d иллюстрируются результаты различных шагов (соответствующих седьмому варианту) с целью идентификации положения области, соответствующей глазу.

На фиг.11 представлена шестая блок-схема, иллюстрирующая способ по восьмому варианту изобретения.

На фиг.12 представлена система согласно девятому варианту изобретения.

Осуществление изобретения

В дальнейшем описании различные варианты системы по изобретению, предназначенной для автоматического, в частности электронного, оценивания диалога, по меньшей мере, между двумя людьми, и различные варианты соответствующего способа будут рассмотрены на примере связанного с продажей разговора между продавцом (первым человеком, т.е. первым участником диалога) и покупателем (вторым человеком). Разумеется, изобретение применимо и к автоматическому оцениванию разговоров (диалогов) других типов, например интервью при найме на работу. Хотя все варианты будут рассмотрены применительно к разговору между двумя людьми, они могут быть распространены на разговоры с участием более двух людей.

Первый вариант

На фиг.1 представлен первый вариант системы для электронного оценивания диалога, по меньшей мере, между двумя людьми. Система 1 содержит первый и второй микрофоны 3, 5, которые подключены к устройству 7 обработки данных. Микрофоны 3 и 5 установлены вблизи мест 9, 11 соответственно, которые могут занимать продавец и покупатель. Такое расположение микрофонов 3, 5 гарантирует, что интенсивность сигнала, генерируемого в результате высказываний человека, сидящего на месте, ближайшем к микрофону (т.е. на месте 9 для микрофона 3 и на месте 11 для микрофона 5), выше, чем интенсивность сигнала, генерируемого в результате высказываний человека, сидящего на другом месте, а также выше интенсивности фонового шума. Это обстоятельство учитывается в ходе анализа устройством 7 обработки данных, которое однозначно отождествляет аудиосигналы с человеком, сидящим на месте 9, или с человеком, сидящим на месте 11. Система 1 может быть адаптирована для случая разговора более двух человек установкой дополнительных микрофонов.

Устройство 7 обработки данных содержит первый процессорный блок 13, который принимает атрибутированные высказывания. Данный блок 13 сконфигурирован с возможностью строить на основе атрибутирования высказываний распределение во временном домене высказываний двух человек в процессе диалога. Первый процессорный блок 13 способен также сравнивать результаты этого шага анализа с заранее установленными коммуникационными паттернами (которые будут рассмотрены далее) с целью идентификации одного или более коммуникационных паттернов в диалоге, например в разговоре о продаже между человеком, сидящим на месте 9, и человеком, сидящим на месте 11 (см. также второй вариант).

Устройство 7 обработки данных содержит, кроме того, второй процессорный блок 15, также принимающий соответствующие аудиоданные и сконфигурированный с возможностью идентифицирования заранее установленных фаз взаимодействия в процессе диалога на основе скользящего среднего значения времени, в течение которого говорит один человек, участвующий в диалоге. Это скользящее среднее значение определяют непосредственно из аудиоданных, а именно по результатам атрибутирования высказываний, выполняемого устройством 7 обработки данных. Фазы взаимодействия и порядок их автоматической идентификации с помощью системы 1 будут описаны далее (применительно к третьему варианту).

В качестве дополнительного компонента устройство 7 обработки данных содержит третий процессорный блок 17, сконфигурированный с возможностью идентифицирования заранее выбранных слов в высказываниях человека, сидящего на месте 9, и/или человека, сидящего на месте 11.

Результаты, полученные первым, вторым и третьим процессорными блоками 13, 15 и 17, могут сохраняться в запоминающем устройстве 19 и/или выдаваться через пользовательский интерфейс (не изображен) участникам разговора о продаже и/или третьему человеку, например преподавателю на семинаре.

Система 1 согласно изобретению может применяться для автоматического оценивания диалогов, таких как упомянутые разговоры о продаже, с выдачей результатов количественного анализа протекания диалога. Подобные количественные данные помогают пользователям, например преподавателям семинара по проведению продаж, поскольку, сразу после того как был зарегистрирован диалог между двумя его участниками, пользователь располагает ценной информацией о том, как участник/участники справились с данным диалогом.

В других вариантах система 1 может содержать не все три процессорных блока, а только один или два.

Второй вариант

Фиг.2 иллюстрирует, как система 1 используется для оценивания диалога, и соответственно иллюстрирует способ согласно изобретению для автоматического, более конкретно электронного, оценивания диалога, по меньшей мере, между двумя людьми. Для осуществления данного способа используется система 1.

Шаг S1 второго варианта состоит в получении аудиоданных, принимаемых микрофонами 3 и 5 системы 1, показанной на фиг.1.

Следующий шаг S2 состоит в анализе этих аудиоданных, имеющих вид двух раздельных потоков, чтобы произвести атрибутирование во временном домене высказываний первого человека и второго человека. Подобный анализ выполняет устройство 7 обработки данных.

Отнесение высказываний соответствующим участникам диалога основано на фильтрации интенсивности воспринятых сигналов в каждом потоке аудиоданных. Если сигнал, превышающий порог, соответствует потоку данных от микрофона 3, первый процессорный блок 13 решает, что говорит человек, находящийся на месте 9. Если же интенсивность сигнала ниже указанного порога, принимается решение, что этот человек не говорит, а воспринятый сигнал обусловлен фоновым шумом и/или высказыванием другого человека, сидящего на месте 11. Такой же анализ выполняется и для второго потока данных от микрофона 5, причем, если сигнал превышает порог, высказывание приписывается человеку, сидящему на месте 11. Данный способ прост в осуществлении, но при этом надежен. В частности, с его помощью можно идентифицировать ситуацию, когда оба человека говорят одновременно.

По завершении атрибутирования высказываний двух человек во временном домене становится возможным извлечь дополнительную информацию, характеризующую качество разговора между двумя людьми. Прежде всего появляется возможность определить коммуникационные паттерны, имеющие место в ходе диалога, такого как разговор о продаже. Различные коммуникационные паттерны диалога между продавцом и покупателем иллюстрируются фиг.3.

Фиг.3а иллюстрирует коммуникационный паттерн "выслушивания". Серые блоки на временной оси (оси t) иллюстрируют на этой фигуре высказывания, тогда как отсутствие этих блоков указывает, что соответствующий человек не говорит. Паттерн "выслушивания" характеризуется тем, что продавец (первый человек) молчит, а говорит покупатель (второй человек).

Второй коммуникационный паттерн (фиг.3b) соответствует паттерну "переформулирования". Согласно этому паттерну говорит, в основном, второй человек (покупатель), тогда как первый человек кратко вмешивается только время от времени. Как правило, первый человек может выражать свое согласие или повторять ключевое слово или группы ключевых слов.

Фиг.3с иллюстрирует паттерн "реагирования". Согласно этому паттерну говорит первый человек, но второй человек прерывает его, чтобы вмешаться. Здесь возникает ситуация, когда говорят оба человека, причем в типичной ситуации продолжает говорить второй человек. В этом случае правильная реакция продавца состояла бы в том, чтобы остановиться как можно скорее, чтобы позволить покупателю выразить свои мысли.

На фиг.3d представлен паттерн "изложения". Здесь говорит, в основном, первый человек, тогда как второй человек только вмешивается время от времени.

Наконец, на фиг.3е представлен паттерн "молчания", когда никто не говорит.

Хороший продавец должен быть способен активно использовать пять различных паттернов в зависимости от ситуации, в которой он оказывается в процессе разговора. Если продавец эффективно применяет свои коммуникативные умения, он будет способен продемонстрировать ценность продукта, который он пытается продать, с учетом ожиданий и поведения своего собеседника, покупателя.

Возвращаясь ко второму варианту изобретения, по завершении анализа атрибутированных высказываний на шаге S2 устройство 7 обработки данных (его первый процессорный блок 13) переходит на шаг S3 для идентифицирования различных коммуникационных паттернов типа описанных выше. Оно производится путем построения распределения высказываний между двумя людьми, основанного на атрибутировании, определенного на шаге S2. Это распределение затем сравнивают с различными моделями коммуникационных паттернов.

Соответствующий результат используют, чтобы определить на шаге S4 статистику по количеству наблюдений каждого паттерна, их длительности, а также определить, не слишком ли велик был в паттерне реагирования временной интервал, в течение которого говорили оба человека, и т.д.

Если продавец не использует или только плохо использует один или более паттернов в ходе проводимых им разговоров, пользователь системы, например преподаватель на семинаре, может немедленно обнаружить отсутствие соответствующего коммуникационного паттерна и отметить, что продавец не использует все имеющиеся у него возможности в отношении коммуникационных паттернов или