2668062 - Способы и системы для обработки диалога с роботом

Способы и системы для обработки диалога с роботом

Иллюстрации

Показать все

Изобретение относится к области обработки синтеза речи и интерактивных диалогов. Техническим результатом является обеспечение возможности регулировки формы и/или содержания диалогового контента, произносимого человекоподобным роботом. Раскрыт реализуемый компьютером способ обработки звукового диалога между роботом и человеком-пользователем, причем этот способ содержит: во время упомянутого звукового диалога прием звуковых данных и преобразование упомянутых звуковых данных в текстовые данные; в ответ на верификацию одного или нескольких правил выполнения диалогового режима для упомянутых текстовых данных выбор модифицированного диалогового режима; причем диалоговый режим содержит один или несколько вариантов диалогового контента и один или несколько вариантов диалоговой речи; причем вариант диалогового контента содержит набор предварительно заданных высказываний, причем упомянутый набор содержит вопросительные высказывания и ответные высказывания; и причем вариант диалоговой речи содержит параметры воспроизведения речи, содержащие частоту, тон, скорость и высоту звука; причем упомянутые один или несколько вариантов диалогового контента и/или вариантов речи записывают или редактируют в режиме онлайн с использованием веб-платформы; при этом один или несколько предварительно заданных вариантов диалогового контента и/или вариантов речи модифицируются множеством сторон; при этом один или несколько вариантов диалогового контента или их выбор модерируют применением одного или нескольких фильтров, причем упомянутые фильтры содержат черные списки одного или нескольких слов, белые списки одного или нескольких слов и/или правила выполнения диалогового режима; при этом регулирование использования упомянутых одного или нескольких вариантов диалогового контента и/или вариантов речи для конечного диалога, выражаемого роботом, содержит использование способов защищенной загрузки. 3 н. и 16 з.п. ф-лы, 2 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ

Настоящий патент относится к области обработки цифровых данных и, более конкретно, к обработке синтеза речи и интерактивных диалогов, конкретно, в специфическом контексте разговора между роботом и человеком-пользователем.

УРОВЕНЬ ТЕХНИКИ

Роботы-товарищи предпочтительно могут устанавливать эмоциональные взаимоотношения с людьми. Динамические видоизменения диалогов с помощью речи или вариантов воспроизведения диалога могут обеспечить разнообразные варианты взаимодействия.

Существующие системы для синтеза речи или голоса являются в большинстве своем пассивными и однообразными: помимо нескольких опций, таких как выбор мужского или женского голоса, тон механизма генерации речи является скорее нейтральным. Кроме того, обеспечиваемые ответы испытывают недостаток в культурных отсылках. Более точно, целью систем с речевыми ответами для промышленности или массового рынка является обеспечение повсеместно принятых ответов, т.е., обеспечение как можно более широкого понимания ответов. Это предполагает устранение любых контекстуальных и, тем более, культурных отсылок. Речевые команды обычно ограничены конкретными вариантами контекста. Например, программное обеспечение для речевого ввода обычно используется в контексте автономного программного приложения (например, программного обеспечения для обработки текстов). Согласно некоторым характеристикам доступности, все в большей степени обеспечиваемым современными операционными системами, пользователи могут использовать речевые команды для выполнения некоторых действий (например, запуска приложения, копирования и вставки, и т.д.). Эти предварительно заданные действия являются довольно ограниченными. Такие режимы визуального или звукового взаимодействия являются обычно пассивными (например, пользователи активно отдают приказы, а машина исполняет эти приказы). Даже с появлением последних моделей взаимодействия с компьютерами, таких как, например, модели, реализованные в системах с ответами, между машиной и пользователем возможны ограниченные варианты взаимодействий.

В контексте человекоподобного робота-товарища, модель взаимодействия с людьми-пользователями существенно отличается от модели взаимодействия с персональными компьютерами (и другими их формами). Когнитивное взаимодействие с роботом фундаментально отличается от взаимодействия с планшетным персональным компьютером или смартфоном. Конкретно, способность модулировать синтез речи робота может быть выгодным, если не ключевым, для обеспечения разнообразных вариантов взаимодействия, что, в свою очередь, может обеспечить возможность сбора релевантных данных и улучшения услуг, обеспечиваемых роботом или подключенными устройствами.

Существует потребность в способах и системах обработки синтеза речи (формы) и соответствующих интерактивных диалогов (содержания), конкретно, в специфическом контексте разговора между роботом и человеком-пользователем.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Раскрыт реализуемый компьютером способ обработки звукового диалога между роботом и человеком-пользователем, причем этот способ содержит: во время упомянутого звукового диалога, прием звуковых данных и преобразование упомянутых звуковых данных в текстовые данные; в ответ на верификацию одного или нескольких правил выполнения диалогового режима для упомянутых текстовых данных, выбор модифицированного диалогового режима; причем, диалоговый режим содержит один или несколько вариантов диалогового контента и один или несколько вариантов диалоговой речи; причем вариант диалогового контента содержит набор предварительно заданных высказываний, причем упомянутый набор содержит вопросительные высказывания и ответные высказывания; и, причем, вариант диалоговой речи содержит параметры воспроизведения речи, содержащие частоту, тон, скорость и высоту звука.

В одном развитии, способ дополнительно содержит выполнение упомянутого выбранного модифицированного диалогового режима.

В одном развитии, модифицированный диалоговый режим получают посредством модификации текущего варианта диалогового контента и/или текущего варианта диалоговой речи из текущего диалога.

В одном развитии, этап модификации текущего варианта диалогового контента содержит использование синонимов слов упомянутого варианта диалогового контента и применение синтаксических модификаций, содержащих вставку или перестановку или замену одного или нескольких слов упомянутого варианта диалогового контента.

В одном развитии, этап модификации текущего варианта диалоговой речи содержит модификацию частоты и/или тона и/или скорости и/или высоты звука текущего варианта диалоговой речи.

В одном развитии, модифицированный диалоговый режим получают посредством активации предварительно заданного диалогового режима, причем упомянутый предварительно заданный диалог выбирают по одному или нескольким правилам выполнения диалога, и упомянутый предварительно заданный диалоговый режим содержит предварительно заданный вариант диалогового контента и/или предварительно заданный вариант диалоговой речи.

В одном развитии, правило выполнения диалогового режима является зависимым от среды, воспринимаемой роботом.

В одном развитии, правило выполнения диалогового режима содержит параметры, выбранные из списка, содержащего возраст пользователя, пол пользователя, настроение пользователя, эмоцию пользователя, количество пользователей, историю взаимодействия с пользователем, предпочтения пользователя, пространственное местоположение робота и/или пользователя, жест или комбинацию жестов робота и/или пользователя, событие, обнаруженное в среде робота, локальную погоду, геолокацию, дату, время и их комбинации.

В одном развитии, правило выполнения диалогового режима динамически извлекают из интернета, и/или оно конфигурируется пользователем.

В одном развитии, один или несколько вариантов диалогового контента или их выбор модерируют применением одного или нескольких фильтров, причем упомянутые фильтры содержат черные списки одного или нескольких слов, белые списки одного или нескольких слов и/или правила выполнения диалогового режима.

В одном развитии, вариант диалогового контента и/или вариант диалоговой речи выбирают посредством речевой команды или пользовательского запроса.

В одном развитии, способ дополнительно содержит идентификацию отсутствующего диалогового режима, извлечение и установку упомянутого отсутствующего диалогового режима в роботе во время диалога с пользователем. В одном развитии, способ дополнительно содержит прием подтверждения пользователя перед выполнением выбранного диалогового режима. В одном развитии, способ дополнительно содержит прием сообщения обратной связи от пользователя после выполнения модифицированного диалогового режима. В одном развитии, этапы способа могут быть итерированы (например, диалоговый режим может быть дополнительно модифицирован).

Раскрыта компьютерная программа, содержащая инструкции для выполнения одного или нескольких этапов этого способа, когда упомянутая компьютерная программа исполняется на подходящем компьютерном устройстве или роботизированном устройстве. Раскрыта система, система, содержащая средство, выполненное с возможностью выполнения одного или нескольких этапов этого способа.

Робот-товарищ обычно является многорежимным. Речевые взаимодействия образуют критическую часть взаимодействия с пользователями, наряду с перемещениями, которые характеризуют робота, в отличие от персонального компьютера и других его форм. Диалоги между пользователем и роботом могут улучшить или персонализировать взаимодействия и, в конечном счете, улучшить восприятие пользователя. В одном варианте осуществления, робот адаптируется к текущему воспринимаемому контексту посредством видоизменений своих диалоговых режимов. Робот, например, может обратиться к иностранцу «Господин» или может использовать фамилию человека, если это разрешалось раньше, может говорить более или менее формально в зависимости от пользователей и/или контекста. Конкретные слова также могут фильтроваться в зависимости от пользователей, истории, информации обратной связи, вариантов настроения, местоположения, даты и времени (например). Когда человек не понимает высказывание, робот может повторить его медленнее и/или с использованием синонимов, если его попросят сделать это или по своей собственной инициативе. Робот также может обучаться предпочтениям пользователя (говорить более или менее быстро с использованием лексики пользователя), что может улучшить настроение пользователя.

Предпочтительно, робот может реализовать расширения новых языков, что делает каждого робота уникальным, инициировать положительные эмоции и, таким образом, укрепить взаимоотношения робота с людьми.

Предпочтительно, согласно некоторым вариантам осуществления, взаимодействие человек-машина является активным и больше не пассивно: робот, с точки зрения человека, может брать на себя некоторые инициативы (например, робот может задавать вопросы, например, в целях устранения неоднозначности). Кроме того, с использованием адаптированных вариантов диалогового контента или образцов, выражаемых в персонализированной или иной релевантной форме, взаимодействие человек-машина дополнительно оптимизируется.

Предпочтительно, разговорный режим взаимодействия обеспечивает возможность более «интимных» «взаимоотношений» с пользователем, по меньшей мере все более «естественного» взаимодействия. Это лучшее восприятие пользователя может, по всей вероятности, привести к большему «пониманию» человека-пользователя машиной. Соответствующая «близость» с машиной, предполагаемая и подкрепляемая релевантными вариантами речи и/или диалоговыми высказываниями, может облегчить сбор данных от пользователя и о пользователе. Как пользователь, так и робот может быть более «экспрессивным». Термин «экспрессивность» относится к тому факту, что поскольку взаимодействие человек-машина становится (более) естественным, пользователь передает больше данных роботу, который, в свою очередь, может узнавать и запоминать больше данных о пользователе, что дополнительно обогащает взаимодействия в эффективном цикле. Этого нельзя сказать о персональном компьютере. Планшет может пытаться задавать «вопросы», например, в форме опроса или анкеты или посредством синтеза речи, но планшет не рассматривается в качестве «товарища», который может (автономно) перемещаться сам по себе, перемещать объекты или следовать за людьми, так что остаточное предубеждение против планшета в качестве товарища сохранится. Количество данных, которое может быть захвачено, будет меньшим по сравнению с роботом-товарищем. Тот факт, что робот-товарищ может использовать смешные или иные релевантные варианты речи или диалоговые образцы, усиливает эту способность захватывать данные.

Активно или пассивно собираемая информация о пользователе (например, профиль пользователя или декларируемые предпочтения пользователя) может быть использована в качестве входных данных для условий запуска (например, вариант речи или диалоговый образец должен быть запущен, только если пользователь любит "Bienvenue chez les Ch'tis"). Могут быть обеспечены механизмы машинного обучения: варианты речи или диалоговые образцы, которые запускаются или исполняются системой, будут развиваться в зависимости от того, что изучено о пользователе.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Варианты осуществления настоящего изобретения будут теперь описаны в качестве примера со ссылкой на сопутствующие чертежи, в которых одинаковые ссылочные позиции обозначают подобные элементы, и в которых:

Фиг. 1 иллюстрирует глобальную техническую среду настоящего изобретения;

Фиг. 2 детализирует некоторые аспекты одного варианта осуществления данного способа.

ПОДРОБНОЕ ОПИСАНИЕ

«Диалог» содержит предварительно подготовленные высказывания. Диалог является набором предварительно заданных высказываний, включающих в себя ответы на вопросы. Ожидаемые ответы на множество вопросов составляют диалог.

«Диалоговый режим» содержит одну или несколько операций модификации, которые действуют как на содержание («диалоговый образец» или «вариант диалогового контента»), так и на форму («вариант речи» или «вариант представления речи») планируемого высказывания. Другими словами, «диалоговый режим» связан с содержательным аспектом (например, фактическим контентом или информацией, передаваемой сообщением) и с формальным аспектом (например, экспрессивностью или эмоциями или тонами устной речи). Диалоговые режимы могут быть реализованы в форме загружаемых программ программного обеспечения, причем упомянутые программы содержат инструкции, которые, при исполнении на подходящем роботизированном устройстве, обеспечивают выполнение упомянутым роботизированным устройством конкретных физических действий, содержащих выполнение запрограммированных диалоговых режимов (вариантов диалогового контента и/или вариантов речи). Программа программного обеспечения может быть обеспечена в виде «модуля расширения» или «интегрируемого программного модуля» или «расширения». Дополнительные диалоговые режимы могут быть объединены с принимаемым по умолчанию вариантом диалогового контента и вариантом речи робота или могут быть добавлены к ним или могут заменить их. В одном варианте осуществления, диалоговые режимы могут быть вызваны в виде услуг для других приложений программного обеспечения, установленных в роботе. Например, приложение погоды может использовать голос Дарта Вейдера в некотором контексте (например, при полнолунии). Диалоговые режимы и/или соответствующие правила выполнения могут быть доступными через сеть или могут быть доступными локально. В некоторых вариантах осуществления, они могут быть дополнены или пополнены возможностями доступа к сетям и удаленным базам знаний.

«Вариант диалогового контента» или «диалоговый образец» или «диалоговая тема» относится к набору предварительно заданных высказываний, причем упомянутые высказывания соответствуют вопросам и (ожидаемым или прогнозируемым или возможным) ответам, например, в отношении некоторой темы или предмета обсуждения или интересующей области (но не обязательно, когда может быть предусмотрен общий диапазон высказываний). Синтаксические модификации могут модифицировать содержание существующих вариантов диалогового контента, установленных в роботе (например, вставка превосходной степени, такой как «супер», перестановки слов, и т.д.). Варианты диалогового контента или диалоговые образцы могут подвергать некоторые слова цензуре (например, использование определенных слов может быть запрещено, будь то бинарное запрещение или запрещение согласно вероятностям или порогам), некоторые другие слова могут быть разрешены, или использование некоторых слов может поощряться (предубеждение). Варианты диалогового контента или диалоговые образцы, конкретно, могут содержать (или добавлять, при модификации) содержательные варианты контента и другие культурные отсылки. Выбор слов может зависеть от контекста и может содержать аллюзии или культурные отсылки. Таким образом, диалог может содержать один или несколько вариантов диалогового контента (предварительно подготовленные диалоги, составленные из высказываний). Например, вместо только своего коммерческого наименования, игровое приложение может быть известно роботу как «игра с птицами и зелеными свиньями» или «игра, в которой ты должен бросать птиц в мишени» и т.п. Эти мета-описания, составленные из высказываний, возможно, вопросов и ответов, образуют варианты диалогового контента. Такие варианты диалогового контента обеспечивают роботу возможность разговаривать с пользователем. Например, если пользователь просит: «Я хочу поиграть с птицами», то робот может дополнительно спросить: «Ты хочешь поиграть с реальными птицами или с виртуальными птицами?». Если пользователь ответит: «С виртуальными птицами», то робот может попросить подтверждение: «Итак, ты хочешь поиграть в игру?!». Если пользователь ответит: «Да», то робот может еще дополнительно попросить подтверждение, например: «У меня есть игра, в которой ты должен бросать птиц в зеленых свиней».

«Вариант воспроизведения диалога» или «вариант речи (голоса)» относится к модификациям звукового воспроизведения. Такие модификации звукового воспроизведения влияют на «форму» (например, частоту, скорость, высоту звука и тон). Другими словами, применение варианта речи может радикально изменять экспрессивность роботов без модификации лежащих в основе предварительно подготовленных высказываний. Воздействие модификации речевого взаимодействия с роботами может быть оценено на разных уровнях: в отношении контента (содержания) и/или формы (тонов и т.д.). Вариант речи может содержать параметры, которые обеспечивают имитацию некоторых голосов. Многообразие речевых параметров можно обрабатывать для управления синтезом речи. Речевые параметры содержат частоту (определение того, будет ли робот говорить более четко или глубоко), скорость (насколько быстро или медленно робот будет говорить), тон (например, если актер Сильвестр Сталлоне и персонаж Магистр Йода будут говорить с одинаковой скоростью и частотой, они не будут иметь одинаковый тон). В одном варианте осуществления, пользователь может потребовать, чтобы его робот-товарищ говорил как Магистр Йода или Сильвестр Сталлоне. Посредством соответствующей модификации речевых параметров с использованием предварительно заданных речевых параметров, могут быть получены результаты аппроксимации. Имитации «на лету» (оперативно) являются правдоподобными (запись звуковых отрывков, установление параметров и применение релевантных модификаций) и могут обеспечить роботу возможность имитации одного или нескольких пользователей. В одном варианте осуществления, множество вариантов речи может быть объединено. Некоторые варианты речи могут оказаться несовместимыми при объединении (взаимно исключающими). Некоторые другие варианты речи могут быть объединены до некоторой степени. Некоторые другие варианты речи могут быть аддитивными.

«Правила выполнения диалогов» относятся к правилам выполнения, которые управляют применением одного или нескольких вариантов речи и/или вариантов диалогового контента или диалоговых образцов. «Правило выполнения» может содержать сценарии, программный код или иные булевы выражения или логические правила, которые обеспечивают возможность видоизменения фраз, которые робот может произносить (словарный запас, добавление некоторых выражений перед высказыванием или в его конце, и т.д.). Каждый раз, когда робот собирается сказать что-нибудь человеку-пользователю (например, поскольку робот пытается ответить на вопрос или устранить неоднозначность ситуации), если планируемое высказывание робота не соответствует одному или нескольким правилам выполнения вариантов воспроизведения диалогов, то высказывание будет модифицировано согласно этим правилам, и затем робот произнесет его. В одном варианте осуществления, одно или несколько правил выполнения диалогов могут быть применены к одному или нескольким высказываниям (т.е., высказываниям, запланированным для произнесения роботом). В одном варианте осуществления, упомянутые правила могут быть применены к каждому высказыванию, подлежащему произнесению роботом. В одном варианте осуществления, эти правила могут быть применены к подмножеству высказываний, например, к тем высказываниям, которые содержат предварительно заданные слова или выражения. Правила выполнения диалогов могут быть заданы предварительно. Правила выполнения диалогов могут быть динамически извлечены из интернета. Некоторые правила могут быть аддитивными, в то время как другие правила могут быть взаимно исключающими. Например, правило выполнения может содержать (например, кодировать) возрастной предел. Могут быть использованы или применены совокупные правила выполнения. Например, конкретный вариант речи может быть авторизован перед пользователями старше 12 лет и/или согласно некоторым ситуациям (время дня, измеренные эмоции в аудитории, и т.д.). Некоторые правила выполнения могут быть конфигурируемыми пользователями (например, родительский контроль).

В качестве примера, высказывание: «Я могу станцевать сейчас», соответствует стандартной предварительно заданной фразе (записанной в памяти робота). «Я могу станцевать сейчас hein biloute» соответствует фразе, высказываемой роботом после применения диалогового образца, именуемого «Ch'tis». Вариант воспроизведения звука или вариант речи «Ch'tis» может (необязательно) дополнительно обеспечивать соответствующие звуковые модуляции. Форма и содержание могут быть различным образом модифицированы: могут быть добавлены конкретные акценты или интонации (например, форма «Северная Франция»), может быть обогащен словарный запас, используемый роботом, могут быть добавлены новые разговорные темы (например, модели вопросов и ответов).

Диалоговые режимы (варианты диалогового контента и/или варианты воспроизведения диалогов) могут быть реализованы в пакетах программного обеспечения, которые могут быть определены или запрограммированы редакторами программного обеспечения. Такое программное обеспечение может быть модифицируемым или немодифицируемым. Другими словами, диалоговый режим (например, вариант речи) может быть полностью определенным (например, никакая дополнительная параметризация не может быть официально разрешена). Альтернативно, диалоговый режим может быть только частично определенным. Например, некоторые (например, конечное количество) локальные параметры могут оставаться под управлением конечных пользователей, в то время как большинство установочных параметров не могут быть изменены (для поддержания общей целостности варианта речи, например).

Другими словами, приложение программного обеспечения, помимо буквального значения (компьютерный программный код, который, при исполнении на подходящем компьютерном устройстве, может выполнить один или несколько этапов), может быть вариантом диалогового контента (или может быть связан с ним) (например, может быть набором предварительно заданных высказываний, включающих в себя ответы на ожидаемые вопросы) и/или вариантом речи (например, запрограммированным наряду с вариантами диалогового контента, т.е., правилами выполнения, такими как видоизменения в виде функций среды, синхронизации с перемещениями головы, активизации средств освещения, при наличии, и т.д.) и их комбинаций (например, диалог в танце). Приложения программного обеспечения могут быть взаимозависимыми. В качестве результата многорежимных выходных данных, приложения программного обеспечения могут быть дополнительно объединены (на уровнях выходных данных или на более низких уровнях, например, переменные или параметры или сценарии могут совместно использоваться или модифицироваться приложениями программного обеспечения). Например, робот может сопровождать высказываемый результат: «Снаружи -10°C», комбинацией жестов, символизирующих то, что снаружи холодно.

Приложения программного обеспечения предпочтительно могут быть представлены пользователю через диалоговый интерфейс, т.е., во время последовательности действий («естественного») диалога с пользователем. Другими словами, диалоговая система может действовать подобно «бутылочному горлышку» для того, чтобы пользователь мог запустить или выполнить одно или несколько приложений.

Фиг. 1 иллюстрирует глобальную и техническую среду настоящего изобретения. Робот 130 содержит датчики и исполнительные механизмы. Логика «интеллекта» 100 реализована в роботе или связана с ним (например, удаленно) и содержит набор программного обеспечения 110 и аппаратные компоненты 120. Робот 130 взаимодействует (посредством двусторонних или двунаправленных средств 140 связи, включающих в себя один или несколько диалоговых сеансов) с одним или несколькими пользователями 150. Упомянутые один или несколько пользователей могут осуществлять доступ к другим вычислительным устройствам 160 (например, (например, персональному компьютеру, такому как переносной компьютер или смартфон или планшет), которые могут быть подключенными устройствами (могут иметь связь с облаком серверов и/или множеством других роботов или подключенных объектов и т.д.). Конкретно, подключенное устройство может быть переносным компьютером (например, часами, очками, шлемом с эффектом присутствия и т.д.).

Конкретный робот 130 на фигуре приведен только в качестве примера человекоподобного робота, в котором может быть реализовано настоящее изобретение. Нижняя конечность робота на фигуре не функциональна для ходьбы, но может перемещаться в любом направлении на своем основании, которое может катиться по поверхности, на которой оно находится. Настоящее изобретение может быть легко реализовано в роботе, который подходит для ходьбы.

В некоторых вариантах осуществления настоящего изобретения, робот может содержать различные виды датчиков. Некоторые из них используются для контроля положения и перемещений робота. Это имеет место в случае, например, инерциального блока, расположенного в туловище робота, содержащего трехосный гирометр и трехосный акселерометр. Робот может также включать в себя две двумерные цветные RGB-камеры на лбу робота (верхнюю и нижнюю). Трехмерный датчик может также находиться позади глаз робота. Робот может также необязательно содержать генераторы лазерных линий, например, в голове и в основании, для обеспечения возможности восприятия его относительного положения по отношению к объектам /существам в его среде. Робот может также включать в себя микрофоны для обеспечения возможности восприятия звуков в его среде. Робот настоящего изобретения может также включать в себя ультразвуковые датчики, которые могут быть расположены на передней части и на задней части его основания, для измерения расстояния до объектов/ людей в его среде. Робот может также включать в себя тактильные датчики, на его голове и на его руках, для обеспечения возможности взаимодействия с людьми. Он может также включать в себя демпферы на своем основании для восприятия препятствий, которые он встречает на своем пути. Для передачи его эмоций и установления связи с людьми в его среде, робот настоящего изобретения может также включать в себя светодиоды, например, в его глазах, ушах и на его плечах, и громкоговорители (например, расположенные в его ушах). Робот может устанавливать связь с базовой станцией, с другими подключенными устройствами или с другими роботами, через различные сети (3G, 4G/LTE, Wifi, BLE, ячеистую сеть и т.д.). Робот содержит аккумуляторную батарею или источник энергии. Робот может осуществлять доступ к зарядной станции, соответствующей типу аккумуляторной батареи, которую он включает в себя. Положением/ перемещениями роботов можно управлять посредством их двигателей, с использованием алгоритмов, которые активируют цепи, находящиеся в каждой конечности, и рабочие органы, находящие на конце каждой конечности, с учетом измерений датчиков.

В конкретном варианте осуществления, робот может иметь встроенный планшет, с помощью которого он может передавать сообщения (звуковые сообщения, видео, веб-страницы) в его среду или принимать вводы данных от пользователей через тактильный интерфейс планшета. В другом варианте осуществления, робот может не иметь встроенного или находящегося на нем экрана, но он может иметь видеопроектор, с помощью которого данные или информация могут быть спроецированы на поверхности вблизи робота. Упомянутые поверхности могут быть плоскими (например, пол) или неплоскими (например, деформации проекционных поверхностей могут быть скомпенсированы для получения, по существу, плоской проекции). В обоих вариантах осуществления (с экраном и/или с видеопроектором), варианты осуществления настоящего изобретения остаются допустимыми: заявленная модель взаимодействия дополняется или комплектуется только визуальным средством взаимодействия. В любом случае, независимо от того, будет ли графическое средство неисправно или будет деактивировано преднамеренно, останется разговорный режим взаимодействия.

В одном варианте осуществления, робот не содержит такого средства графического пользовательского интерфейса. Существующие человекоподобные роботы обычно снабжены усовершенствованными речевыми возможностями но, обычно, не снабжены GUI. Все большие группы пользователей, вероятно, не будут использовать графическое средство (например, планшет, смартфон), даже в качестве дополнительного средства, для установления связи с роботом, по желанию и/или по необходимости (молодежь, инвалиды, в практической ситуации и т.д.).

Набор программного обеспечения 110 (неисчерпывающе) содержит программные модули или объекты или части программного кода, взаимодействующие друг с другом и включающие в себя «средства 111 извлечения», «предложения 112 видов деятельности», «назначение 113 приоритетов интеллекта», «менеджер 114 пакетов», «исторические данные 115 пользователя», «фокусируемый автономный вид 116 деятельности» и «фокусируемую диалоговую тему» 117 и «услугу 118 мониторинга технического состояния».

«Услуга 111 Средства Извлечения» обычно распознает или воспринимает что-либо внутри или снаружи робота и обеспечивает краткосрочные данные для памяти робота. Услуга Средства Извлечения принимает входные показания от датчиков робота; эти показания датчиков предварительно обрабатывают для извлечения уместных данных в отношении положения робота, идентификации объектов/ людей в его среде, расстояния до упомянутых объектов/ людей, слов, произнесенных людьми, или их эмоций. Услуги Средств Извлечения, в частности, содержат: распознавание лиц, восприятие людей, зоны контакта, обнаружение приветственных жестов, обнаружение улыбок, обнаружение взглядов, обнаружение эмоций, анализ речи, распознавание речи, локализацию звука, обнаружение перемещения, панорамный компас, позу робота, диагноз технического состояния робота, аккумуляторную батарею, обработку QR-кода, домашнюю автоматику, группы, время и расписание.

«Услуга Исполнительных Механизмов» заставляет робота физически производить или выполнять действия. Средство Отслеживания Перемещений, светодиоды, менеджер Вариантов поведения являются «Услугами Исполнительных Механизмов».

«Информационная Услуга» обеспечивает долгосрочное запоминание данных. Примерами Информационных Услуг являются Услуга 115 Пользовательского Сеанса, которая запоминает пользовательские данные и их историю в отношении того, что они делали с роботом, и Услуга 114 Менеджера Пакетов, которая обеспечивает масштабируемое хранилище процедур, исполняемых роботом, с их высокоуровневым определением, условиями запуска и тегами. «Менеджер Пакетов», конкретно, обеспечивает масштабируемое хранилище Видов Деятельности и Диалогов, а также Декларацию. «Декларация» содержит метаданные, такие как условия запуска, теги и высокоуровневые описания.

«Услуга Интеллекта» (например, услуга Назначение 113 Приоритетов Интеллекта) является услугой, которая будет управляться центральным «Интеллектом» робота, когда она инициирует действие. «Услуги Интеллекта» связывают вместе «услуги 130 Исполнительных Механизмов», «услуги 111 Средств извлечения» и «Информационные Услуги» 115. Базовая Информированность является «Услугой Интеллекта». Она подписывается на «Услуги Средств Извлечения», такие как Восприятие Людей, Обнаружение Перемещения, и Локализация Звука, чтобы указать Услуге Перемещения на то, что следует выполнить перемещение. «Интеллект» 113 конфигурирует вариант поведения Базовой Информированности на основе ситуации. В другие моменты времени, Базовая Информированность либо действует сама по себе, либо конфигурируется Выполняемым Видом Деятельности.

«Автономное Функционирование» является Услугой Интеллекта. Она исполняет виды деятельности вариантов поведения. На основе контекста ситуации, Интеллект может указать Автономному Функционированию, на каком виде деятельности следует сфокусироваться («Фокусируемый Автономный Вид 116 Деятельности»). Метаданные в декларациях связывают эту информацию в интеллекте. Любой вид деятельности может иметь доступ к одному или нескольким API Операционной Системы. Виды Деятельности могут также прямо указать Автономному Функционированию, на каком виде деятельности следует сфокусироваться, или указать Услуге Диалога, на какой теме следует сфокусироваться.

Услуга «Диалог» может быть сконфигурирована в виде Услуги Интеллекта. Она подписывается на средство извлечения распознавания речи и может использовать «Услугу Исполнительного Механизма Динамической Речи» для говорения. На основе контекста ситуации, Интеллект может указать Диалогу, на каких темах следует сфокусироваться («Диалоговая Тема»). Услуга «Диалог» также имеет свои алгоритмы для управления разговором и обычно действует сам по себе. Одним компонентом услуги Диалога может быть услуга 117 «Фокусируемая Диалоговая Тема». Диалоговые Темы могут программно указать Интеллекту на то, что следует переключить фокус (или выполнить или запустить) на другой Вид Деятельности или Диалоговую Тему, в любое время. Один пример возможного способа для определения Диалоговой Темы может содержать: в тот момент, когда условия запуска диалоговой темы или вида деятельности становятся истинными или ложными, список всех возможных на данный момент Видов Деятельности или Диалоговых Тем отправляют к Интеллекту; список фильтруют согласно назначению приоритетов видов деятельности; порядок списка рандомизируют; список сортируют (или оценивают) для отдания предпочтения Видам Деятельности или Диалоговым Темам, которые являются «уникальными» и запускались менее часто; выполняют специальную проверку, чтобы убедиться, что верхний Вид деятельности или Диалоговая Тема в этом списке не является таким же видом деятельности, как предыдущий вид деятельности, который выполнялся. Список может быть снова отсортирован и отфильтрован согласно предпочтениям пользователя.

Робот может реализовать услугу 118 «мониторинг технического состояния». Такая услуга может действовать в качестве демона или «сторожевого устройства» для проверки или контроля или регулирования разных приоритетов робота. Такая услуга может контролировать (непрерывно, прерывисто или периодически) состояние внутренних компонентов робота и измерять или ожидать или прогнозировать или корректировать неисправности аппаратных средств. В одном развитии, контролируют множество (например, установленное базовое количество) роботов. Встроенная услуга может непрерывно обнаруживать ситуации неисправностей и синхронизировать их с услугой «облака» (например, один раз каждую минуту).

Аппаратные компоненты 120 содержат обрабатывающее средство 121, запоминающее средство 122, средство 123 ввода/ вывода данных (I/O), массовое запоминающее средство 124 и средство 125 доступа к сети, причем упомянутые средства взаимодействуют друг с другом (кеширование, свопинг, распределенные вычисления, балансировка загрузки, и т.д.). Обрабатывающее средство 121 может быть CPU (многоядерным или многократноядерным) или FPGA. Запоминающее средство 122 может содержать одно или несколько из флэш-памяти или памяти с произвольным доступом. Средство 123 I/O может содержать одно или несколько из экрана (например, сенсорного экрана), источника света или светодиода, тактильной обратной связи, виртуальной клавиатуры, мыши, шарового манипулятора, джойстика, или проектора (включая лазерный проектор). Запоминающее средство 124 может содержать одно или несколько из накопителя на жестких дисках или SSD. Средство доступа к сети может обеспечить доступ к одной или нескольким сетям, таким 3G, 4G/LTE, Wifi, BLE или ячеистая сеть. Сетевой трафик может быть зашифрован (например, с использованием туннелей, SSL, и т.д.).

В одном варианте осуществления, вычислительные ресурсы (средства вычислени

Способы и системы для обработки диалога с роботом

Патент 2668062