Способ двухрежимного голосового управления, устройство и терминал пользователя
Иллюстрации
Показать всеИзобретение относится к области вычислительной техники. Технический результат заключается в обеспечении двухрежимного голосового управления голосовым вводом. Технический результат достигается за счет определения, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, причем прекращение голосового ввода во время режима определения остановки оперировать-чтобы-говорить определяется на основе операции окончания режима определения остановки оперировать-чтобы-говорить; в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определения, находится ли микрофон в состоянии занятости; и в ответ на определение того, что микрофон находится в состоянии занятости, переключения голосового режима с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом перед тем, как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости. 6 н. и 12 з.п. ф-лы, 23 ил.
Реферат
ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
[0001] Настоящая заявка основана на и испрашивает приоритет Китайской Заявки № 201510900408.9, поданной 08 декабря 2015г., которая во всей своей полноте включена в настоящее описание посредством ссылки.
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0002] Настоящее раскрытие относится к области технологии управления, и, в частности, способам двухрежимного голосового управления, устройствам, и терминалам пользователя.
УРОВЕНЬ ТЕХНИКИ
[0003] С непрерывной популяризацией и развитием мобильных терминалов, постепенно становится тенденцией осуществление доступа к сети Интернет с помощью мобильных терминалов. В настоящее время многие мобильные терминалы поддерживают функцию распознавания голоса, которая была реализована, главным образом, следующими двумя путями: (1) нажатие кнопки микрофона, чтобы запустить голосовой ввод, и отпускание кнопки микрофона, чтобы окончить голосовой ввод; и (2) используя автоматическое распознавание VAD (Обнаружение Голосовой Активности), и запуск голосового ввода после входа в интерфейс голосового ввода.
[0004] Вышеупомянутые два способа распознавания голосового ввода соответствуют привычкам оперирования разных пользователей и применяются соответственно к разным сценариям. Существующие разнообразные браузеры и прикладное программное обеспечение поддерживают только один из способов реализации, и не поддерживают выбор режима и переключение в сценариях приложения, где поддерживаются оба способа голосового ввода.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0005] Настоящее раскрытие предоставляет способы двухрежимного голосового управления, устройства и терминалы пользователя, решающие проблемы, описанные в существующих браузерах и приложениях, чтобы добиться гибкого выбора и переключения между двумя режимами голосового ввода из оперировать-чтобы-говорить (operate-to-speak) и непосредственно-говорить (directly-speak).
[0006] В первом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют способ двухрежимного голосового управления. Способ может содержать этапы, на которых: определяют, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определяют, находится ли микрофон в состоянии занятости; и в ответ на определение того, что микрофон находится в состоянии занятости, переключают голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом перед тем, как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости.
[0007] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют, что: этап, на котором определяют, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, может содержать этапы, на которых: определяют, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; в ответ на обнаружение операции запуска, отслеживают продолжительность времени, в течение которого пользователь исполняет операцию запуска; и в ответ на определение того, что продолжительность времени достигает предварительно установленной пороговой величины, определяют, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.
[0008] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют, что: этап, на котором определяют, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, содержит этапы, на которых: определяют, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; в ответ на определение операции запуска, определяют, находится ли микрофон в состоянии незанятости; и в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливают режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживают продолжительность времени, в течение которого пользователь исполняет операцию запуска, и в ответ на определение того, что продолжительность времени достигает предварительно установленной пороговой величины, определяют, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.
[0009] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют то, что способ двухрежимного голосового управления может дополнительно включать в себя этапы, на которых: захватывают голосовую информацию, выражаемую пользователем в интерфейсе голосового ввода; отслеживают операцию окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода; в ответ на определение того, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определяют, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить; в ответ на определение того, что в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, продолжают захватывать голосовую информацию, выражаемую пользователем; и в ответ на определение того, что в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, останавливают захват голосовой информации, выражаемой пользователем.
[0010] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют способ двухрежимного голосового управления. Способ может включать в себя этапы, на которых: определяют, исполнил ли пользователь операцию запуска операции активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; в ответ на обнаружение операции запуска, определяют, находится ли микрофон в состоянии незанятости; в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливают режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, и отслеживают продолжительность времени, в течение которого пользователь исполняет операцию запуска; и в ответ на определение того, что продолжительность времени достигает предварительно установленной пороговой величины, определяют, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключают голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.
[0011] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют устройство двухрежимного голосового управления, оперируемое в терминале пользователя. Устройство может содержать процессор и не временную машиночитаемую память, хранящую инструкции, которые, когда исполняются посредством процессора, предписывают процессору: отслеживать, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определять, находится ли микрофон в состоянии занятости, и в ответ на определение того, что микрофон находится в состоянии занятости, переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом перед тем, как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости.
[0012] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют устройство двухрежимного голосового управления, оперируемое в терминале пользователя. Устройство может содержать процессор и не временную машиночитаемую память, хранящую инструкции, которые, когда исполняются посредством процессора, предписывают процессору: определять, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и в ответ на определение операции запуска, определять, находится ли микрофон в состоянии незанятости, в ответ на определение того, что микрофон находится в состоянии не занятости, устанавливать режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определять, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.
[0013] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют терминал пользователя. Терминал может включать в себя микрофон, экран касания, не временную машиночитаемую память, и процессор. Память может хранить инструкции, которые, когда исполняются посредством процессора, предписывают терминалу пользователя: отслеживать, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определять, находится ли микрофон в состоянии занятости, и в ответ на определение того, что микрофон находится в состоянии занятости, переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом перед тем, как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости.
[0014] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют терминал пользователя. Терминал может включать в себя микрофон, экран касания, не временную машиночитаемую память, и процессор. Память может хранить инструкции, которые, когда исполняются посредством процессора, предписывают терминалу пользователя: определять, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и в ответ на определение операции запуска, определять, находится ли микрофон в состоянии незанятости, в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливать режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определять, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.
[0015] Способ двухрежимного голосового управления, устройство двухрежимного голосового управления и терминал пользователя, предоставленные некоторыми вариантами осуществления настоящего раскрытия, применимы в сценариях применения, где поддерживаются оба режима голосового ввода из «оперировать-чтобы-говорить» и «непосредственно-говорить», при этом режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить могут быть выбраны или переключаться гибко и надежно посредством отслеживания поведения операции пользователя и состояния микрофона так, что можно реализовать адаптацию к голосовым вводам пользователей с разными поведенческими привычками, значительно улучшаются удобство и гибкость голосового ввода пользователя, и улучшается восприятие голосового ввода.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0016] Предпочтительные и неограничивающие варианты осуществления раскрытия могут быть более легко поняты посредством обращения к сопроводительным чертежам, на которых:
[0017] Фиг. 1 показывает с структурную схему структуры терминала пользователя, согласующуюся с примерными вариантами осуществления настоящего раскрытия.
[0018] Фиг. 2 показывает принципиальную блок-схему способа двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.
[0019] Фиг. 3 показывает принципиальную блок-схему другого способа двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.
[0020] Фиг. 4 показывает принципиальную блок-схему другого способа двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.
[0021] Фиг. 5 показывает принципиальную блок-схему способа управления окончания режима определения остановки оперировать-чтобы-говорить, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0022] Фиг. 6 показывает принципиальную блок-схему способа двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.
[0023] Фиг. 7 показывает структурную схему структуры устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.
[0024] Фиг. 8 показывает структурную схему структуры другого устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.
[0025] Фиг. 9 показывает структурную схему структуры другого устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.
[0026] Фиг. 10 показывает структурную схему структуры другого устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.
[0027] Фиг. 11 показывает структурную схему структуры устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.
[0028] Фиг. 12 показывает структурную схему структуры другого устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.
[0029] Фиг. 13 показывает принципиальную схему взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии незанятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0030] Фиг. 14 показывает принципиальную схему взаимодействующего интерфейса для окончания режима определения остановки оперировать-чтобы-говорить, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0031] Фиг. 15 показывает принципиальную схему взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии занятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0032] Фиг. 16 показывает принципиальную схему другого взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии незанятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0033] Фиг. 17 показывает принципиальную схему другого взаимодействующего интерфейса для окончания режима определения остановки оперировать-чтобы-говорить, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0034] Фиг. 18 показывает принципиальную схему другого взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии незанятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0035] Фиг. 19 показывает принципиальную схему другого взаимодействующего интерфейса для окончания режима определения остановки оперировать-чтобы-говорить, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0036] Фиг. 20 показывает принципиальную схему другого взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии занятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0037] Фиг. 21 показывает принципиальную схему другого взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии незанятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0038] Фиг. 22 показывает принципиальную схему другого взаимодействующего интерфейса для окончания режима определения остановки оперировать-чтобы-говорить, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0039] Фиг. 23 показывает принципиальную схему другого взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии занятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.
[0040] Должно быть понятно, что вышеприведенное общее описание и нижеследующее подробное описание являются лишь примерными и пояснительными, и не являются ограничивающими раскрытие, как заявлено.
ПОДРОБНОЕ ОПИСАНИЕ НЕКОТОРЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
[0041] Теперь подробно обратимся к примерным вариантам осуществления, примеры которых иллюстрируются на сопроводительных чертежах. Нижеследующее описание относится к сопроводительным чертежам, на которых одни и те же числа на разных чертежах представляют одни и те же или сходные элементы, если только не представлено обратное. Реализации, излагаемые в нижеследующем описании примерных вариантов осуществления, согласующиеся с настоящим изобретением, не представляют собой всех реализаций, согласующихся с изобретением. Наоборот, они являются лишь примерами систем и способов, согласующихся с аспектами, относящимися к изобретению.
[0042] Также следует отметить, что понятия, включающие в себя «первый», «второй» и подобное в описаниях, формуле изобретения и на сопроводительных чертежах настоящего раскрытия используются для того, чтобы различать сходные объекты, а не для описания конкретных последовательностей или приоритетов. Должно быть понятно, что в случае необходимости может быть осуществлен обмен данными, так что некоторые варианты осуществления настоящего раскрытия, описываемые в данном документе, могут быть реализованы в последовательностях отличных от тех, что иллюстрируются или описываются в данном документе. Более того, понятие «включать в себя», «обладать» и любой их вариант предназначены охватывать неисключительное включение, например, процессы, способы, системы, продукты или устройства, включающие в себя ряд этапов или блоков, не ограничиваются этими четко перечисленными этапами или блоками, а могут включать в себя те, что не перечислены или другие неотъемлемые этапы или блоки процессов, способов, продуктов или устройств.
[0043] Способ двухрежимного голосового управления и устройство двухрежимного голосового управления, предоставленные некоторыми вариантами осуществления настоящего раскрытия, могут быть применены к терминалу 100 пользователя. В некоторых вариантах осуществления настоящего раскрытия, терминал 100 пользователя является оборудованием мобильного терминала, например, интеллектуальным телефоном, планшетным компьютером, устройством для чтения электронных книг, портативным компьютером класса лэптоп, монтируемым на транспортном средстве компьютером, носимым мобильным терминалом, и т.д.
[0044] Фиг. 1 показывает структурную схему структуры терминала 100 пользователя, согласующегося с примерными вариантами осуществления настоящего раскрытия. Как показано на Фиг. 1, терминал 100 пользователя включает в себя память 102, контроллер 104 памяти, один или более (несмотря на то, что только один показан на фигуре) процессоры 106, периферийный интерфейс 108, радиочастотный модуль 110, аудио модуль 112, экран 114 касания, и т.д. Компоненты осуществляют связь друг с другом через одну или более шины связи/сигнальные линии 116.
[0045] Память 102 может быть использована для хранения программ и модулей программного обеспечения, например, соответствующих инструкций/модулей программы способа двухрежимного голосового управления и устройства, раскрываемых в данном документе. И процессор 106 выполняет программы и модули программного обеспечения, хранящиеся в памяти 102, чтобы исполнять разнообразные функциональные приложения, например, двухрежимное голосовое управление, раскрываемое в данном документе.
[0046] Память 102 может включать в себя высокоскоростную произвольную память, и/или энергонезависимую память, например, одно или более магнитные запоминающие устройства, флэш-память, или другую энергонезависимую твердотельную память. Процессор 106 и другие возможные компоненты могут осуществлять доступ к памяти 102 под управлением контроллера 104 памяти.
[0047] Периферийный интерфейс 108 связывает разнообразные устройства ввода/вывода с процессором 106 и памятью 102. В некоторых вариантах осуществления, периферийный интерфейс 108, процессор 106 и контроллер 104 памяти могут быть реализованы в едином чипе. В некоторых других вариантах осуществления, они могут быть реализованы соответственно посредством независимых чипов.
[0048] Радиочастотный модуль 110 используется для приема и передачи электромагнитных волн, и реализации взаимного преобразования между электромагнитными волнами и электрическими сигналами, тем самым осуществляя связь с сетью связи и другим оборудованием.
[0049] Аудио модуль 112 предоставляет аудио интерфейс для пользователя, и может включать в себя один или более микрофоны, один или более громкоговорители, и аудио схему.
[0050] Экран 114 касания предоставляет интерфейс вывода и ввода между терминалом 100 пользователя и пользователем. Например, экран 114 касания отображает условия голосового ввода, содержимое web-страницы, и подобное пользователю.
[0051] Может быть понятно, что структура, показанная на Фиг. 1, является лишь схематичной, и терминал 100 пользователя также может включать в себя больше или меньше компонентов, чем на Фиг. 1, или обладать конфигурацией отличной от той, что на Фиг. 1. Компоненты, показанные на Фиг. 1, могут быть реализованы посредством аппаратного обеспечения, программного обеспечения, или их сочетания.
[0052] Некоторые варианты осуществления настоящего раскрытия предоставляют двухрежимное голосовое управление, основанное на сценариях мобильного приложения, которое может быть лучше адаптировано к поведению пользователя применительно к голосовому вводу. Соответственно, пользователи могут непосредственно говорить и/или осуществлять операцию, чтобы вводить голос. Посредством отслеживания поведения пользователя и состояния микрофона, два режима голосового ввода могут быть выбраны по отдельности и переключаться гибким образом, чтобы предоставлять более удобную и надежную услугу голосового ввода.
[0053] В некоторых вариантах осуществления настоящего раскрытия, в соответствии с режимом голосового ввода, выбранным пользователем, голосовой режим, главным образом, включает в себя режим определения остановки оперировать-чтобы-говорить и режим автоматического определения остановки непосредственно-говорить. Правило определения остановки у режима определения остановки оперировать-чтобы-говорить состоит в том, что остановка (например, случай операции ввода) определяется, когда обнаруживается операция окончания режима определения остановки оперировать-чтобы-говорить (в противоположность операции активации режима определения остановки оперировать-чтобы-говорить). Например, остановка определяется, при обнаружении того, что палец или электромагнитное перо, отпускает кнопку нажать-чтобы-говорить, осуществляется щелчок отменяющий выбор кнопки микрофона, кнопка микрофона сдвигается в начальную точку, и подобное, безотносительно того выполняет ли пользователь языковое описание. Используя операцию нажатия кнопки нажать-чтобы-говорить, чтобы запустить голосовой ввод, и отпускания кнопки нажать-чтобы-говорить, чтобы окончить голосовой ввода, в качестве примера, в данном режиме определения остановки оперировать-чтобы-говорить, при условии что пользователь продолжает нажимать кнопку разговора, голосовой режим находится в состоянии непрерывного захвата голосовой информации пользователя, безотносительно того, выполняет ли пользователь голосовой ввод.
[0054] Правило определения остановки режима автоматического определения остановки непосредственно-говорить, состоит в том, что остановка (например, случай операции ввода) определяется, если голосовой ввод не обнаруживается в течение некоторой продолжительности времени безотносительно тому, выполняет ли пользователь операцию.
[0055] Фиг. 2 показывает способ двухрежимного голосового управления, согласующийся с примерными вариантами осуществления настоящего раскрытия. Обращаясь к Фиг. 2, раскрывается способ управления. Способ может быть направлен на браузер в терминале пользователя или модуль голосовой функции, такой как аудио модуль в прикладном программном обеспечении. Способ включает в себя следующие этапы.
[0056] Этап S200 включает в себя: определение, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода.
[0057] Пользователь в интерфейсе поиска может выбирать, входить ли в интерфейс голосового ввода. Простой путь входа в интерфейс голосового ввода может быть определен, например, посредством того, что пользователь щелкает по кнопке «голосовой ввод» в интерфейсе взаимодействия экрана, выполняет предварительно определенный жест, такой как жест «V», и т.д. Конечно, по умолчанию может быть непосредственный вход в интерфейс голосового ввода. Описанным выше является пример входа в интерфейс голосового ввода, и может быть понятно, что реализация настоящего раскрытия этим не ограничивается.
[0058] После входа в интерфейс голосового ввода, пользователь может непосредственно говорить, чтобы вводить голос, или выполнять операцию, чтобы вводить голос, в соответствии с привычками без выбора режима голосового ввода.
[0059] Операция активации режима определения остановки оперировать-чтобы-говорить посредством пользователя относится к операции, непосредственно инициирующей режим определения остановки оперировать-чтобы-говорить. Может существовать много операций активации режима определения остановки оперировать-чтобы-говорить, и они будут проиллюстрированы в качестве примера в нижеследующем описании.
[0060] Этап S201 включает в себя: в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определение, находится ли микрофон в состоянии занятости, и если так, то исполняется этап S202: переключение голосового режима с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить. Перед тем, как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, если микрофон находится в состоянии занятости, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить. В противном случае, выполняется этап S203: устанавливают режим определения остановки оперировать-чтобы-говорить в качестве голосового режима.
[0061] В некоторых вариантах осуществления, микрофон в состоянии занятости указывает состояние записи, при котором микрофон принимает голоса пользователя, и соответственно, микрофон в состоянии незанятости указывает состояние не записи, когда микрофон не принимает голоса пользователя. Для того, чтобы позволить пользователю удобным образом распознавать состояние микрофона, пиктограмма записи микрофона появляется в середине экрана, чтобы указать состояние занятости, как показано на Фиг. 14, 15, 17, 19, 20, 22 и 23.
[0062] Находится ли микрофон в состоянии занятости, может быть определено многими способами. В одной примерной реализации, терминал пользователя включает в себя машину состояния микрофона для захвата состояния микрофона, терминал пользователя отправляет инструкцию захвата состояния микрофона к машине состояния микрофона при определении того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, и машина состояния микрофона захватывает состояние микрофона.
[0063] В некоторых вариантах осуществления, когда микрофон находится в состоянии занятости, микрофон находится в состоянии приема и записи голоса пользователя, и голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить или режиме определения остановки оперировать-чтобы-говорить. Если определяется, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, когда микрофон находится в состоянии занятости, это указывает на то, что голосовой режим не был в режиме определения остановки оперировать-чтобы-говорить перед тем, как исполняется операция активации режима определения остановки оперировать-чтобы-говорить. Таким образом, при определении того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, когда микрофон находится в состоянии занятости, текущий голосовой режим должен находиться в режиме автоматического определения остановки непосредственно-говорить. При обнаружении того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить в режиме автоматического определения остановки непосредственно-говорить, может быть определено, что пользователь готовится к переключению голосового режима, и затем голосовой режим переключается с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, чтобы реализовать переключение режима, адаптируясь к поведению голосового ввода пользователя. Соответственно, если микрофон находится в состоянии незанятости при обнаружении того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить в режиме автоматического определения остановки непосредственно-говорить, он непосредственно переходит в режим определения остановки оперировать-чтобы-говорить.
[0064] Разнообразные способы могут быть использованы, чтобы определять, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода. Ниже предоставляются два способа определения, и может быть понятно, что реализация настоящего раскрытия этим не ограничивается.
[0065] В первом способе определения, как показано на Фиг. 3, отслеживание того, выполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода этапа 200, описанного выше, включает в себя следующие этапы:
[0066] Этап S300: определение, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода.
[0067] В некоторых вариантах осуществления, пользователь исполняет операцию запуска активации режима определения остановки оперировать-чтобы-говорить, например, операцией запуска является операция нажатия кнопки нажать-чтобы-говорить, как показано на Фиг. 13 и 15; в качестве другого примера, операцией запуска является операция щелчка по кнопке микрофона, как показано на Фиг. 16; в качестве дополнительного примера, операцией запуска является операция сдвига из начальной позиции в конечную позицию, например, сдвиг слева направо, и т.д.
[0068] Операция запуска активации режима определения остановки оперировать-чтобы-говорить реализуется разнообразными путями из начальной позиции в конечную позицию, например, операцией запуска является жест, например, палец пользователя сдвигается из любой позиции в левой стороне экрана в любую позицию в правой стороне экрана, как показано на Фиг. 21 и 23. В качестве другого примера, экран имеет кнопку микрофона и ползун для сдвига кнопки микрофона, при этом операцией запуска активации режима определения остановки оперировать-чтобы-говорить является перетаскивание кнопки микрофона из одной позиции в другую в ползуне, как показано на Фиг. 18 и 20.
[0069] Кнопка микрофона может иметь несколько форм. Например, кнопка микрофона может выглядеть как пиктограмма кнопки микрофона, например, пиктограмма микрофона устанавливается в середине зоны, и голосовой ввод может начинаться посредством длительного нажатия или выбора пиктограммы микрофона, как показано на Фиг. 16 и 17. В качестве другого примера, кнопка микрофона может выглядеть в качестве кнопки длительного нажатия, у которой ярлык нажать-чтобы-говорить или подобный нанесен на прямоугольную кнопку, и голосовой ввод может начинаться посредством длительного нажатия кнопки, как показано на Фиг. 13 и 15.
[0070] Во время реализации, если пользователь выбирает режим голосового ввода оперировать-чтобы-говорить, пользователь может исполнять операцию запуска активации режима определения остановки оперировать-чтобы-говорить; когда пользователь исполняет операцию запуска активации режима определения остановки оперировать-чтобы-говорить, терминал пользователя отслеживает операцию запуска активации режима определения остановки оперировать-чтобы-говорить, например, осуществление щелчка по кнопке микрофона, нажатие кнопки длительного нажатия, перетаскивание кнопки микрофона, сдвиг по экрану, и т.д., при которой палец пользователя или электромагнитное перо, которым оперирует пользователь, касается экрана или кнопки микрофона на экране. Таким образом, поведение действия, такое что палец пользователя или электромагнитное перо, которым оперирует пользователь, щелкает по кнопке микрофона, нажимает кнопку длительного нажатия, перетаскивает кнопку микрофона или сдвигается по экрану, может быть выбрано в качестве операции запуска, которая должна отслеживаться, или действие контакта между пальцем пользователя или электромагнитным пером, которым оперирует пользователь, и экраном или кнопкой микрофона на экране может быть выбрано в качестве операции запуска, которая должна отслеживаться.
[0071] Из вышеприведенного описания может быть известно, что операция запуска активации режима определения остановки оперировать-чтобы-говорить, используется в качестве узла для улавливания поведения пользователя в некоторых вариантах осуществления.
[0072] Этап S301 включает в себя: при обнар