Коррекция ошибок для систем распознавания речи
Иллюстрации
Показать всеИзобретение относится к прикладным программным продуктам, предназначенным для исправления слов в последовательности слов, которая получена при распознавании входной речевой последовательности. Технический результат - повышение средней точности распознавания слитной речи. Слова в последовательности слов, полученной после распознавания входной речевой последовательности, представляют пользователю, и одно из слов в последовательности слов заменяют, когда оно выбрано пользователем для исправления. Слова с низким значением достоверности распознавания выделяют; альтернативные слова-кандидаты для одного выбранного слова упорядочивают согласно критерию упорядочивания; после замены слова порядок альтернативных слов-кандидатов для соседних слов в последовательности может быть обновлен; слово, которое заменяют, может быть получено из речевого представления одного выбранного слова с помощью распознавания речи с ограниченным словарем; а слово, которое заменяет одно выбранное слово, может быть получено из речевого и побуквенного представления одного выбранного слова. 12 н. и 16 з.п. ф-лы, 13 ил.
Реферат
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение относится к способам, устройствам и прикладным программным продуктам, предназначенным для исправления слов в последовательности слов, которая получена при распознавании входной речевой последовательности.
УРОВЕНЬ ТЕХНИКИ
Основные способы распознавания речи известны из компьютерных приложений и также начинают появляться в области персональных мобильных коммуникаций. Пример распознавания речи в мобильном оконечном устройстве может быть представлен набором имени, когда пользователь просто произносит имя человека, которого будет вызывать, и затем мобильное оконечное устройство выполняет распознавание речи, автоматически определяет имя, находит соответствующий номер в адресной книге мобильного оконечного устройства и осуществляет вызов.
Предполагают, что осуществление передовых приложений распознавания речи может быть реализовано в будущих мобильных оконечных платформах, поскольку вычислительная мощность и память непрерывно дешевеют. При поддержке увеличенной вычислительной мощности и памяти, эти передовые приложения распознавания речи могут достичь уровня, приемлемого для пользователей мобильных устройств.
Пример усовершенствованного приложения распознавания речи представляет мобильный речевой ввод. В мобильном речевом вводе пользователь может ввести более длинные фрагменты текста (такого как электронная почта или SMS) в мобильное оконечное устройство, которое, как правило, снабжено клавиатурой небольшого размера или вообще лишено клавиатуры. Высокоэффективная мобильная система речевого ввода может таким способом значительно увеличить скорость и простоту ввода текста.
Недостаток, с которым сталкиваются при мобильном речевом вводе, состоит в том, что средняя точность распознавания слитной речи в настоящее время лежит в пределах от 60% до 95% на уровне слова, в зависимости от языка, произношения, окружающего шума и размера фрагмента речевого ввода. Лучшее распознавание может быть достигнуто при ограничении области речевого ввода (например, при ограничении словаря, который должен быть понят устройством речевого распознавания), путем приведения к сравнительно малой и точной языковой модели, а также при использовании мобильного оконечного устройства в чистой (нешумной) среде.
При распознавании речи, которое все еще остается несовершенным, исправление ошибок необходимо даже в усовершенствованных приложениях распознавания речи, чтобы они могли быть приемлемыми для пользователя. Это исправление ошибок должно быть эффективным и быстрым, потому что в противном случае преимущество во времени, полученное при вводе текста путем распознавания речи, может быть потеряно по причине задержки, необходимой для исправления ошибок.
Заявка на американский патент US 2002/0138265 А1 раскрывает и предлагает технологию исправления ошибок, возникающих в системе распознавания слитной речи. В этой заявке процессор распознает то, что произнес пользователь, путем подбора акустических моделей, которые лучше всего соответствуют цифровым кадрам фрагмента речи, и идентификации текста, который соответствует этим акустическим моделям. Акустическая модель может соответствовать слову, фразе или предписанию словаря. Акустическая модель также может представлять собой звук или фонему, которые соответствуют части слова. В совокупности фонемы, составляющие слово, представляют фонетическую транскрипцию слова. Акустические модели также могут представлять тишину и различные виды окружающего шума. Слова или фразы, соответствующие лучшим акустическим моделям, могут быть названы кандидатами распознавания. Процессор может создать одиночного кандидата распознавания для фрагмента речи или может сформировать список кандидатов распознавания. Механизмы исправления, описанные в US 2002/0138265 А1, включают отображение списка вариантов для каждого распознанного слова и разрешение пользователю исправлять ошибочное распознавание, выбирая слово из списка или печатая правильное слово. Согласно одному варианту системы распознавания речи, описанному в US 2002/0138265 А1, список пронумерованных кандидатов распознавания может быть отображен для каждого слова, произнесенного пользователем, и наилучший кандидат распознавания может быть вставлен в текст, продиктованный пользователем. Если наилучший кандидат распознавания неправилен, пользователь может выбрать кандидата распознавания из списка, произнеся "выбрать N", где "N" представляет номер правильного кандидата. Если правильное слово не включено в список выбора, то пользователь может усовершенствовать список, печатая первые буквы правильного слова или произнося слова (например "альфа", "браво"), ассоциированные с первыми буквами. Если пользователь замечает ошибку распознавания после произнесения дополнительных слов, пользователь может сказать "Ой", вызывая тем самым на дисплей пронумерованный список предварительно распознанных слов. Пользователь затем может выбрать предварительно распознанное слово, произнеся "слово N", где N представляет номер нужного слова. Система затем отвечает отображением списка, связанного с выбранным словом, и разрешает пользователю исправить слово, как описано выше.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Исходя из уровня техники, кроме прочего, цель настоящего изобретения состоит в том, чтобы предложить улучшенные способы, устройства и прикладные программные продукты для исправления ошибок в системах распознавания речи.
Согласно первому аспекту настоящего изобретения, предложен способ для того, чтобы исправлять слова в последовательности слов, которая получена от распознавания входной речевой последовательности. Упомянутый способ включает: представление упомянутой последовательности слов пользователю, причем каждое слово в упомянутой последовательности связано с соответствующим значением достоверности распознавания, при этом по меньшей мере одно слово в упомянутой последовательности автоматически выделено в зависимости от степени достоверности его распознавания; и замену по меньшей мере одного слова в упомянутой последовательности, в случае, если оно было выбрано пользователем для исправления.
Упомянутая входная речевая последовательность может быть рассмотрена как речевое представление одного или более слова, например полное предложение, которое может быть, например, записано с помощью микрофона или восстановлено из памяти. Распознавание речи может быть выполнено в отношении упомянутой входной речевой последовательности, чтобы получить упомянутую последовательность слов, причем необходимо, чтобы упомянутые слова в упомянутой последовательности слов соответствовали словам, которые содержит звуковое представление упомянутой входной речевой последовательности. Несоответствия рассматривают как ошибки, которые необходимо исправить прежде, чем упомянутую последовательность слов подвергнут последующей обработке (например, сохранят в памяти или передадут как сообщение в приемник). Каждое из упомянутых слов в упомянутой последовательности слов связано со степенью достоверности распознавания, которая представляет достоверность того, что упомянутое слово из входной речевой последовательности было распознано правильно. Уровень достоверности распознавания может быть, например, определен речевым устройством распознавания в процессе распознавания речи, но может быть также определен на стадии последующей обработки. Степень достоверности распознавания может также быть основана на информации от устройства речевого распознавания или информации, полученной на стадии последующей обработки. Например, достоверность распознавания может соответствовать акустической оценке в баллах, назначаемой устройством речевого распознавания каждому слову.
С целью исправления ошибок (то есть неправильно распознанных слов), упомянутая последовательность слов может быть представлена пользователю, причем пользователь, например, может быть тем пользователем, который произнес упомянутую входную речевую последовательность. С таким же успехом, входная речевая последовательность может быть предоставлена первым пользователем, а затем может быть откорректирована вторым пользователем. Упомянутое представление, например, может быть выполнено оптически, например, путем отображения и представления последовательности слов пользователю с помощью дисплея, или акустически, например, путем преобразования текста упомянутой последовательности слов в звуковую речь и воспроизведения этой преобразованной речи через громкоговоритель.
В упомянутом представлении последовательности слов, по меньшей мере одно слово этой последовательности выделено в зависимости от степени достоверности его распознавания. Например, слова в упомянутой последовательности, которые связаны с особенно низкой степенью достоверности распознавания (и соответственно с высокой вероятностью потенциальной ошибки), могут быть выделены, чтобы помочь пользователю быстрее обнаружить ошибки, или облегчить их выбор для исправления. Таким способом, в отличие от предшествующих способов исправления ошибок, может быть достигнуто более быстрое и более эффективное исправление ошибок. В этом отношении, способ выделения зависит от способа представления упомянутой последовательности слов. Например, если последовательность слов отображена на дисплее, то выделение может быть реализовано путем изменения вида по меньшей мере одного слова, которое должно быть выделено, например, путем яркостного выделения по меньшей мере одного слова или изменением его шрифта, цвета или стиля.
Если по меньшей мере одно слово упомянутой последовательности слов выбрано пользователем, то по меньшей мере одно слово заменяют. Эта замена может быть выполнена на основе взаимодействия с пользователем или автоматически. Например, пользователь может обеспечить слово замены по меньшей мере для одного выбранного слова, печатая это слово замены, или (опять) вводя речевое представление данного слова, чтобы обеспечить распознавание звукового представления речи на основе уровня достоверности слова, или выбирая слово замены из списка слов-кандидатов, который предоставлен пользователю.
В примере реализации способа, согласно первому аспекту настоящего изобретения, по меньшей мере одно выделенное слово связано с самой низкой степенью достоверности распознавания всех слов в упомянутой последовательности слов. Внимание пользователя в этом случае будет привлечено к тому слову в упомянутой последовательности слов, вероятность ошибочного распознавания которого самая высокая. Пользователь тогда может проверить правильность упомянутого слова, и если это слово признано неправильным, пользователь принимает меры, чтобы исправить упомянутое слово. Выделение только одного одиночного слова избавляет пользователя от переполнения информацией во время представления упомянутой последовательности слов.
Согласно этой иллюстративной реализации, по меньшей мере одно выделенное слово может быть автоматически выделено путем автоматического позиционирования селектора на этом слове. Упомянутым селектором может быть, например, указатель или курсор, которым может управлять пользователь, чтобы выбирать слова в представленной последовательности слов для исправления. Автоматическое позиционирование селектора на упомянутом по меньшей мере одном слове с самой низкой достоверностью распознавания достигает двойной цели. С одной стороны, внимание пользователя будет привлечено к слову, у которого высока вероятность ошибочного распознавания. С другой стороны, нет необходимости для пользователя в перемещении селектора, чтобы выбрать нужное слово для исправления в случае, если это слово, как выяснено, пользователь обозначил как неправильное. Например, может потребоваться только подтверждение пользователем автоматического выбора этого слова, чтобы запустить процесс исправления ошибок.
В другой иллюстративной реализации способа согласно первому аспекту настоящего изобретения, по меньшей мере одно выделенное слово связано со степенью достоверности распознавания, которая ниже заданного порога. Упомянутый порог может, например, быть порогом по умолчанию, или этот порог может быть определен или изменен пользователем. Вместо того, чтобы выделять только слово, связанное с самой низкой степенью достоверности распознавания, могут быть выделены все слова, связанные со степенью распознавания, которая ниже упомянутого заданного порога. В этом случае, пользователь может проверить, что все выделенные слова в упомянутой последовательности, вероятно, содержат ошибки, и потому должны быть тщательно проверены.
Кроме того, согласно первому аспекту настоящего изобретения, предложено устройство для того, чтобы исправлять слова в последовательности слов, которая получена от распознавания входной речевой последовательности. Упомянутое устройство включает средства для представления упомянутой последовательности слов пользователю, причем каждое слово в этой последовательности слов связано с соответствующей степенью достоверности распознавания, и при этом по меньшей мере одно слово в упомянутой последовательности слов автоматически выделено в зависимости от степени достоверности его распознавания; и средства для замены по меньшей мере одного слова в упомянутой последовательности слов, в случае, если оно было выбрано пользователем для исправления.
Упомянутыми средствами для представления упомянутой последовательности слов могут быть, например, дисплей с соответствующей дисплейной логикой или громкоговоритель с соответствующей звуковой логикой. Упомянутые средства для представления упомянутой последовательности слов также могут содержать средства выделения по меньшей мере одного слова. Упомянутые средства для замены по меньшей мере одного слова могут, например, включать пользовательский интерфейс, чтобы взаимодействовать с пользователем, например, предоставлять пользователю возможность выбирать слово замены для по меньшей мере одного выбранного слова из списка или вводить речевое представление по меньшей мере одного слова, а также чтобы выполнить новое распознавание речи или напечатать по меньшей мере одно слово.
В иллюстративной реализации устройства, согласно первому аспекту настоящего изобретения, упомянутым устройством может быть портативное мультимедийное устройство или часть его. Упомянутое устройство, например, может быть мобильным телефоном, личным цифровым помощником, компьютером, цифровым устройством речевого ввода или подобным устройством. Альтернативно, упомянутое устройство также может быть настольным компьютером или частью его.
Кроме того, согласно первому аспекту настоящего изобретения, предложен прикладной программный продукт, включающий носитель данных, содержащий программное приложение для исправления слов в последовательности слов, которая получена при распознавании входной речевой последовательности, осуществленном в нем. Упомянутое программное приложение содержит программный код, чтобы представлять упомянутую последовательность слов пользователю, причем каждое слово в упомянутой последовательности слов связано с соответствующей степенью достоверности распознавания, и при этом по меньшей мере одно слово в упомянутой последовательности слов автоматически выделяется в зависимости от степени достоверности его распознавания; и программный код, чтобы заменять по меньшей мере одно слово в упомянутой последовательности слов, в случае, если оно было выбрано пользователем для исправления.
Упомянутый носитель данных может быть любой энергозависимой или энергонезависимой памятью или запоминающим элементом, таким как постоянное запоминающее устройство (ПЗУ), оперативное запоминающее устройство (ОЗУ), флэш-карта или карта памяти, и диск, читаемый оптическим, электрическим или магнитным способами. Упомянутый программный код, включенный в упомянутое программное приложение, может быть осуществлен в процедурном языке программирования высокого уровня или в объектно-ориентированном языке программирования, чтобы управлять компьютерной системой, а также в ассемблере или в машинном языке программирования, чтобы управлять цифровым процессором. В любом случае, упомянутый программный код может быть компилируемым или интерпретируемым кодом.
Согласно второму аспекту настоящего изобретения, предложен способ, чтобы исправлять слова в последовательности слов, которая получена при распознавании входной речевой последовательности, причем каждое слово в упомянутой последовательности связано с набором альтернативных слов-кандидатов. Упомянутый способ включает представление этой последовательности слов пользователю, и замену по меньшей мере одного слова в упомянутой последовательности слов, в случае, если оно было выбрано пользователем для исправления, словом-кандидатом из связанного набора слов-кандидатов, причем упомянутые слова-кандидаты в наборе слов-кандидатов, связанном с упомянутым по меньшей мере одним выбранным словом, упорядочены согласно критерию упорядочивания, основанному на правдоподобии слов-кандидатов, чтобы правильно заменить упомянутое по меньшей мере одно выбранное слово.
Для каждого из слов в упомянутой последовательности слов существует ряд слов-кандидатов. Причем различные наборы слов-кандидатов могут содержать одинаковое количество слов-кандидатов, или различное количество слов-кандидатов. Упомянутые слова-кандидаты могут, например, быть определены устройством распознавания речи в течение упомянутого распознавания речи. Например, устройство распознавания речи может принять упомянутую входную речевую последовательность, которая может быть речевым представлением одного или более слов, и может выполнять распознавание сегментов упомянутой входной речевой последовательности, чтобы определить одно или больше слов, которые представлены упомянутой входной речевой последовательностью. Для каждого из упомянутых сегментов входного речевого фрагмента, которые допущены устройством распознавания речи, чтобы представлять соответствующее слово, устройство речевого распознавания может сформировать ряд возможных результатов распознавания, причем, например, самый вероятный результат распознавания представлен на выходе устройства соответствующим словом, а остальные результаты распознавания представлены соответствующим набором слов-кандидатов (или их поднабором), связанных с упомянутым соответствующим словом.
Упомянутая последовательность слов, полученная после распознавания речи, может быть представлена пользователю, чтобы обеспечить пользователя возможностью корректировать результат распознавания речи. Тогда пользователь может выбрать по меньшей мере одно слово из упомянутой последовательности слов, если он считает, что данное по меньшей мере одно выбранное слово распознано ошибочно. В ответ на такой выбор, по меньшей мере одно выбранное слово может быть заменено словом-кандидатом из набора слов-кандидатов, которые связаны по меньшей мере с одним выбранным словом. Упомянутая замена может быть выполнена автоматически или на основе взаимодействия с пользователем. Согласно второму аспекту настоящего изобретения и в отличие от предшествующих способов исправления ошибок, слова-кандидаты по меньшей мере в упомянутом наборе слов-кандидатов, который связан по меньшей мере с одним выбранным словом, могут быть упорядочены согласно критерию упорядочивания, основанному на правдоподобии слов-кандидатов для правильной замены по меньшей мере одного выбранного слова. Это может значительно ускорить выбор слов-кандидатов в упомянутом наборе слов-кандидатов. Например, если слова-кандидаты упорядочивают в связи с уменьшением их правдоподобия, чтобы правильно заменить по меньшей мере одно выбранное слово, и если набор слов-кандидатов представлен пользователю в форме списка (например, как прокручиваемый список), то пользователю, вероятно, достаточно только прочитать первые записи в списке, пока он не найдет правильную замену для упомянутого по меньшей мере одного выбранного слова. Кроме того, если пользователь должен перемещать селектор по всему списку, чтобы выбрать слово-кандидат, которое может заменить по меньшей мере одно выбранное слово, также может быть минимизировано количество необходимых шагов движения селектора, что обеспечивает более быстрое и эффективное исправление ошибок. Упомянутое упорядочивание слов-кандидатов в наборе слов-кандидатов может быть, например, выполнено только для упомянутого набора слов-кандидатов, которые связаны с упомянутым по меньшей мере одним выбранным словом, например, после выбора по меньшей мере одного слова. Это поможет сэкономить часть вычислительной мощности, затраченной на сортировку. Альтернативно, упомянутое упорядочивание слов-кандидатов может быть выполнено для всех наборов слов-кандидатов, например, в течение или после распознавания речи. Тогда сортировка может быть исключена после выбора по меньшей мере одного слова для исправления, вследствие чего фактический процесс исправления ошибок может быть ускорен.
В иллюстративной реализации способа, согласно второму аспекту настоящего изобретения, критерий упорядочивания основан по меньшей мере на одной из языковых моделей, которая содержит статистику правдоподобия набора слов, включающего по меньшей мере одно слово, существующее в языке, а также на достоверности распознавания слов-кандидатов, причем упомянутая достоверность распознавания выражает, для каждого слова-кандидата в наборе слов-кандидатов, соответствующую достоверность того, что слово-кандидат представляет результат правильного распознавания речи.
Упомянутая языковая модель может, например, быть униграмматической моделью, которая выражает правдоподобие одиночного слова, существующего (или используемого) в языке. Это правдоподобие может быть выражено в форме языкового балла модели, при котором редким словам соответствуют более низкие баллы. С таким же успехом, языковая модель может быть биграмматической моделью, которая рассматривает правдоподобие набора слов, включающего два слова, существующие в языке (или, другими словами, правдоподобие двух слов языка, которые могут следовать друг за другом). Также может быть рассмотрена статистика наборов слов, включающих три или более слов (например, триграмматическая модель и т.д.). Если упомянутый критерий упорядочивания основан на биграмматической языковой модели, то может быть рассмотрено предшествующее слово и/или последующее слово в данной последовательности слов, при упорядочивании слов-кандидатов в наборе слов-кандидатов, связанном со словом, которое стоит между предшествующим словом и последующим словом.
Если упомянутый критерий упорядочивания основан на достоверности распознавания, то степени достоверности распознавания, как, например, определенные устройством речевого распознавания для каждого слова-кандидата в наборе слов-кандидатов, рассматривают при упорядочивании слов-кандидатов в упомянутых наборах слов-кандидатов.
Упомянутый критерий упорядочивания также может быть основан и на языковой модели, и на достоверности распознавания, например, путем назначения каждому слову-кандидату балл языковой модели и степень достоверности распознавания, с последующим комбинированием обоих показателей в комбинированном балле, который может быть рассмотрен при упорядочивании упомянутых слов-кандидатов.
В другой иллюстративной реализации способа, согласно второму аспекту настоящего изобретения, выбор упомянутого слова-кандидата, которое заменяет по меньшей мере одно выбранное слово, из набора слов-кандидатов включает пошаговый перебор слов-кандидатов по принципу «слово-за-словом».
Упомянутый набор слов-кандидатов, например, может быть представлен пользователю в форме списка (например, прокручивающегося списка), а упомянутый пошаговый перебор, например, может быть выполнен с помощью джойстика или клавишей курсора клавиатуры, причем каждое движение джойстика (например, построчная прокрутка упомянутого списка) или каждое нажатие на клавишу курсора продвигает селектор вперед или назад на одно слово-кандидат. Очевидно, упорядочивание слов-кандидатов, например в порядке уменьшения возможности правильной замены ими по меньшей мере одного выбранного слова, согласно второму аспекту настоящего изобретения, может внести свой вклад в сокращение количества шагов, необходимых при выборе заменяющего слова-кандидата, поскольку слова-кандидаты, которые с наибольшей вероятностью подходят для замены упомянутого по меньшей мере одного выбранного слова, расположены в начале упомянутого списка, где также может быть первоначально позиционирован и селектор.
В другой иллюстративной реализации способа, согласно второму аспекту настоящего изобретения, упомянутый критерий упорядочивания по меньшей мере основан на языковой модели, которая содержит статистику правдоподобия по меньшей мере двух слов языка, следующих друг за другом, и этот способ также включает обновление, - в случае, если по меньшей мере одно слово было выбрано и заменено в упомянутой последовательности словом-кандидатом, - порядка слов-кандидатов по меньшей мере в одном наборе слов-кандидатов, связанном с соответствующим словом, соседним, - в пределах данной последовательности слов, - с упомянутым по меньшей мере одним выбранным и замененным словом, при этом упомянутое обновление порядка слов-кандидатов в по меньшей мере одном наборе слов-кандидатов может быть выполнено согласно упомянутому критерию упорядочивания и с учетом данного слова-кандидата, которым было заменено по меньшей мере одно выбранное и замененное слово.
В этом отношении упомянутый критерий упорядочивания может быть основан исключительно на упомянутой языковой модели, которая, например, может быть биграмматической языковой моделью или с таким же успехом может быть основана на дополнительной информации, такой как, например, достоверность распознавания слов-кандидатов. Когда выбранное слово заменено словом-кандидатом из набора слов-кандидатов, который связан с упомянутым выбранным словом, то упорядочивание набора слов-кандидатов, связанных с предыдущим словом и/или последующим словом в данной последовательности слов, может быть обновлено согласно упомянутому критерию упорядочивания. Поскольку порядок слов-кандидатов в упомянутых наборах слов-кандидатов, связанных с предыдущими и последующими словами, зависит от выбранного и замененного слова в силу зависимости упомянутого критерия упорядочивания от языковой модели (например, биграмматической языковой модели), то обновление упомянутых наборов слов-кандидатов улучшает качество упорядочивания наборов слов-кандидатов и, таким способом, помогает осуществлять исправление ошибок, согласно настоящему изобретению, быстрее и более эффективно. Ситуация, при которой порядок слов-кандидатов требует обновления только в одном наборе слов-кандидатов, может возникнуть, если упомянутая последовательность слов включает только два слова, одно из которых выбрано и заменено. Кроме того, если предположить, что слова выбраны пользователем для исправления одно за другим, например, с самого начала упомянутой последовательности слов, то может быть достаточно обновить только порядок слов-кандидатов в наборах слов-кандидатов, связанных со словами, которые можно считать правильными соседями выбранных и замененных слов. Это может значительно сократить издержки сортирования.
Кроме того, согласно второму аспекту настоящего изобретения, предложено устройство для исправления слов в последовательности слов, полученной при распознавании входной речевой последовательности, в котором для каждого слова в упомянутой последовательности слов существует связанный с ним набор альтернативных слов-кандидатов. Упомянутое устройство включает средства, выполненные с возможностью представлять данную последовательность слов пользователю; и средства, выполненные с возможностью заменять по меньшей мере одно слово в упомянутой последовательности слов, - в случае, если оно было выбрано пользователем для исправления, - словом-кандидатом из связанного с ним набора слов-кандидатов, причем упомянутые слова-кандидаты в упомянутом наборе слов-кандидатов, который связан по меньшей мере с одним выбранным словом, упорядочены согласно критерию упорядочивания, сформированному на основе правдоподобия слов-кандидатов, с целью правильной замены упомянутого по меньшей мере одного выбранного слова.
Пример реализации устройства, согласно второму аспекту настоящего изобретения, также содержит средства, выполненные с возможностью пошагового перебора альтернатив выбора по принципу "кандидат-за-кандидатом", с целью выбора слова-кандидата, которое заменяет по меньшей мере одно выбранное слово, из упомянутого набора слов-кандидатов. Такие средства могут, например, включать джойстик или клавиатуру.
Другая иллюстративная реализация устройства, согласно второму аспекту настоящего изобретения, включает средства, выполненные с возможностью обновлять, - в случае, если в данной последовательности слов по меньшей мере одно слово было выбрано и заменено словом-кандидатом, - порядок слов-кандидатов по меньшей мере в одном наборе слов-кандидатов, связанном с соответствующим словом, соседним, - в пределах данной последовательности слов, - с упомянутым по меньшей мере одним выбранным и замененное словом, причем упомянутый критерий упорядочивания по меньшей мере основан на языковой модели, которая содержит статистику правдоподобия по меньшей мере двух слов языка, следующих друг за другом, при этом обновление упомянутого порядка слов-кандидатов по меньшей мере в одном наборе слов-кандидатов может быть выполнено в соответствии с упомянутым критерием упорядочивания и с учетом упомянутого слова-кандидата, которым было заменено по меньшей мере одно выбранное и замененное слово.
Другая иллюстративная реализация устройства, согласно второму аспекту настоящего изобретения, представляет собой портативное мультимедийное устройство или часть его.
Согласно второму аспекту настоящего изобретения, также предложен прикладной программный продукт, включающий носитель данных, содержащий программное приложение для исправления слов в последовательности слов, которая получена после распознавания входной речевой последовательности, причем для каждого слова в данной последовательности слов существует связанный с ним набор альтернативных слов-кандидатов. Упомянутое программное приложение включает программный код для того, чтобы представлять данную последовательность слов пользователю, и программный код для того, чтобы заменять по меньшей мере одно слово в данной последовательности слов - в случае, если оно было выбрано упомянутым пользователем для исправления, - словом-кандидатом из связанного с ним набора слов-кандидатов, причем слова-кандидаты в упомянутом наборе слов-кандидатов, который связан по меньшей мере с одним выбранным словом, упорядочены согласно критерию упорядочивания, сформированному на основе правдоподобия упомянутых слов-кандидатов, с целью правильной замены по меньшей мере одного выбранного слова.
В иллюстративной реализации прикладного программного продукта, согласно второму аспекту настоящего изобретения, упомянутый критерий упорядочивания по меньшей мере основан на языковой модели, которая содержит статистику правдоподобия следования друг за другом по меньшей мере двух слов языка, и упомянутый прикладной программный продукт также включает программный код для обновления - в случае, если по меньшей мере одно слово выбрано и заменено в данной последовательности слов упомянутым словом-кандидатом, - порядка слов-кандидатов по меньшей мере в одном наборе слов-кандидатов, связанном с соответствующим словом, соседним - в пределах данной последовательности слов, - с упомянутым по меньшей мере одним выбранным и замененным словом, причем такое обновление упомянутого порядка слов-кандидатов по меньшей мере в одном наборе слов-кандидатов может быть выполнено в соответствии с упомянутым критерием упорядочивания и с учетом упомянутого слова-кандидата, которым было заменено по меньшей мере одно выбранное и замененное слово.
Согласно третьему аспекту настоящего изобретения, предложен способ для исправления слов в последовательности слов, которая получена при распознавании входной речевой последовательности, причем для каждого слова в данной последовательности слов существует связанный с ним набор альтернативных слов-кандидатов. Этот способ включает представление данной последовательности слов пользователю; и замену по меньшей мере одного слова в данной последовательности слов - в случае, если оно выбрано пользователем для исправления, - словом, полученным при распознавании новой входной речевой последовательности, которая содержит только представление правильной версии по меньшей мере одного выбранного слова, произнесенного пользователем, причем словарь распознавания, который используют при распознавании данной новой входной речевой последовательности, может быть ограничен упомянутым набором слов-кандидатов, связанным по меньшей мере с одним выбранным словом.
Таким способом, если начальное распознавание речи, которое основано на данной входной речевой последовательности и на специальном словаре распознавания (представляющем набор слов, которые при распознавании речи принимают во внимание как возможные результаты распознавания речи), приводит к неправильному распознаванию по меньшей мере одного выбранного слова, то исправление ошибок выполняют, повторяя распознавание на основе новой входной речевой последовательности, которая содержит речевое представление только данной правильной версии по меньшей мере одного выбранного слова, и ограниченного словаря распознавания, включающего только слова-кандидаты из упомянутого набора слов-кандидатов, который связан по меньшей мере с одним выбранным словом. Это может быть полезно в случаях, когда возникают существенные различия между упомянутыми словами-кандидатами с точки зрения акустики, но незначительные различия между упомянутыми словами-кандидатами с точки зрения языковой модели. В отличие от больших словарей распознавания, обычно используемых в предшествующих способах исправления ошибок, упомянутый сокращенный словарь распознавания обеспечивает, согласно третьему аспекту настоящего изобретения, менее сложное и, соответственно, более быстрое и более надежное распознавание речи.
Согласно третьему аспекту настоящего изобретения, также предложено устройство для того, чтобы исправлять слова в последовательности слов, которая получена при распознавании входной речевой последовательности, причем для каждого слова в данной последовательности слов существует связанный с ним набор альтернативных слов-кандидатов. Упомянутое устройство включает средства, выполненные с возможностью представления данной последовательности слов пользователю; и средства, выполненные с возможностью замены по меньшей мере одного слова в данной последовательности слов, - в случае, если оно выбрано пользователем для исправления, - словом, полученным при распознавании новой входной речевой последовательности, которая содержит только представление правильной версии упомянутого по меньшей мере одного выбранного слова, произнесенного пользователем, причем словарь распознавания, используемый в упомянутом распознавании данной новой входной речевой последовательности, ограничен упомянутым набором слов-кандидатов, связанным по меньшей мере с одним выбранным словом.
Иллюстративная реализация устройства согласно третьему аспекту настоящего изобретения представляет собой портативное мультимедийное устройство или часть его.
Согласно третьему аспекту настоящего изобретения, также предложен прикладной программный