Устройство предоставления информации и некратковременный компьютерно-читаемый носитель, сохраняющий программу предоставления информации

Иллюстрации

Показать все

Группа изобретений относится к средствам предоставления информации для водителей. Технический результат – повышение точности определения информации, которую необходимо предоставить водителю. Для этого предложено устройство предоставления информации, которое включает в себя модуль управления (ECU), который задает функцию вознаграждения с помощью данных предыстории по отклику от водителя на предложение вероятных операций для бортового компонента и вычисляет распределение вероятностей выполнения каждого из действий в каждом из состояний, через обучение с подкреплением на основе функции вознаграждения. ECU вычисляет степень дисперсии распределения вероятностей и также формирует предложение вероятных операций на основе метода проб и ошибок в отношении того, чтобы выбирать целевое действие и выводить его, когда степень дисперсии распределения вероятностей равна или выше порогового значения, и формирует окончательное предложение вероятных операций в отношении того, чтобы фиксировать и выводить целевое действие, когда значение степени дисперсии распределения вероятностей меньше порогового значения. 4 н. и 7 з.п. ф-лы, 20 ил.

Реферат

Уровень техники

1. Область техники, к которой относится изобретение

[0001] Изобретение относится к устройству предоставления информации и к некратковременному компьютерно-читаемому носителю, сохраняющему программу предоставления информации, которая накапливает и изучает данные предыстории по отклику, от пользователя (водителя), на предоставляемую информацию и предоставляет информацию, совпадающую с намерением пользователя (водителя), на основе результата обучения.

2. Описание предшествующего уровня техники

[0002] В качестве этого вида устройства предоставления информации, известно устройство (система пользовательского интерфейса), описанное, например, в WO 2015/162638. В этом устройстве, при выполнении функции звукового ввода, в текущий момент времени сначала оцениваются возможные варианты звуковой операции, которая должна выполняться пользователем (водителем) с использованием информации относительно ситуации транспортного средства, и три из оцененных возможных вариантов звуковой операции отображаются в качестве вариантов в порядке убывания вероятности посредством сенсорной панели. Затем, определяется то, какой из этих вариантов выбран водителем через ввод вручную, и цель звуковой операции определяется. Кроме того, инструкция, которая заставляет пользователя вводить звук, формируется в соответствии с определенной целью звуковой операции и выводится. Далее, водитель вводит звук в соответствии с этой инструкцией, за счет этого определяя и выполняя целевую функцию транспортного средства. Затем ввод звуковой операции, которая совпадает с намерением пользователя, в силу этого предоставляется в соответствии с ситуацией транспортного средства в текущий момент времени, так что уменьшается рабочая нагрузка, налагаемая на пользователя, который вводит звук.

[0003] Однако, в устройстве, описанном в вышеуказанном документе, при выполнении функции транспортного средства, пользовательский интерфейс изменяется из рабочего режима на основе ввода вручную на рабочий режим на основе звукового ввода для вариантов, отображаемых посредством сенсорной панели. Следовательно, нагрузка, налагаемая на водителя, неизбежно увеличивается.

[0004] Кроме того, в устройстве, описанном в вышеуказанном документе, ввод звуковой операции упрощается, но следующая операция реализует не более чем функцию, аналогичную функции существующей речевой диалоговой системы. Следовательно, нагрузка, налагаемая на водителя, должна дополнительно уменьшаться.

Сущность изобретения

[0005] Изобретение предоставляет устройство предоставления информации и некратковременный компьютерно-читаемый носитель, сохраняющий программу предоставления информации, который может формировать более надлежащее предложение вероятных операций для бортового компонента таким образом, что оно совпадает с намерением водителя в качестве предоставления информации при недопущении отвлечения водителя, посредством согласованного использования простого пользовательского интерфейса.

[0006] Устройство предоставления информации согласно первому аспекту изобретения оснащено агентским электронным модулем управления. Агентский ECU имеет модуль составления пространства состояний, модуль составления пространства действий, модуль обучения с подкреплением, модуль вычисления степени дисперсии и модуль предоставления информации. Модуль составления пространства состояний выполнен с возможностью задавать состояние транспортного средства посредством ассоциирования множества типов данных транспортного средства между собой и составлять пространство состояний в качестве набора из множества состояний. Модуль составления пространства действий выполнен с возможностью задавать, в качестве действия, данные, указывающие содержание операции бортового компонента, которая выполняется через отклик, от водителя, на предложение вероятных операций для бортового компонента и составлять пространство действий в качестве набора из множества действий. Модуль обучения с подкреплением выполнен с возможностью накапливать предысторию отклика, от водителя, на предложение вероятных операций для бортового компонента, задавать функцию вознаграждения в качестве индекса, представляющего степень целесообразности предложения вероятных операций для бортового компонента, при одновременном использовании накопленной предыстории и вычислять распределение вероятностей выполнения каждого из действий, составляющих пространство действий, в каждом из состояний, составляющих пространство состояний, через обучение с подкреплением на основе функции вознаграждения. Модуль вычисления степени дисперсии выполнен с возможностью вычислять степень дисперсии распределения вероятностей, которое вычисляется посредством модуля обучения с подкреплением. Модуль предоставления информации выполнен с возможностью формировать окончательное предложение вероятных операций в отношении того, чтобы фиксировать целевое действие в качестве цели предложения вероятных операций и выводить это целевое действие, когда степень дисперсии распределения вероятностей, которая вычисляется посредством модуля вычисления степени дисперсии, меньше порогового значения, и формировать предложение вероятных операций на основе метода проб и ошибок в отношении того, чтобы выбирать целевое действие в качестве цели предложения вероятных операций из множества возможных вариантов и выводить это целевое действие, когда степень дисперсии распределения вероятностей, которая вычисляется посредством модуля вычисления степени дисперсии, равна или выше порогового значения.

[0007] Кроме того, на некратковременном компьютерно-читаемом носителе, сохраняющем программу предоставления информации согласно второму аспекту изобретения, программа предоставления информации программируется с возможностью инструктировать компьютеру реализовывать функцию составления пространства состояний, функцию составления пространства действий, функцию обучения с подкреплением, функцию вычисления степени дисперсии и функцию предоставления информации. Функция составления пространства состояний спроектирована с возможностью задавать состояние транспортного средства посредством ассоциирования множества типов данных транспортного средства между собой и составлять пространство состояний в качестве набора из множества состояний. Функция составления пространства действий спроектирована с возможностью задавать, в качестве действия, данные, указывающие содержание операции бортового компонента, которая выполняется через отклик, от водителя, на предложение вероятных операций для бортового компонента и составлять пространство действий в качестве набора из множества действий. Функция обучения с подкреплением спроектирована с возможностью накапливать предысторию отклика, от водителя, на предложение вероятных операций для бортового компонента, задавать функцию вознаграждения в качестве индекса, представляющего степень целесообразности предложения вероятных операций для бортового компонента, при одновременном использовании накопленной предыстории и вычислять распределение вероятностей выполнения каждого из действий, составляющих пространство действий, в каждом из состояний, составляющих пространство состояний, через обучение с подкреплением на основе функции вознаграждения. Функция вычисления степени дисперсии спроектирована с возможностью вычислять степень дисперсии распределения вероятностей, которое вычисляется через функцию обучения с подкреплением. Функция предоставления информации спроектирована с возможностью формировать окончательное предложение вероятных операций в отношении того, чтобы фиксировать целевое действие в качестве цели предложения вероятных операций и выводить это целевое действие, когда степень дисперсии распределения вероятностей, которая вычисляется через функцию вычисления степени дисперсии, меньше порогового значения, и формировать предложение вероятных операций на основе метода проб и ошибок в отношении того, чтобы выбирать целевое действие в качестве цели предложения вероятных операций из множества возможных вариантов и выводить это целевое действие, когда степень дисперсии распределения вероятностей, которая вычисляется через функцию вычисления степени дисперсии, равна или выше порогового значения.

[0008] В каждом из вышеуказанных первого и второго аспектов изобретения, функция вознаграждения задается в качестве индекса, представляющего степень целесообразности предложения вероятных операций для бортового компонента, при одновременном использовании предыстории отклика, от водителя, на предложение вероятных операций для бортового компонента. Затем модель принятия решений водителя в отношении предложения вероятных операций для бортового компонента в каждом из состояний структурируется через обучение с подкреплением на основе этой функции вознаграждения. Кроме того, распределение вероятностей содержания операции бортового компонента, которая выполняется через отклик, от водителя, на предложение вероятных операций для бортового компонента в каждом из состояний, вычисляется, при одновременном использовании этой структурированной модели. В данном документе следует отметить, что степень дисперсии распределения вероятностей содержания операции бортового компонента обычно отличается в зависимости от цели предложения вероятных операций для бортового компонента. Например, в случае если цель предложения вероятных операций для бортового компонента представляет собой воспроизведение звука, эта цель, в общем, подвержена настроению водителя в это время и т.п., а также состоянию транспортного средства, и предусмотрено множество вариантов. Следовательно, степень дисперсии распределения вероятностей содержания операции бортового компонента с большой вероятностью является большой. С другой стороны, в случае если цель предложения вероятных операций для бортового компонента представляет собой задание пункта назначения, в общем, проще ограничивать число вариантов из состояния транспортного средства в каждом отдельном случае, по сравнению со случаем воспроизведения звука. Следовательно, степень дисперсии распределения вероятностей содержания операции бортового компонента с большой вероятностью является небольшой. В этом отношении, согласно вышеуказанной конфигурации, когда степень дисперсии распределения вероятностей меньше порогового значения, окончательное предложение вероятных операций формируется в отношении того, чтобы фиксировать целевое действие в качестве цели предложения вероятных операций и выводить это целевое действие. Таким образом, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, формируется без беспокойства водителя в отношении выбора содержания операции бортового компонента. С другой стороны, в вышеуказанной конфигурации, когда степень дисперсии распределения вероятностей равна или выше порогового значения, предложение вероятных операций на основе метода проб и ошибок формируется в отношении того, чтобы выбирать целевое действие в качестве цели предложения вероятных операций из множества возможных вариантов и выводить это целевое действие. Таким образом, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, более адекватно формируется. Таким образом, в вышеуказанной конфигурации, только один содержание операции бортового компонента выводится за один раз в качестве цели предложения вероятных операций, независимо от того, является степень дисперсии распределения вероятностей большой или небольшой. Следовательно, водитель должен только выражать свое желание, т.е. то, следует или нет соглашаться с содержанием операции бортового компонента, которая предлагается в каждом отдельном случае. Следовательно, отклики на различные типы предложений вероятных операций для бортового компонента с различными степенями дисперсии распределения вероятностей, такие как задание пункта назначения и воспроизведение звука, могут согласованно формироваться при одновременном использовании идентичного простого пользовательского интерфейса. Таким образом, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, может формироваться при недопущении беспокойства водителя.

[0009] Устройство предоставления информации согласно третьему аспекту изобретения оснащено агентским электронным модулем управления. Агентский ECU имеет модуль составления пространства состояний, модуль составления пространства действий, модуль обучения с подкреплением, модуль вычисления степени дисперсии и модуль предоставления информации. Модуль составления пространства состояний выполнен с возможностью задавать состояние транспортного средства посредством ассоциирования множества типов данных транспортного средства между собой и составлять пространство состояний в качестве набора из множества состояний. Модуль составления пространства действий выполнен с возможностью задавать, в качестве действия, данные, указывающие содержание операции бортового компонента, которая выполняется через отклик, от водителя, на предложение вероятных операций для бортового компонента и составлять пространство действий в качестве набора из множества действий. Модуль обучения с подкреплением выполнен с возможностью накапливать предысторию отклика, от водителя, на предложение вероятных операций для бортового компонента, задавать функцию вознаграждения в качестве индекса, представляющего степень целесообразности предложения вероятных операций для бортового компонента, при одновременном использовании накопленной предыстории и вычислять распределение вероятностей выполнения каждого из действий, составляющих пространство действий, в каждом из состояний, составляющих пространство состояний, через обучение с подкреплением на основе функции вознаграждения. Модуль вычисления степени дисперсии выполнен с возможностью вычислять степень дисперсии пространства состояний посредством суммирования степени дисперсии распределения вероятностей, которое вычисляется посредством модуля обучения с подкреплением в отношении множества состояний, составляющих пространство состояний. Модуль предоставления информации выполнен с возможностью формировать окончательное предложение вероятных операций в отношении того, чтобы фиксировать целевое действие в качестве цели предложения вероятных операций и выводить это целевое действие, когда степень дисперсии пространства состояний, которая вычисляется посредством модуля вычисления степени дисперсии, меньше порогового значения, и формировать предложение вероятных операций на основе метода проб и ошибок в отношении того, чтобы выбирать целевое действие в качестве цели предложения вероятных операций из множества возможных вариантов и выводить это целевое действие, когда степень дисперсии пространства состояний, которая вычисляется посредством модуля вычисления степени дисперсии, равна или выше порогового значения.

[0010] На некратковременном компьютерно-читаемом носителе, сохраняющем программу предоставления информации согласно четвертому аспекту изобретения, программа предоставления информации программируется с возможностью инструктировать компьютеру реализовывать функцию составления пространства состояний, функцию составления пространства действий, функцию обучения с подкреплением, функцию вычисления степени дисперсии и функцию предоставления информации. Функция составления пространства состояний спроектирована с возможностью задавать состояние транспортного средства посредством ассоциирования множества типов данных транспортного средства между собой и составлять пространство состояний в качестве набора из множества состояний. Функция составления пространства действий спроектирована с возможностью задавать, в качестве действия, данные, указывающие содержание операции бортового компонента, которая выполняется через отклик, от водителя, на предложение вероятных операций для бортового компонента и составлять пространство действий в качестве набора из множества действий. Функция обучения с подкреплением спроектирована с возможностью накапливать предысторию отклика, от водителя, на предложение вероятных операций для бортового компонента, задавать функцию вознаграждения в качестве индекса, представляющего степень целесообразности предложения вероятных операций для бортового компонента, при одновременном использовании накопленной предыстории и вычислять распределение вероятностей выполнения каждого из действий, составляющих пространство действий, в каждом из состояний, составляющих пространство состояний, через обучение с подкреплением на основе функции вознаграждения. Функция вычисления степени дисперсии спроектирована с возможностью вычислять степень дисперсии пространства состояний посредством суммирования степени дисперсии распределения вероятностей, которое вычисляется через функцию обучения с подкреплением в отношении множества состояний, составляющих пространство состояний. Функция предоставления информации спроектирована с возможностью формировать окончательное предложение вероятных операций в отношении того, чтобы фиксировать целевое действие в качестве цели предложения вероятных операций и выводить это целевое действие, когда степень дисперсии пространства состояний, которая вычисляется через функцию вычисления степени дисперсии, меньше порогового значения, и формировать предложение вероятных операций на основе метода проб и ошибок в отношении того, чтобы выбирать целевое действие в качестве цели предложения вероятных операций из множества возможных вариантов и выводить это целевое действие, когда степень дисперсии пространства состояний, которая вычисляется через функцию вычисления степени дисперсии, равна или выше порогового значения.

[0011] Согласно каждому из вышеуказанных третьего и четвертого аспектов изобретения, функция вознаграждения задается в качестве индекса, представляющего степень целесообразности предложения вероятных операций для бортового компонента, при одновременном использовании предыстории отклика, от водителя, на предложение вероятных операций для бортового компонента. Затем модель принятия решений водителя в отношении предложения вероятных операций для бортового компонента в каждом из состояний структурируется через обучение с подкреплением на основе этой функции вознаграждения. Кроме того, распределение вероятностей содержания операции бортового компонента, которая выполняется через отклик, от водителя, на предложение вероятных операций для бортового компонента в каждом из состояний, вычисляется, при одновременном использовании этой структурированной модели. В данном документе следует отметить, что степень дисперсии распределения вероятностей содержания операции бортового компонента обычно отличается в зависимости от цели предложения вероятных операций для бортового компонента. Например, в случае если цель предложения вероятных операций для бортового компонента представляет собой воспроизведение звука, эта цель, в общем, подвержена настроению водителя в это время и т.п., а также состоянию транспортного средства, и предусмотрено множество вариантов. Следовательно, степень дисперсии распределения вероятностей содержания операции бортового компонента с большой вероятностью является большой. С другой стороны, в случае если цель предложения вероятных операций для бортового компонента представляет собой задание пункта назначения, в общем, проще ограничивать число вариантов из состояния транспортного средства в каждом отдельном случае, по сравнению со случаем воспроизведения звука. Следовательно, степень дисперсии распределения вероятностей содержания операции бортового компонента с большой вероятностью является небольшой. В этом отношении, согласно вышеуказанной конфигурации, когда степень дисперсии пространства состояний, которая получена из суммированного значения степеней дисперсии распределения вероятностей, меньше порогового значения, окончательное предложение вероятных операций формируется в отношении того, чтобы фиксировать целевое действие в качестве цели предложения вероятных операций и выводить это целевое действие. Таким образом, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, формируется без беспокойства водителя в отношении выбора содержания операции бортового компонента. С другой стороны, в вышеуказанной конфигурации, когда степень дисперсии пространства состояний, которая получена из суммированного значения степеней дисперсии распределения вероятностей, равна или выше порогового значения, предложение вероятных операций на основе метода проб и ошибок формируется в отношении того, чтобы выбирать целевое действие в качестве цели предложения вероятных операций из множества возможных вариантов и выводить это целевое действие. Таким образом, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, более адекватно формируется. Таким образом, в вышеуказанной конфигурации, только один содержание операции бортового компонента выводится за один раз в качестве цели предложения вероятных операций независимо от того, является степень дисперсии пространственного состояния большой или небольшой. Следовательно, водитель должен только выражать свое желание, т.е. то, следует или нет соглашаться с содержанием операции бортового компонента, которая предлагается в каждом отдельном случае. Следовательно, отклики на различные типы предложений вероятных операций для бортового компонента с различными степенями дисперсии пространства состояний, такие как задание пункта назначения и воспроизведение звука, могут согласованно формироваться при одновременном использовании идентичного простого пользовательского интерфейса. Таким образом, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, может формироваться при недопущении отвлечения водителя.

[0012] В вышеуказанном втором аспекте изобретения, модуль обучения с подкреплением может приспосабливать, в качестве политики, преобразование из каждого из состояний, составляющих пространство состояний, в каждое из действий, составляющих пространство действий, задавать, в качестве функции-значения состояния, ожидаемое значение кумулятивного вознаграждения, которое получается, когда политики придерживаются в каждом из состояний, оценивать, в качестве функции-значения оптимального действия, ожидаемое значение кумулятивного вознаграждения, которое всегда получается, когда оптимальной политики придерживаются после того, как предварительно определенное действие выбирается из пространства действий в каждом из состояний, составляющих пространство состояний, при условии, что оптимальная политика представляет собой политику, которая максимизирует функцию-значение состояния во всех состояниях, составляющих пространство состояний, и вычислять распределение вероятностей на основе оцененной функции-значения оптимального действия. Модуль предоставления информации может формировать окончательное предложение вероятных операций с выбором в качестве цели действия, которое максимизирует функцию-значение оптимального действия в текущем состоянии, когда степень дисперсии пространства состояний, которая вычисляется посредством модуля вычисления степени дисперсии, меньше порогового значения.

[0013] В вышеуказанной конфигурации, когда степень дисперсии пространства состояний меньше порогового значения, окончательное предложение вероятных операций формируется с выбором в качестве цели действия, которое максимизирует функцию-значение оптимального действия в текущем состоянии, а именно, действия, которое является самым ценным и которое предположительно с наибольшей вероятностью должно осуществляться водителем в текущем состоянии. Таким образом, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, может быть реализовано с более высокой надежностью.

[0014] В вышеуказанном устройстве предоставления информации, модуль предоставления информации может быть выполнен с возможностью формировать предложение вероятных операций на основе метода проб и ошибок с такой тенденцией, чтобы повышать частоту выбора действия в качестве цели по мере того, как повышается плотность распределения вероятностей для распределения вероятностей действия в текущем состоянии, когда степень дисперсии пространства состояний, которая вычисляется посредством модуля вычисления степени дисперсии, равна или выше порогового значения.

[0015] В вышеуказанной конфигурации, когда степень дисперсии пространства состояний равна или выше порогового значения, предложение вероятных операций на основе метода проб и ошибок формируется с такой тенденцией, чтобы выбирать, в качестве цели предложения вероятных операций для бортового компонента, действие с плотностью высокой вероятности распределения вероятностей в текущем состоянии, а именно, действие, которое с большой вероятностью должно осуществляться водителем в текущем состоянии. Таким образом, даже в условиях, в которых затруднительно указывать действие водителя заранее в отношении предложения вероятных операций для бортового компонента в качестве цели, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, может быть реализовано с более высокой надежностью.

[0016] В вышеуказанном устройстве предоставления информации, модуль вычисления степени дисперсии может быть выполнен с возможностью задавать, в качестве энтропии, степень дисперсии распределения вероятностей выполнения каждого из действий, составляющих пространство действий, в каждом из состояний, составляющих пространство состояний, и задавать степень дисперсии пространства состояний в качестве средней энтропии. Модуль предоставления информации может быть выполнен с возможностью выбирать окончательное предложение вероятных операций или предложение вероятных операций на основе метода проб и ошибок с такой тенденцией, чтобы повышать частоту формирования предложения вероятных операций на основе метода проб и ошибок по мере того, как увеличивается ε-значение, при одновременном использовании ε-жадного метода, в котором значение средней энтропии задается в качестве ε-значения.

[0017] В вышеуказанной конфигурации, частота выбора предложения вероятных операций на основе метода проб и ошибок повышается по мере того, как увеличивается ε-значение в качестве значения средней энтропии, которая задает степень дисперсии пространства состояний, а именно, по мере того, как увеличивается степень дисперсии состояний. Таким образом, также, даже в условиях, в которых затруднительно указывать действие водителя в отношении предложения вероятных операций для бортового компонента в качестве цели, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, может быть реализовано с более высокой надежностью.

[0018] В вышеуказанном устройстве предоставления информации, модуль обучения с подкреплением может быть выполнен с возможностью задавать, в качестве функции вознаграждения, частоту выполнения операции бортового компонента через отклик водителя на предложение вероятных операций для бортового компонента и обновлять функцию вознаграждения в соответствии с изменением предыстории работы для операции бортового компонента, когда бортовой компонент управляется в соответствии с предложением вероятных операций для бортового компонента.

[0019] В вышеуказанной конфигурации, функция вознаграждения задается посредством применения частоты действия, которое выполняется через отклик водителя на предложение вероятных операций для бортового компонента, в качестве индекса степени целесообразности предложения вероятных операций бортового компонента в отношении намерения водителя. Функция вознаграждения обновляется каждый раз, когда предыстория отклика изменяется. Таким образом, распределение вероятностей выполнения каждого из действий, составляющих пространство действий, в каждом из состояний, составляющих пространство состояний, может вычисляться таким образом, что оно совпадает с намерением водителя. Кроме того, точность распределения вероятностей повышается таким образом, чтобы удовлетворять фактическому отклику, сформированному водителем в качестве человека, по мере того, как увеличивается частота отклика водителя.

[0020] В вышеуказанном устройстве предоставления информации, модуль составления пространства состояний может быть выполнен с возможностью составлять пространство состояний в качестве набора состояний в качестве группы данных, которые ассоциируют ситуацию функционирования бортового компонента, характеристики пассажира или пассажиров транспортного средства и ситуацию при движении транспортного средства между собой.

[0021] В вышеуказанной конфигурации, каждое из состояний, составляющих пространство состояний, задается с учетом элементов, оказывающих влияние на предложение вероятных операций для бортового компонента, которое сформировано для водителя, таких как ситуация функционирования бортового компонента, характеристики пассажира(ов) транспортного средства, ситуация при движении транспортного средства и т.п., с множества точек зрения. Таким образом, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, может формироваться таким образом, чтобы более точно удовлетворять фактической обстановке. В этой связи, в вышеуказанной конфигурации, число состояний, составляющих пространство состояний, также оценивается как огромное, в результате учета различных элементов, как описано выше. Тем не менее, с помощью способа обучения с подкреплением, в котором накапливаются данные предыстории, и повышается точность, предложение вероятных операций для бортового компонента, которое совпадает с намерением водителя, может быть реализовано, даже когда огромное количество данных учителя не подготовлено заранее, как в случае, когда, например, используется обучение с помощью учителя.

Краткое описание чертежей

[0022] Ниже описываются признаки, преимущества и техническая и промышленная значимость примерных вариантов осуществления изобретения со ссылкой на прилагаемые чертежи, на которых аналогичные номера обозначают аналогичные элементы, и на которых:

Фиг. 1 является блок-схемой, показывающей общую конфигурацию устройства предоставления информации согласно первому варианту осуществления изобретения;

Фиг. 2 является видом, показывающим пример атрибутов данных транспортного средства, которые задают пространство состояний;

Фиг. 3 является видом, показывающим пример заданного содержания таблицы пространства состояний;

Фиг. 4 является видом, показывающим другой пример атрибутов данных транспортного средства, которые задают пространственное состояние;

Фиг. 5 является видом, показывающим другой пример заданного содержания таблицы пространства состояний;

Фиг. 6 является видом, показывающим пример заданного содержания таблицы пространства действий;

Фиг. 7 является видом, показывающим другой пример заданного содержания таблицы пространства действий;

Фиг. 8 является видом, показывающим пример матрицы вероятностей перехода при осуществлении каждого из действий, составляющих пространство действий, в каждом из состояний, составляющих пространство состояний;

Фиг. 9 является графиком, показывающим пример кумулятивной функции распределения, которая используется при формировании предложения вероятных операций на основе метода проб и ошибок;

Фиг. 10A является видом, показывающим пример атрибутов данных транспортного средства, которые задают текущее состояние;

Фиг. 10B является видом для иллюстрации процесса выбора действия, которое используется для окончательного предложения вероятных операций в состоянии, показанном на фиг. 10A;

Фиг. 11A является видом, показывающим другой пример атрибутов данных транспортного средства, которые задают текущее состояние;

Фиг. 11B является видом для иллюстрации процесса выбора действия, которое используется для предложения вероятных операций на основе метода проб и ошибок в состоянии, показанном на фиг. 11A;

Фиг. 12 является видом, показывающим пример переключателя на руле;

Фиг. 13 является блок-схемой последовательности операций способа, показывающей содержание обработки процесса формирования предложений вероятных операций бортовых компонентов в качестве примера процесса предоставления информации;

Фиг. 14 является видом, показывающим пример содержания диалога, который ведется между агентским ECU и водителем таким образом, что он включает в себя окончательное предложение вероятных операций;

Фиг. 15 является видом, показывающим пример содержания диалога, который ведется между агентским ECU и водителем таким образом, что он включает в себя предложение вероятных операций на основе метода проб и ошибок;

Фиг. 16 является видом для иллюстрации процесса выбора окончательного предложения вероятных операций и предложения вероятных операций на основе метода проб и ошибок в устройстве предоставления информации согласно второму варианту осуществления изобретения;

Фиг. 17 является видом, показывающим другой пример переключателя на руле; и

Фиг. 18 является видом, показывающим еще один другой пример переключателя на руле.

Подробное описание вариантов осуществления

[0023] Первый вариант осуществления

Далее описывается устройство предоставления информации согласно первому варианту осуществления изобретения. Устройство предоставления информации согласно настоящему варианту осуществления изобретения сконструировано посредством агентского ECU (электронного модуля управления), который монтируется в транспортном средстве и который формирует предложение вероятных операций для бортовых компонентов в качестве предоставления информации водителю. В данном документе следует отметить, что функции агентского ECU широко классифицируются на функции системы обучения, функции системы получения информации и функции системы пользовательского интерфейса. Кроме того, агентский ECU выполняет обучение с подкреплением в качестве режима обучения в системе обучения при классификации предыстории работы бортовых компонентов согласно состоянию транспортного средства в каждом отдельном случае, на основе различных фрагментов информации, полученных через систему получения информации, и формирует предложение вероятных операций для бортовых компонентов через систему пользовательского интерфейса на основе результата обучения, полученного через обучение с подкреплением. В данном документе следует отметить, что обучение с подкреплением представляет собой способ обучения, в котором агентский ECU адаптируется к окружению через методы проб и ошибок посредством предоставления некоторого вознаграждения агентскому ECU по мере того, как изменяется окружение на основе определенных действий, когда агентский ECU выбирает это действие на основе окружения. В этой связи, в настоящем варианте осуществления изобретения, агентский ECU задает состояние посредством ассоциирования различных данных транспортного средства, например, ситуации функционирования бортовых компонентов, характеристик пассажира или пассажира(ов) транспортного средства, ситуации при движении транспортного средства и т.п. между собой и составляет пространство состояний в качестве набора из множества состояний. Кроме того, агентский ECU задает, в качестве действия, тип о