2648573 - Выделение ресурсов для машинного обучения

Выделение ресурсов для машинного обучения

Иллюстрации

Показать все

Группа изобретений относится к вычислительной технике и может быть использована для машинного обучения. Техническим результатом является повышение эффективности процесса обучения. Способ содержит этапы, на которых принимают для каждой из множества опций, которым могут выделяться ресурсы системы машинного обучения, множество выборок, описывающих поведение этой опции; для каждой опции вычисляют балльную оценку с использованием выборок, причем балльная оценка выбирается из одного или более из следующего: увеличение объема информации, прирост Джини, дисперсия, энтропия; для каждой опции вычисляют доверительный интервал балльной оценки с использованием выборок; выбирают одну или более опций на основе доверительных интервалов и балльных оценок; выделяют ресурсы системы машинного обучения выбранной опции(ям). 2 н. и 7 з.п. ф-лы, 11 ил.

Реферат

Уровень техники

[0001] Множество сегодняшних систем машинного обучения испытывают значительные вычислительные сложности вследствие огромных объемов данных. Современные системы машинного обучения зачастую обрабатывают миллионы легко полученных выборок, формируя значительную вычислительную нагрузку. Для этих систем максимально эффективное осуществление логических выводов на основе очень больших объемов данных представляет собой постоянную сложность. Например, системы машинного обучения направлены на оценку того, сколько данных должно обрабатываться и в каком порядке, перед принятием решения, которое является корректным в пределах достижимой устойчивости к ошибкам. Конечные вычислительные ресурсы типично доступны, и система машинного обучения должна выделять ресурсы надлежащим образом.

[0002] Зачастую системы машинного обучения относятся к эффективному выделению конечных ресурсов, если имеется неопределенность относительно опций. Например, выяснение того, какое из многих возможных рекламных объявлений следует показывать клиенту, выделяет ресурс (вычислительный ресурс, экранное пространство) одной возможной опции (одному рекламному объявлению). Показ рекламного объявления и наблюдение пользовательской реакции (щелчок/отсутствие щелчка) раскрывает частичную информацию относительно демонстрации рекламного объявления, которая может использоваться для того, чтобы выполнять лучшие выделения ресурсов в будущем.

[0003] Варианты осуществления, описанные ниже, не ограничены реализациями, которые разрешают любые из недостатков известных систем машинного обучения.

Сущность изобретения

[0004] Далее представлена упрощенная сущность изобретения, для того чтобы предоставлять базовое понимание читателям. Это краткое изложение сущности изобретения не является всесторонним обзором раскрытия и не идентифицирует ключевые/критически важные элементы или не разграничивает объем подробного описания. Ее единственная цель состоит в том, чтобы представлять выбор понятий, раскрытых в данном документе, в упрощенной форме в качестве вступления в более подробное описание, которое представлено далее.

[0005] Выделение ресурсов для машинного обучения описывается, к примеру, для выбора между множеством возможных опций, например, в качестве части эффективного процесса обучения для обучения на основе случайных деревьев решений, для выбора того, какая из множества семейств моделей лучше всего описывает данные, для выбора того, какой из множества признаков лучше всего классифицирует элементы. В различных примерах выборки информации относительно неопределенных опций используются для того, чтобы количественно оценивать опции. В различных примерах доверительные интервалы вычисляются для балльных оценок и используются для того, чтобы выбирать одну или более опций. В примерах балльные оценки опций могут представлять собой статистические величины ограниченной разности, которые изменяются незначительно, когда любая выборка опускается из вычисления балльной оценки. В примере обучение на основе случайных деревьев решений становится более эффективным при одновременном ограничении точности для приложений, не ограниченных обнаружением поз человеческого тела из изображений с глубиной.

[0006] Многие сопутствующие признаки должны проще приниматься во внимание, поскольку они становятся лучше понимаемыми в отношении нижеприведенного подробного описания, рассматриваемого в связи с прилагаемыми чертежами.

Краткое описание чертежей

[0007] Настоящее описание должно лучше пониматься в результате прочтения нижеприведенного подробного описания наряду с прилагаемыми чертежами, на которых:

Фиг. 1 является принципиальной схемой модуля выбора опций, который может представлять собой компонент системы машинного обучения; а также модуля выбора моделей, модуля выбора признаков и модуля выбора функций разбиения на дерево, каждый из которых может представлять собой компонент системы машинного обучения;

Фиг. 2 является графиком увеличения объема информации в зависимости от числа обучающих примеров;

Фиг. 3 является блок-схемой последовательности операций способа в модуле выбора опций;

Фиг. 4 является более подробной блок-схемой последовательности операций способа поля 308 по фиг. 3;

Фиг. 5 иллюстрирует примерную систему машинного обучения на основе камеры для управления компьютерной игрой;

Фиг. 6 является принципиальной схемой устройства захвата изображений для использования с системой машинного обучения по фиг. 6;

Фиг. 7 является блок-схемой последовательности операций способа прогнозирования позиций сустава во входном изображении с глубиной;

Фиг. 8 является блок-схемой последовательности операций способа обучения случайного леса решений;

Фиг. 9 является принципиальной схемой случайного леса решений;

Фиг. 10 является блок-схемой последовательности операций способа прогнозирования позиций суставов во время тестирования;

Фиг. 11 иллюстрирует примерное вычислительное устройство, в котором могут реализовываться варианты осуществления системы машинного обучения с модулем выбора опций.

Аналогичные ссылки с номерами используются для того, чтобы обозначать аналогичные части на прилагаемых чертежах.

Подробное описание изобретения

[0008] Подробное описание, предоставленное ниже в связи с прилагаемыми чертежами, предназначено в качестве описания настоящих примеров и не имеет намерение представлять единственные формы, в которых может составляться и использоваться настоящий пример. Описание излагает функции примера и последовательность этапов для составления и управления примером. Тем не менее, идентичные или эквивалентные функции и последовательности могут осуществляться посредством других примеров.

[0009] Хотя настоящие примеры описываются и иллюстрируются в данном документе как реализованные в системе машинного обучения для управления игрой, описанная система предоставляется в качестве примера, а не ограничения. Специалисты в данной области техники должны принимать во внимание, что настоящие примеры являются подходящими для применения во множестве различных типов систем машинного обучения.

[0010] Фиг. 1 является принципиальной схемой модуля 102 выбора опций, который представляет собой компонент системы машинного обучения; а также модуля 112 выбора моделей, модуля 114 выбора признаков и модуля 116 выбора функций разбиения на дерево, каждый из которых может представлять собой компонент системы машинного обучения.

[0011] Модуль выбора опций выбирает одну или более опций из множества опций 100 посредством оценки балльных оценок опций с использованием логики 106 количественной оценки и выборок 110 информации относительно опций. Имеется неопределенность относительно опций, поскольку информация относительно опций доступна из выборок 110, которые становятся доступными в текущем процессе. Логика количественной оценки использует состязательную логику 108 для того, чтобы ускорять процесс выбора при поддержании указанной устойчивости к ошибкам. Как результат выбора опций, могут выделяться ресурсы 104. Например, каждая опция может представлять собой рекламное объявление, и ресурсы 104 могут представлять собой вычислительные ресурсы и экранное пространство для представления демонстрации рекламного объявления для пользователя. Каждая выборка 110 может представлять собой демонстрацию рекламного объявления и наблюдаемую пользовательскую реакцию на демонстрацию рекламного объявления (например, реакцию в виде щелчка/отсутствия щелчка). Модуль выбора опций может вычислять балльную оценку для рекламного объявления с использованием логики 106 количественной оценки и выборок. После того как наблюдаются множество тысяч или более выборок, балльные оценки для каждого рекламного объявления могут достигать устойчивого уровня, и эти уровни могут использоваться посредством модуля выбора опций для того, чтобы выделять ресурсы 104 посредством выбора того, какое рекламное объявление должно представляться. Чтобы ускорять процесс, может использоваться состязательная логика 108 для того, чтобы обеспечивать возможность оценки меньшего числа выборок до того, как осуществляется выбор, но при этом предоставляя указанную устойчивость к ошибкам результата выбора.

[0012] Каждый из модуля 102 выбора опций, логики 106 количественной оценки и состязательной логики 108 является машинореализованным с использованием программного обеспечения и/или аппаратных средств. Например, эти компоненты могут реализовываться полностью или частично с использованием аппаратных логических компонентов. Иными словами, альтернативно или помимо этого, функциональность, описанная в данном документе, может выполняться, по меньшей мере, частично, посредством одного или более аппаратных логических компонентов. Например, и без ограничения, иллюстративные типы аппаратных логических компонентов, которые могут быть использованы, включают в себя программируемые пользователем вентильные матрицы (FPGA), специализированные интегральные схемы (ASIC), специализированные микросхемы для массового производства (ASSP), внутрикристальные системы (SOC), комплексные программируемые логические устройства (CPLD), графические процессоры (GPU).

[0013] В примере модуль выбора опций представляет собой модуль 112 выбора моделей. В этом случае опции представляют собой различные семейства моделей 118, которые могут иметь различную сложность. Выборки 110 в этом случае могут представлять собой выборки из системы, которые требуется моделировать. Например, выборки могут представлять собой эмпирические измерения температуры, дождя и других факторов, если система, которая должна моделироваться, представляет собой климатическую систему. В другом примере выборки могут представлять собой помеченные элементы изображения из обучающих изображений, если система, которая должна моделироваться, представляет собой систему классификации изображений. Модуль выбора моделей формирует вывод, содержащий одно или более семейств моделей 118, которые должны использоваться для того, чтобы моделировать данные (выборки). Ресурсы 104 могут представлять собой вычислительные ресурсы, используемые посредством логики количественной оценки и состязательной логики. Ресурсы 104 могут представлять собой вычислительные ресурсы, используемые посредством нисходящих процессов вычисления, которые используют семейство моделей, выбранных посредством модуля выбора моделей. Логика количественной оценки и состязательная логика используются, аналогично вышеописанному, для того чтобы обеспечивать и ускорять процесс выбора.

[0014] В примере модуль выбора опций представляет собой модуль 120 выбора признаков. В этом случае опции представляют собой признаки 120, например, сборника документов или изображений объектов. Выборки 110 в этом случае могут быть примерами признаков наряду с наблюдениями за тем, насколько хорошо эти признаки классифицируют документы или объекты. Модуль выбора моделей формирует вывод, содержащий признаки, выбранные как хорошие при классификации документов или объектов. Ресурсы 104 могут представлять собой вычислительные ресурсы, используемые посредством логики количественной оценки и состязательной логики. Ресурсы 104 могут представлять собой вычислительные ресурсы, используемые посредством нисходящих процессов вычисления, которые используют функции, выбранные посредством модуля выбора признаков. Логика количественной оценки и состязательная логика используются, аналогично вышеописанному, для того чтобы обеспечивать и ускорять процесс выбора.

[0015] В примере модуль выбора опций представляет собой модуль 116 выбора функций разбиения на дерево, который является частью системы машинного обучения для обучения случайных деревьев решений. Случайное дерево решений представляет собой тип структуры данных, используемой для того, чтобы сохранять данные, накопленные во время фазы обучения, так что оно может использоваться для того, чтобы выполнять прогнозирование относительно примеров, ранее невидимых посредством случайного дерева решений. Случайное дерево решений обычно используется в качестве части множества случайных деревьев решений, обученных для конкретной области приложений, чтобы достигать обобщения (т.е. возможность выполнять хорошие прогнозирования относительно примеров, которые отличаются от примеров, используемых для того, чтобы обучать лес). Случайное дерево решений имеет корневой узел, множество узлов разбиения и множество концевых узлов. Во время обучения распознается структура дерева (число узлов и как они соединены), а также функции разбиения, которые должны использоваться в каждом из узлов разбиения. Помимо этого, данные накапливаются в концевых узлах во время обучения.

[0016] Функции разбиения могут быть произвольно сформированы и могут содержать опции 122 по фиг. 1. Данные (к примеру, элемент изображения для изображения) могут продвигаться через деревья случайного леса решений от корня до листа в процессе, посредством которого решение принимается в каждом узле разбиения. Решение может приниматься согласно характеристикам элемента изображения и функции разбиения, ассоциированной с узлом разбиения. Элемент изображения переходит к следующему уровню дерева вниз по ветви, выбранной согласно результатам решения.

[0017] Модуль 116 выбора функций разбиения на дерево выбирает, какие из функций разбиения следует использовать в конкретных узлах разбиения дерева решений. Чтобы выполнять выбор, используются выборки 110, которые являются примерами обучающих данных. Например, примеры обучающих данных могут представлять собой элементы изображения, которые помечаются как принадлежащие конкретному классу, либо могут представлять собой другие помеченные или непомеченные обучающие данные. Логика 106 количественной оценки вычисляет балльную оценку для различных опций 122 функции разбиения с использованием выборок 110. Состязательная логика 108 может использоваться для того, чтобы ускорять процесс выбора, как подробнее описано ниже со ссылкой на фиг. 3, 4, 7 и 8. Ресурсы 104 могут представлять собой вычислительные ресурсы, используемые посредством логики количественной оценки и состязательной логики. Ресурсы 104 могут представлять собой вычислительные ресурсы, используемые посредством нисходящих процессов вычисления, которые используют функцию разбиения на дерево, выбранную посредством модуля выбора моделей.

[0018] В примерах, описанных со ссылкой на фиг. 1, логика 106 количественной оценки используется для того, чтобы оценивать балльную оценку для каждой из опций 100. Например, балльная оценка может быть основана на статистической величине, описывающей поведение опции, такой как среднее, медиана, мода или другая статистическая величина. В различных примерах балльная оценка основана на статистической величине, которая является статистической величиной ограниченной разности. Статистическая величина ограниченной разности является числовым значением, которое описывает поведение объекта (к примеру, опции в примерах по фиг. 1) из множества наблюдений (выборок) поведения; и которое изменяет свое числовое значение только незначительно, если только одно из множества наблюдений изменяется. В некоторых примерах изменение наблюдения может достигаться посредством опускания наблюдения. Неполный список примеров статистических величин ограниченной разности: дисперсия, энтропия, увеличение объема информации, индекс Джини (Gini index).

[0019] Фиг. 2 является графиком увеличения объема информации в зависимости от числа обучающих примеров. Увеличение объема информации является примером статистической величины ограниченной разности, которая может измеряться посредством логики количественной оценки по мере того, как принимаются обучающие примеры. В примере по фиг. 2 имеется две опции, которые представляют собой признак A и признак B. Хотя на практике могут присутствовать гораздо больше опций (две показаны для ясности). Балльные оценки увеличения объема информации для признака A проиллюстрированы в качестве сплошной линии, а балльные оценки увеличения объема информации для признака B проиллюстрированы в качестве пунктирной линии. Предположим, что модуль выбора опций представляет собой модуль 114 выбора признаков по фиг. 1 и должен находить признак с наибольшим увеличением объема информации. Когда выборки первоначально принимаются, балльная оценка увеличения объема информации является зашумленной, поскольку доступно только небольшое число выборок. Когда более 500 выборок приняты, балльные оценки увеличения объема информации стабилизируются и четко разделяются для признаков A и B, при этом признак B имеет более высокую балльную оценку увеличения объема информации. Модуль 114 выбора признаков спроектирован с возможностью принимать решение в отношении того, признак A, или признак B имеет наибольшую балльную оценку увеличения объема информации в оптимальной точке. Иными словами, после того как достаточно обучающих примеров принято для того, чтобы предоставлять ответ, который является точным в пределах указанной устойчивости к ошибкам. Это предоставляет возможность выделения вычислительных ресурсов надлежащим образом как для самого процесса выбора признаков, так и для нисходящих процессов, которые используют результаты выбора признаков.

[0020] Модуль 114 выбора признаков может иметь состязательную логику 108, которая вычисляет строки погрешности, также известные как доверительные интервалы для балльных оценок увеличения объема информации (или балльных оценок другой статистической величины ограниченной разности). Доверительный интервал является диапазоном числовых значений, представляющих возможные значения балльной оценки с указанной точностью. На фиг. 2 доверительный интервал 200 показан для балльной оценки увеличения объема информации признака A, когда число обучающих примеров менее 500. Когда число обучающих примеров более 500, доверительный интервал 206 для балльной оценки признака A имеет меньший диапазон, поскольку имеется большая достоверность в отношении увеличения объема информации. Аналогичным образом доверительный интервал 202 для балльной оценки признака B является большим, когда число обучающих примеров составляет приблизительно 500, и является меньшим доверительным интервалом 204, когда число обучающих примеров увеличивается. Состязательная логика может использовать доверительные интервалы для того, чтобы определять, принято или нет достаточно обучающих примеров, чтобы обеспечивать выбор опций, который является точным в пределах указанной устойчивости к ошибкам. Например, могут отбрасываться опции, в которых доверительный интервал не перекрывается с доверительным интервалом для опции наивысшей количественной оценки. Постепенно число вариантов уменьшается, поскольку все большее число опций отбрасывается из состязания по мере того, как возрастает число выборок. Это поясняется далее со ссылкой на фиг. 3, который является блок-схемой последовательности операций способа в модуле выбора опций, который может представлять собой любое из модуля 102 выбора опций, модуля 112 выбора моделей, модуля 114 выбора признаков или модуля 116 выбора функций разбиения на дерево по фиг. 1.

[0021] Модуль выбора опций задает 300 устойчивость к ошибкам, которая должна использоваться посредством состязательной логики, когда она определяет, принято или нет достаточно обучающих примеров, чтобы обеспечивать выбор опций, который является точным в пределах устойчивости к ошибкам набора. Устойчивость к ошибкам может задаваться согласно пользовательскому вводу, может предварительно конфигурироваться или может быть автоматически выбрана согласно области приложений, доступным вычислительным ресурсам и другим факторам.

[0022] Модуль выбора опций осуществляет доступ 302 к списку или другой информации, идентифицирующей потенциальные опции, и принимает 304 один или более обучающих примеров для каждой из опций. Например, опции могут представлять собой произвольно сформированные функции разбиения дерева решений из процесса обучения дерева решений. К обучающим примерам может осуществляться доступ из хранилища данных, потока данных или другого источника. Модуль выбора опций использует логику 106 количественной оценки, чтобы вычислять 306 балльную оценку для каждой из опций с использованием принимаемых обучающих примеров. Например, балльная оценка является статистической величиной ограниченной разности, как описано выше. Состязательная логика 108 используется для того, чтобы вычислять 308 доверительный интервал для балльной оценки для каждой опции. Состязательная логика 108 идентифицирует те опции, которые удовлетворяют условиям доверительных интервалов. Например, идентифицируются опции, доверительные интервалы которых не перекрываются с доверительным интервалом опции наивысшей количественной оценки. Идентифицированные опции удаляются 314 из списка потенциальных опций на этапе 302, и процесс может повторяться до тех пор, пока только одна опция не останется 312, или только указанное число опций не останется.

[0023] Фиг. 4 является более подробной блок-схемой последовательности операций способа для части способа по фиг. 3. Состязательная логика осуществляет способ по фиг. 4 в ходе процесса вычисления доверительных интервалов балльных оценок для каждой опции (поле 308 по фиг. 3). Состязательная логика оценивает 400 дисперсию балльных оценок для каждой опции, которая вычислена к настоящему времени. Дисперсия является числовым значением, описывающим, насколько варьируется величина. Может использоваться любой подходящий способ оценки дисперсии. В некоторых примерах используется оценка дисперсии по методу складного ножа, как подробнее описано ниже. Оценка дисперсии по методу складного ножа выполняется посредством повторного вычисления балльной оценки многократно посредством поочередного удаления различных выборок. Повторно вычисленные балльные оценки затем используются для того, чтобы оценивать дисперсию посредством оценки того, насколько они варьируются относительно друг друга.

[0024] Состязательная логика может вычислять 402 доверительный интервал для одной из опций в качестве балльной оценки для этой опции, плюс или минус константа, умножить на квадратный корень оцененной дисперсии, умножить на логарифм двух, делить на устойчивость к ошибкам. Константа может принимать значение 5/2 или аналогичное значение.

[0025] Оцененная дисперсия может быть оценкой дисперсии по методу складного ножа, как описано выше, и может вычисляться любым подходящим способом. В примерах, в которых опции представляют собой возможные варианты функции разбиения в случайном дереве решений, выполняющем классификацию, а балльная оценка представляет собой увеличение объема информации или прирост Джини (Gini gain), оценку дисперсии по методу складного ножа может вычисляться так, как подробнее описано ниже в этом документе, чтобы сокращать времени вычисления при поддержании точности.

[0026] В некоторых примерах состязательная логика может регулировать вычисленный доверительный интервал для смещения, если известно, что логика количественной оценки вычисляет балльную оценку с использованием модуля оценки расширений, которая вводит смещение. Тем не менее, регулирование для смещения является необязательным этапом. Хорошие рабочие результаты могут достигаться, когда этап регулирования смещения опускается.

[0027] Более формально, состязательная логика может вычислять 402 доверительный интервал для одной из опций следующим образом:

[0028]

[0029]

[0030] Это может выражаться на словах как: диапазон от балльной оценки Z опции минус 5/2, умножить на квадратный корень оценки дисперсии по методу складного ножа дисперсии числа n выборок плюс коррекция , умножить на логарифм 2, делить на устойчивость σ к ошибкам, до балльной оценки Z опции плюс 5/2, умножить на квадратный корень оценки дисперсии по методу складного ножа дисперсии числа n выборок плюс коррекция , умножить на логарифм 2, делить на устойчивость σ к ошибкам плюс член смещения.

[0031] На практике обнаружено, что сходимость оценки дисперсии по методу складного ножа является чрезвычайно быстрой, и члены коррекции могут опускаться посредством состязательной логики.

[0032] Состязательная логика может использоваться для того, чтобы вычислять доверительные интервалы этой формы для балльных оценок, которые основаны на статистических величинах ограниченной разности, к примеру, когда балльные оценки вычисляются с использованием гистограммы значений счетчика элементов выборки. Это обеспечивает возможность состязательной логике предоставлять рабочие результаты для многих форм балльных оценок и обеспечивает возможность намного более широкому диапазону приложений машинного обучения использовать состязательную логику, чем ранее возможно. Посредством увеличения или уменьшения размера устойчивости к ошибкам можно балансировать гарантированный уровень точности результата для времени вычисления.

[0033] Состязательная логика может быть выполнена с возможностью применять коррекцию смещения к доверительному интервалу, как описано выше, например, если балльная оценка вычисляется посредством логики количественной оценки с использованием модуля оценки расширений, такого как модуль оценки энтропии, модуль оценки увеличения объема информации, модуль оценки индексов Джини.

[0034] В случае если балльная оценка связана с увеличением объема информации, обнаружено, что смещение может задаваться следующим образом:

[0035]

[0036] Это может выражаться на словах как отношение: два умножить на число элементов выборки гистограммы, используемой для того, чтобы вычислять увеличение объема информации минус 1, к числу выборок.

[0037] В случае если балльная оценка связана с индексом Джини, обнаружено, что смещение может задаваться посредством следующим образом:

[0038]

[0039] Это может выражаться на словах как отношение: два умножить на число элементов выборки гистограммы, используемой для того, чтобы вычислять индекс Джини, минус 1, к числу выборок умножить на число элементов выборки гистограммы.

[0040] В случае если балльная оценка представляет собой усиление дисперсии, обнаружено, что член смещения не требуется.

[0041] Как упомянуто выше, оценка дисперсии по методу складного ножа выполняется посредством повторного вычисления балльной оценки многократно посредством поочередного удаления различных выборок (называется "оценкой с опусканием"). Повторно вычисленные балльные оценки затем используются для того, чтобы оценивать дисперсию посредством оценки того, насколько они варьируются относительно друг друга.

[0042] В случае если балльная оценка представляет собой увеличение объема информации, оценка дисперсии по методу складного ножа балльной оценки может вычисляться посредством состязательной логики следующим образом:

[0043],

[0044] при этом суммирование выполняется по членам с . Дисперсия может вычисляться с использованием взвешенных онлайновых обновлений. является значением счетчика на гистограмме в ветви b и элементе j выборки. Это представляет собой число, которое является целым числом и больше или равно нулю и меньше или равно n, общему числу выборок.

[0045] Вышеуказанное равенство может выражаться на словах как: оценка дисперсии по методу складного ножа оценки расширения увеличения объема информации для n обучающих выборок, которые достигают узла разбиения, равна числу обучающих выборок минус одна, делить на число обучающих выборок, умножить на сумму по левому и правому дочерним узлам узла разбиения, суммы по всем элементам выборки гистограммы значения счетчика на гистограмме в элементе j выборки и ветви b, умножить на квадрат разности между оценкой расширения увеличения объема информации, когда одна выборка удаляется из ветви b, и элементом j выборки минус эмпирическое среднее увеличения объема информации. В таком случае эмпирическое среднее увеличения объема информации представлено посредством символа и задается следующим образом:

[0046]

[0047] Это может выражаться на словах как: эмпирическое среднее увеличения объема информации равно единица делить на два, умножить на число элементов выборки гистограммы, умножить на сумму по левому и правому дочерним узлам суммы по всем элементам выборки гистограммы оценки расширения увеличения объема информации с удалением одной выборки в ветви b и элементе j выборки.

[0048] В случае если балльная оценка представляет собой прирост Джини, оценка дисперсии по методу складного ножа балльной оценки может вычисляться посредством состязательной логики посредством вычисления сначала эмпирического среднего прироста Джини следующим образом:

[0049]

[0050] Это может выражаться на словах как: эмпирическое среднее прироста Джини равно единица делить на два, умножить на число элементов выборки гистограммы, умножить на сумму по левому и правому дочерним узлам суммы по всем элементам выборки гистограммы оценки расширения прироста Джини.

[0051] Когда эмпирическое среднее вычисляется, состязательная логика имеет возможность вычислять:

[0052],

[0053] при этом суммирование выполняется по членам с .

[0054] Вышеуказанное равенство может выражаться на словах как: оценка дисперсии по методу складного ножа оценки расширения прироста Джини для n обучающих выборок, которые достигают узла разбиения, равна числу обучающих выборок минус одна, делить на число обучающих выборок, умножить на сумму по левому и правому дочерним узлам узла разбиения, суммы по всем элементам выборки гистограммы значения счетчика на гистограмме в ветви b и элементе j выборки, умножить на квадрат разности между оценкой расширения прироста Джини при удалении одной выборки в ветви b и элементе j выборки минус эмпирическое среднее приростов Джини, полученных посредством удаления отдельных выборок.

[0055] Далее описывается пример, в котором модуль выбора опций используется в качестве модуля выбора функций разбиения на дерево решений для обучения дерева решений в системе машинного обучения для управления игрой. Дерево решений может быть обучено с использованием модуля выбора опций или для задачи регрессии или классификации в зависимости от задачи машинного обучения.

[0056] Фиг. 5 показывает примерную систему 500 управления на основе камеры для управления компьютерной игрой. Фиг. 5 показывает пользователя 502, проводящего в этом иллюстративном примере боксерский поединок. В некоторых примерах система 500 управления на основе камеры может использоваться, в числе прочего, для того, чтобы определять позу тела, привязывать, распознавать, анализировать, отслеживать, ассоциироваться с человеческой целью, предоставлять обратную связь, интерпретировать жесты и/или адаптироваться к аспектам человеческой цели, к примеру пользователя 502.

[0057] Система 500 управления на основе камеры содержит вычислительное устройство 504. Вычислительное устройство 504 может представлять собой компьютер общего назначения, игровую приставку или устройство либо выделенное устройство обработки изображений. Вычислительное устройство 504 может включать в себя аппаратные компоненты и/или программные компоненты, так что вычислительное устройство 504 может использоваться для того, чтобы выполнять приложения, к примеру игровые приложения и/или неигровые приложения. Далее поясняется структура вычислительного устройства 504 со ссылкой на фиг. 11.

[0058] Система 100 управления на основе камеры дополнительно содержит устройство 506 захвата. Устройство 506 захвата может представлять собой, например, датчик или детектор изображений, который может использоваться для того, чтобы визуально отслеживать одного или более пользователей (к примеру, пользователя 502) таким образом, что жесты, выполняемые одним или более пользователей, могут захватываться, анализироваться, обрабатываться и отслеживаться, чтобы выполнять один или более элементов управления или действий в игре или приложении, как подробнее описано ниже.

[0059] Система 500 управления на основе камеры дополнительно может содержать устройство 508 отображения, соединенное с вычислительным устройством 504. Вычислительное устройство может представлять собой телевизионный приемник, монитор, телевизионный приемник высокой четкости (HDTV) и т.п., который может предоставлять видеоэлементы игры или приложения (и необязательно аудио) пользователю 502.

[0060] При работе пользователь 502 может отслеживаться с использованием устройства 506 захвата таким образом, что позиции сустава, перемещения и размер пользователя 502 могут интерпретироваться посредством вычислительного устройства 504 (и/или устройства 506 захвата) в качестве элементов управления, которые могут использоваться для того, чтобы влиять на приложение, выполняемое посредством вычислительного устройства 504. Как результат, пользователь 502 может перемещать свое тело для того, чтобы управлять выполняемой игрой или приложением.

[0061] В иллюстративном примере по фиг. 5 приложение, выполняющееся на вычислительном устройстве 504, является боксерским поединком, в который играет пользователь 502. В этом примере вычислительное устройство 504 управляет устройством 508 отображения, чтобы предоставлять визуальное представление оппонента по боксерскому поединку пользователю 502. Вычислительное устройство 504 также управляет устройством 508 отображения, чтобы предоставлять визуальное представление аватара пользователя, которым пользователь 502 может управлять с помощью своих перемещений. Например, пользователь 502 может нанести удар в физическом пространстве, чтобы заставлять аватар пользователя наносить удар в игровом пространстве. Таким образом, согласно этому примеру вычислительное устройство 504 и устройство 506 захвата системы 500 управления на основе камеры могут использоваться для того, чтобы распознавать и анализировать удар пользователя 502 в физическом пространстве таким образом, что удар может быть интерпретирован в качестве элемента управления игрой аватара пользователя в игровом пространстве.

[0062] Кроме того, некоторые перемещения могут быть интерпретированы в качестве элементов управления, которые соответствуют действиям, отличным от управления аватаром. Например, пользователь может использовать перемещения, чтобы входить, выходить, включать или выключать систему, приостанавливать, сохранять игру, выбирать уровень, профиль или меню, просматривать рекорды по очкам, обмениваться данными с другом и т.д. Кроме того, перемещение пользователя 502 может использоваться и анализироваться любым подходящим способом, чтобы взаимодействовать с приложениями, отличным от игр, например, вводить текст, выбирать значки или пункты меню, управлять воспроизведением мультимедиа, просматривать веб-узлы или управлять любым другим управляемым аспектом операционной системы или приложения.

[0063] Теперь следует обратиться к фиг. 6, которая иллюстрирует принципиальную схему устройства 506 захвата, которое может использоваться в системе 500 управления на основе камеры по фиг. 5. В примере по фиг. 6 устройство 506 захвата выполнено с возможностью захватывать видеоизображения с информацией глубины. Такое устройство захвата может упоминаться в качестве камеры с эффектом глубины. Информация глубины может иметь форму изображения с глубиной, которое включает в себя значения гл

Выделение ресурсов для машинного обучения

Патент 2648573