Усиление обучения

Автор: Lewis Jackson
Дата создания: 11 Май 2021
Дата обновления: 15 Май 2024
Anonim
Эффективные методы обучения | Понимание информации
Видео: Эффективные методы обучения | Понимание информации

Содержание

Определение - Что означает обучение подкреплению?

Укрепление обучения, в контексте искусственного интеллекта, является типом динамического программирования, который обучает алгоритмы с использованием системы вознаграждения и наказания.


Алгоритм обучения подкрепления, или агент, учится, взаимодействуя с окружающей средой. Агент получает вознаграждение за правильное выполнение и штрафы за неправильное выполнение. Агент учится без вмешательства человека, максимизируя его вознаграждение и минимизируя его штраф.

Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.

Techopedia объясняет обучение усилению

Обучающее обучение - это подход к машинному обучению, основанный на поведенческой психологии. Это похоже на то, как ребенок учится выполнять новое задание. Усиленное обучение контрастирует с другими подходами машинного обучения тем, что в алгоритме не указано явно, как выполнить задачу, но она решает проблему самостоятельно.

Поскольку агент, которым может быть автомобиль с автоматическим управлением или программа, играющая в шахматы, взаимодействует со своей средой, получает состояние вознаграждения в зависимости от того, как он выполняет, например, безопасное вождение до места назначения или выигрыш в игре. И наоборот, агент получает штраф за неправильную работу, например, с дороги или мат.


Агент с течением времени принимает решения, чтобы максимизировать свое вознаграждение и минимизировать его штраф, используя динамическое программирование. Преимущество этого подхода к искусственному интеллекту состоит в том, что он позволяет программе ИИ учиться без того, чтобы программист не объяснил, как агент должен выполнить задачу.