Q-обучения

Автор: Roger Morrison
Дата создания: 24 Сентябрь 2021
Дата обновления: 11 Май 2024
Anonim
Q-learning
Видео: Q-learning

Содержание

Определение - Что означает Q-learning?

Q-learning - это термин для структуры алгоритма, представляющей обучение без подкрепления модели. Оценивая политику и используя стохастическое моделирование, Q-learning находит лучший путь вперед в процессе принятия решений Маркова.


Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.

Техопедия объясняет Q-Learning

Техническая структура алгоритма Q-обучения включает в себя агента, набор состояний и набор действий для каждого состояния.

Функция Q использует весовые коэффициенты для различных шагов в сочетании с коэффициентом дисконтирования для оценки вознаграждений.

Хотя это может показаться простой идеей, Q-обучение имеет первостепенное значение во многих типах моделей обучения с подкреплением и глубокого обучения. Одним из лучших примеров является то, где глубокое Q-обучение используется, чтобы помочь программам машинного обучения выучить игровые стратегии в различных типах видеоигр, например, в играх Atari 1980-х годов. Здесь сверточная нейронная сеть берет образцы игрового процесса, чтобы разработать стохастическую модель, которая поможет компьютеру узнать, как лучше играть в игру с течением времени.


Q-обучение имеет огромный потенциал для развития искусственного интеллекта и машинного обучения.