[OTUS] Игорь Стурейко, Андрей Канашов - Reinforcement Learning (2023)

89 

Описание

[Otus] Reinforcement Learning. Обучение с подкреплением
Что даст вам этот курс?

Курс предназначен для DS/DL/ML специалистов, которые хотят погрузиться в алгоритмы обучения с подкреплением. После прохождения курса студенты научатся применять алгоритмы RL для решения разнообразных задач в реальном мире, включая игровую индустрию, робототехнику, управление энергетическими системами и управление финансовым портфелем.
Для кого этот курс?
- DS/ML/DL специалисты, которые хотят углубить знания в области обучения с подкреплением и получить практический опыт;
- Разработчики с базовыми навыками Python и ML, которые хотят получить опыт работы с рекомендательными системами;
- Выпускники курсов по машинному обучению
После обучения вы:
- Овладеете основными алгоритмами RL, такими как Q-learning, SARSA, Monte Carlo
- Научитесь строить модель среды и агента, а также проводить обучение на простых игровых сценариях
- Изучите такие алгоритмы, как Deep Q-Network (DQN), Policy Gradient (PG), Actor-Critic, и сможете реализовать их в своих проектах
- Познакомитесь с продвинутыми темами в Reinforcement

Learning, такими как оптимальное управление, методы обучения со скользящим горизонтом, Model-based RL
- Научитесь применять RL для решения конкретных задач и понимать, как это применение работает на практике.
Особенности курса
Особенностью курса является его фокус на практических примерах и проектной работе. Студенты получат необходимые знания для реализации RL алгоритмов в своих собственных проектах и приложениях.
Необходимые знания:
- базовое знакомство с Python;
- базовые знания линейной алгебры (матрицы, векторы, градиентный спуск);
- базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия).