Спецкурс: Обучение с подкреплением (RL) | MountainAI
← Все курсы

Курсы

Спецкурс: Обучение с подкреплением (RL)

12 лекций: от бандитов UCB до RLHF для LLM на Python.

Аннотация

Интенсивный курс для студентов и инженеров: полный путь от классических алгоритмов RL до практики RLHF в LLM. Формат: лекции + разборы реальных задач.

Расписание

Преподаватель: Лектор: Алексей Ханин

Когда: Понедельник 19:00 МСК, с февраля по май

ДатаТемаСсылкиФайлы
12026-02-10Введение в RL и постановка задач
1
22026-02-17MDP и динамическое программирование

© 2026 Konstantin Pchelin | mountainai.tech

Moscow, Russia