Курсы
Спецкурс: Обучение с подкреплением (RL)
12 лекций: от бандитов UCB до RLHF для LLM на Python.
Аннотация
Интенсивный курс для студентов и инженеров: полный путь от классических алгоритмов RL до практики RLHF в LLM. Формат: лекции + разборы реальных задач.
Расписание
Преподаватель: Лектор: Алексей Ханин
Когда: Понедельник 19:00 МСК, с февраля по май
| № | Дата | Тема | Ссылки | Файлы |
|---|---|---|---|---|
| 1 | 2026-02-10 | Введение в RL и постановка задач | — | |
| 2 | 2026-02-17 | MDP и динамическое программирование | — | — |