Главная
Работа в Москве
Автор на курс Обучение с подкреплением Reinforcement Learning в Практикум

Автор на курс Обучение с подкреплением Reinforcement Learning в Практикум

Яндекс

Москва Опыт работы от 3 лет Частичная занятость Гибкий график

Поделиться Сохранить

Описание

Можно совмещать с основной работой (от 10 часов в неделю)

Яндекс Практикум сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу. А технологии и команда экспертов помогают довести дело до конца.

Мы расширяем линейку курсов по ML&AI уровня и ищем авторов, которые совместно с методистами, редакторами, иллюстраторами создадут контент для нового продукта.

Что делает автор?

Создаёт материалы для новых курсов в команде с другими авторами, методистами, редакторами, иллюстраторами и продакт менеджерами программы.

Пишет тексты уроков, в которых поддерживает интерес студентов к обучению.

Улучшает существующий контент на основе обратной связи от студентов, экспертов сопровождения и редакторов.

Разрабатывает дополнительные материалы (тренажёр, чек-листы, тесты, памятки, квизы) и тестовые задания для проверки знаний.

Предлагает идеи, как улучшить усвоение материала.

Участвует в проектировании программы.

Что мы ожидаем от вас?

Техническая и доменная экспертиза

Знания классических методов RL: MDP, POMDP, value-based и policy-based подходы, уравнения Беллмана, стратегии исследования.
Опыт работы с Deep Reinforcement Learning: DQN, Policy Gradient, Actor-Critic, PPO и смежные алгоритмы.
Опыт реализации RL-систем: построение агента, буфера опыта, TD-обновлений, сетевых архитектур и обучающего контура.
Понимание продвинутых методов поведения: curiosity-driven подходы, RND/ICM, model-based RL, планирование, многоагентные системы.
Опыт работы с PyTorch: построение и обучение нейросетевых моделей, реализация policy/value-сетей, оптимизация.
Практический опыт работы с RL-средами: OpenAI Gym/Gymnasium, PettingZoo, custom environments.
Понимание продакшен-сервисов: API, Docker, логирование, мониторинг.
Боевой опыт ведения типового ML проекта: проектирование пайплайнов, версионирование, работа с экспериментами, дебагинг.

Будет преимуществом

Опыт применения RL в более, чем одной сфере: робототехнике, симуляторах, играх, рекомендательных системах или других.
Опыт менторства, написания статей или образовательного контента на темы RL.

Что мы предлагаем?

Мы предлагаем удаленное сотрудничество, нужно только быть на связи в мессенджерах и иногда в Zoom.
Возможность экспериментировать и реализовать свой потенциал: мы доверяем вашему опыту и не тратим время и силы друг друга на микроменеджмент.
Плавное погружение в сотрудничество: познакомим вас с инструментами разработки курсов и с командой, которая поможет преобразовать ваши знания в целый курс.
Пополнение портфолио: мы выдаем нашим экспертам сертификаты о социально-полезной деятельности.
Нетворкинг, поддержка и вдохновение от комьюнити экспертов из разных сфер.
Возможность писать статьи и участвовать в конференциях, мероприятиях и подкастах Яндекс Практикума.

Откликнуться

11 часов назад Источник: hh.ru

Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.

Рекомендуемые вакансии

Автор на курс Аудиоанализ, распознавание и генерация речи в Практикум

Яндекс
Москва

Описание Можно совмещать с основной работой (от 10 часов в неделю) Яндекс Практикум сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу. А ...

25.12.2025

Автор онлайн-магистратуры по направлению С++ в Практикум

Яндекс
Москва

23.12.2025

Преподаватель английского языка для детей в Практикум

Яндекс
Москва

Описание Быть преподавателем в Яндекс Практикуме это учить английскому и работать в удобное время. Мы взяли на себя самое скучное: поиск студентов, бюрократию и подготовку учебных материалов. Мы учим ...

03.12.2025

Посмотреть все похожие вакансии