Senior Research Engineer (Kandinsky)
СБЕРОписание
Мы команда исследователей и инженеров, разрабатывающих технологии post-training (SFT, RL) и контролируемой генерации для моделей генерации изображений, видео и омни-модальных. Мы сфокусированы на повышение качества, управляемости и устойчивости генеративных моделей с помощью методов RLHF / RLAIF и инструктивного редактирования. Помимо фундаментальных исследований, мы создаём прикладные решения для B2B-партнёров от системы генерации интерьера до системы генерации персонализированных аватаров.
Обязанности
- проектирование и обучение высокопроизводительных диффузионных моделей (R2V, R2I, R2V+A) для редактирования и генерации видео / изображений
- разработка новых подходов и архитектурных решений для post-training фазы диффузионных моделей: RLHF (PPO, DPO и др.), RLAIF, SFT
- разработка, масштабирование и поддержание RL пайплайнов
- руководство экспериментами: постановка гипотез, разработка протоколов, анализ результатов
- проведение code review, менторинг младших исследователей и инженеров, участие в планировании исследовательской дорожной карты
- взаимодействие с командами Pretraining, Data, Infrastructure, Production для масштаб пайплайнов и повышения стабильности моделей в продакшене
- поддержание и внедрение SOTA-подходов: мониторинг литературы (arxiv, NeurIPS, ICML, CVPR, ICLR), инициирование внутренних исследований.
Требования
- бакалавриат/магистратура по направлению компьютерных наук/прикладной математике/ машинному обучению или близких к ним
- 3+ лет релевантного опыта исследований и разработки в области глубокого обучения/компьютерного зрения/генеративного ИИ
- глубокие знания в Computer Vision и Generative Modeling: Diffusion Models, GANs, VAEs, Flow/Rectified Flow Matching
- опыт работы с современными диффузионными фреймворками (Diffusers) и моделями FLUX, Wan 2.X и др.)
- уверенное владение PyTorch и навыки распределённого обучения (DDP/FSDP)
- понимание и практическое применение RL и RLHF ( PPO/DPO и др.)
- умение проектировать архитектуры, планировать эксперименты и интерпретировать результаты.
Будет плюсом:
- наличие PhD
- опыт публикаций или активное участие в исследованиях уровня NeurIPS / ICLR/ CVPR.
Условия
- конкурентный уровень заработной платы, годовые премии по результатам работы
- участие в развитии и создании OpenSource продуктов
- корпоративная пенсионная программа, страхование от несчастных случаев, социальные гарантии, ДМС
- комфортный офис Sbergile Home (метро Кутузовская).
7 часов назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
Senior Deep Learning Research Engineer (Kandinsky)
Описание Разрабатываем и внедряем передовые методы оптимизации обучения и инференса сверхкрупных нейронных сетей (десятки миллиардов параметров) для мультимодальных генеративных моделей. Фокус ...
19.12.2025
Senior Software Engineer (Full-Stack / Platform)
Описание О роли Мы создаём B2B SaaS-платформу с несколькими продуктовыми направлениями, включая AI-ассистированную функцию для работы со знаниями и внутренний/административный портал, который клиенты ...
13.01.2026
Senior Devops Engineer
Описание Рексофт ( Reksoft ) российская многопрофильная технологическая группа, оказывающая полный спектр услуг в области цифровой трансформации предприятий: от формирования бизнес-стратегии и ...
12.01.2026