LLM Platform Engineer (ASC AI Fabrique)
СБЕРОписание
ASC AI Fabrique это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding . Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию.
Обязанности
- развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
- организация MLOps-процессов и системная оценка качества моделей
- обеспечение production latency <2s и uptime >95% для инфраструктуры inference
- профилирование и оптимизация использования VRAM (CUDA OOM prevention)
- мониторинг GPU-производительности.
Требования
- Python (asyncio, multiprocessing, typing) Advanced уровня
- Bash/Shell scripting Advanced уровня для автоматизации развертывания
- практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
- опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
- знание оптимизаций Flash Attention и Paged Attention
- навыки работы с PyTorch, JAX, ONNX для универсального развертывания
- опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA)
Будет плюсом:
- опыт развертывания моделей на multi-GPU
- практика профилирования VRAM usage в production-средах
- опыт работы с моделями 480B+ параметров на кластерах GPU
- знание специфических GPU scheduling инструментов (Volcano, Kueue).
Условия
- комфортный офис, формат работы - гибрид
- уникальная система обучения Сбера для профессионального и карьерного развития, семинары, тренинги, конференции
- программа адаптации и помощь руководителя на старте
- ДМС, страхование от несчастных случаев, социальные гарантии
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа
- корпоративные мероприятия.
12 часов назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
LLM Platform Engineer (ML Engineer)
Описание Открыта вакансия LLM Platform Engineer (ML Engineer) на проект финтех. Задачи: Развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism Организация ...
23.12.2025
Firmware Engineer (Android)
Описание We are currently looking for an experienced Staff Firmware Engineer (Android) Mercury Development specializes in developing custom software for various US companies: from large enterprises ...
26.12.2025
AI Code Generation Engineer (Senior ML Engineer)
Описание Открыта вакансия AI Code Generation Engineer (Senior ML Engineer) на проект финтех Задачи: Разработка систем генерации и безопасной модификации кода через AST Создание метакомпиляторов для ...
23.12.2025