Локация

LLM Platform Engineer (ASC AI Fabrique)

СБЕР
Самара Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

ASC AI Fabrique это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding . Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию.

Обязанности

  • развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
  • организация MLOps-процессов и системная оценка качества моделей
  • обеспечение production latency <2s и uptime >95% для инфраструктуры inference
  • профилирование и оптимизация использования VRAM (CUDA OOM prevention)
  • мониторинг GPU-производительности.

Требования

  • Python (asyncio, multiprocessing, typing) Advanced уровня
  • Bash/Shell scripting Advanced уровня для автоматизации развертывания
  • практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
  • опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
  • знание оптимизаций Flash Attention и Paged Attention
  • навыки работы с PyTorch, JAX, ONNX для универсального развертывания
  • опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA)

Будет плюсом:

  • опыт развертывания моделей на multi-GPU
  • практика профилирования VRAM usage в production-средах
  • опыт работы с моделями 480B+ параметров на кластерах GPU
  • знание специфических GPU scheduling инструментов (Volcano, Kueue).

Условия

  • комфортный офис, формат работы - гибрид
  • уникальная система обучения Сбера для профессионального и карьерного развития, семинары, тренинги, конференции
  • программа адаптации и помощь руководителя на старте
  • ДМС, страхование от несчастных случаев, социальные гарантии
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративная пенсионная программа
  • корпоративные мероприятия.
12 часов назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

LLM Platform Engineer (ML Engineer)

  • Magenta Technology
  • Самара
Описание Открыта вакансия LLM Platform Engineer (ML Engineer) на проект финтех. Задачи: Развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism Организация ...
23.12.2025

Firmware Engineer (Android)

  • Mercury Development
  • Самара
Описание We are currently looking for an experienced Staff Firmware Engineer (Android) Mercury Development specializes in developing custom software for various US companies: from large enterprises ...
26.12.2025

AI Code Generation Engineer (Senior ML Engineer)

  • Magenta Technology
  • Самара
Описание Открыта вакансия AI Code Generation Engineer (Senior ML Engineer) на проект финтех Задачи: Разработка систем генерации и безопасной модификации кода через AST Создание метакомпиляторов для ...
23.12.2025