Локация

LLM Platform/ML Ops Engineer (ASC AI Fabrique)

СБЕР
Ростов-на-Дону Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

ASC AI Fabrique это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding . Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию.

Обязанности

  • развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
  • организация MLOps-процессов и системная оценка качества моделей
  • обеспечение production latency <2s и uptime >95% для инфраструктуры inference
  • профилирование и оптимизация использования VRAM (CUDA OOM prevention)
  • мониторинг GPU-производительности.

Требования

  • Python (asyncio, multiprocessing, typing) Advanced уровня
  • Bash/Shell scripting Advanced уровня для автоматизации развертывания
  • практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
  • опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
  • знание оптимизаций Flash Attention и Paged Attention
  • навыки работы с PyTorch, JAX, ONNX для универсального развертывания
  • опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA).

Будет плюсом:

  • опыт развертывания моделей на multi-GPU
  • практика профилирования VRAM usage в production-средах
  • опыт работы с моделями 480B+ параметров на кластерах GPU
  • знание специфических GPU scheduling инструментов (Volcano, Kueue).

Условия

  • стабильный оклад и социальная поддержка сотрудников
  • расширенный ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • корпоративная пенсионная программа
  • корпоративное обучение за счет компании
  • реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 40 тыс. рублей
  • официальное оформление с первого дня
  • мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы
  • работу по Agile с лучшими из IT индустрии: 2000 продуктовых команд и возможность внутреннего перемещения.
19 дней назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Senior ML/AI Code Generation Engineer (ASC AI Fabrique)

  • СБЕР
  • Ростов-на-Дону
Описание Мы в поиске AI Code Generation Engineer (Senior ML Engineer) на проект ASC AI Fabrique это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swar...
11.01.2026

Разработчик Python в LLM Platform

  • Т-Банк
  • Ростов-на-Дону

Описание

LLM Platform - это набор инструментов для внедрения языковых моделей в продукты экосистемы Т-Банка. Мы предоставляем конструктор для создания AI-ассистентов, не требующий ...

25.12.2025

ML-инженер

  • Нетология
  • Ростов-на-Дону

Описание

Привет! Мы команда образовательной платформы Нетология. Обучаем современным востребованным профессиям по 12 направлениям. За 14 лет работы мы выпустили 130+ тыс. ...

08.01.2026