Локация

LLM Platform Engineer (ML Engineer)

Magenta Technology
Самара Опыт работы от 3 лет Временная работа Полный день
Поделиться

Описание

Открыта вакансия LLM Platform Engineer (ML Engineer) на проект финтех.

Задачи:

  • Развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
  • Организация MLOps-процессов и системная оценка качества моделей
  • Обеспечение production latency <2s и uptime >95% для инфраструктуры inference
  • Профилирование и оптимизация использования VRAM (CUDA OOM prevention)
  • Мониторинг GPU-производительности

Мы ожидаем от тебя:

  • Python (asyncio, multiprocessing, typing) Advanced уровня
  • Bash/Shell scripting Advanced уровня для автоматизации развертывания
  • Практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
  • Опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
  • Знание оптимизаций Flash Attention и Paged Attention
  • Навыки работы с PyTorch, JAX, ONNX для универсального развертывания
  • Опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA)

Будет плюсом:

  • Опыт развертывания моделей на multi-GPU
  • Практика профилирования VRAM usage в production-средах
  • Опыт работы с моделями 480B+ параметров на кластерах GPU
  • Знание специфических GPU scheduling инструментов (Volcano, Kueue)
19 часов назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

AI Code Generation Engineer (Senior ML Engineer)

  • Magenta Technology
  • Самара
Описание Открыта вакансия AI Code Generation Engineer (Senior ML Engineer) на проект финтех Задачи: Разработка систем генерации и безопасной модификации кода через AST Создание метакомпиляторов для ...
23.12.2025

Firmware Engineer (Android)

  • Mercury Development
  • Самара
Описание We are currently looking for an experienced Staff Firmware Engineer (Android) Mercury Development specializes in developing custom software for various US companies: from large enterprises ...
22.12.2025

ML / AI Engineer (Python, Junior+, офис)

70 000 - 100 000 руб.
  • Гуддело
  • Самара
Описание Кто мы Gooddelo самарский IT-стартап. Делаем Gideone систему, которая анализирует работу продавцов на точке (аудио/видео) и даёт им персональный микрофидбек, чтобы поднимать выручку и ...
21.12.2025
70 000 - 100 000 руб.