LLM Platform Engineer (ML Engineer)
Magenta TechnologyОписание
Открыта вакансия LLM Platform Engineer (ML Engineer) на проект финтех.
Задачи:
- Развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
- Организация MLOps-процессов и системная оценка качества моделей
- Обеспечение production latency <2s и uptime >95% для инфраструктуры inference
- Профилирование и оптимизация использования VRAM (CUDA OOM prevention)
- Мониторинг GPU-производительности
Мы ожидаем от тебя:
- Python (asyncio, multiprocessing, typing) Advanced уровня
- Bash/Shell scripting Advanced уровня для автоматизации развертывания
- Практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
- Опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
- Знание оптимизаций Flash Attention и Paged Attention
- Навыки работы с PyTorch, JAX, ONNX для универсального развертывания
- Опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA)
Будет плюсом:
- Опыт развертывания моделей на multi-GPU
- Практика профилирования VRAM usage в production-средах
- Опыт работы с моделями 480B+ параметров на кластерах GPU
- Знание специфических GPU scheduling инструментов (Volcano, Kueue)
19 часов назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
AI Code Generation Engineer (Senior ML Engineer)
Описание Открыта вакансия AI Code Generation Engineer (Senior ML Engineer) на проект финтех Задачи: Разработка систем генерации и безопасной модификации кода через AST Создание метакомпиляторов для ...
23.12.2025
Firmware Engineer (Android)
Описание We are currently looking for an experienced Staff Firmware Engineer (Android) Mercury Development specializes in developing custom software for various US companies: from large enterprises ...
22.12.2025
ML / AI Engineer (Python, Junior+, офис)
70 000 - 100 000 руб.
Описание Кто мы Gooddelo самарский IT-стартап. Делаем Gideone систему, которая анализирует работу продавцов на точке (аудио/видео) и даёт им персональный микрофидбек, чтобы поднимать выручку и ...
21.12.2025