ML инженер (MLOps)
СимбирСофтОписание
Мы в поиске практикующего эксперта, готового работать на стыке DevOps и ML-инфраструктуры. Нам нужен человек с архитектурным мышлением, способный полностью вести инфраструктурные проекты от идеи до результата.
Чем предстоит заниматься:
1. Поддержка и развитие инфраструктуры LLM
- Разворачивать и обновлять inference-сервисы (vLLM, TGI, Ollama) в кластере Deckhouse Kubernetes
- Управлять GPU-нодами (2 H100): профили, квоты, allocation, DCGM-мониторинг.
- Настраивать OpenWebUI (обновления, кастомные ассистенты, плагины, pipelines)
- Настраивать CI/CD пайплайны для моделей и ассистентов (через GitLab CI/CD, Helm, ArgoCD).
- Управлять хранилищами (PVC, MinIO/S3) для индексов и документов.
2. RAG
- Настраивать пайплайны загрузки документов (Confluence, регламенты, файлы).
- Оптимизировать параметры retrieval: chunk size, overlap, embedding-модели.
- Настраивать интеграции с Langfuse (datasets, traces, evals) для оценки качества.
- Разворачивать и обновлять LlamaIndex, Chroma, Postgres Vector по мере масштабирования.
3. Интеграции и инструменты
- Подключать новые MCP-инструменты (Jira, 1С, DWH, Контур-Фокус и др.) к ассистентам.
- Разворачивать новые сервисные модули (например, Langfuse, LlamaIndex, Eval серверы).
- Прокидывать порты, настраивать Ingress, Secrets, RBAC.
4. Наблюдаемость и качество
- Настраивать мониторинг (Prometheus/Grafana, Langfuse)
- Настраивать nightly evals (через Langfuse Datasets + judge-скоры).
5. Безопасность и контроль
- Настраивать роли и лимиты в RBAC (OpenWebUI + Keycloak).
- Реализовывать маскировку PII (телефоны, ИНН, e-mail) в пайплайнах.
Мы ищем человека, который:
- Обладает с системным мышлением, способный вести инфраструктурные проекты от концепции до промышленной эксплуатации;
- Работает на стыке DevOps и ML-инфраструктуры, предпочитая задачи построения продуктовой LLM-платформы исследовательским экспериментам.
Что нужно от тебя:
- Опыт работы с LLM-моделями (vLLM, TGI, Hugging Face, Ollama).
- Практический опыт с Python (FastAPI, скрипты, CLI).
- Понимание архитектуры RAG и работы с embedding-моделями.
- Навыки настройки Prometheus/Grafana, анализа метрик производительности.
- Опыт работы с системами аутентификации (Keycloak, JWT).
- Уверенные знания Kubernetes, Docker, CI/CD (GitLab/Helm).
- Понимание принципов RBAC, изоляции данных, PII-безопасности.
Будет плюсом:
- Опыт работы с Deckhouse или другими K8s-дистрибутивами.
- Знание Langfuse, LlamaIndex, Postgres Vector, Chroma.
- Базовые знания MLOps (модели, fine-tuning, quantization, caching).
- Опыт интеграции API внешних систем (Jira, 1С, DWH).
- Умение писать внутренние утилиты и документацию.
Мы предлагаем:
- Работу в команде экспертов.
- Широкий технологический стек, сотни проектов.
- Гибкий график работы, который позволяет высыпаться и выделять время на хобби.
- Льготы и меры господдержки, предусмотренные для IT-компаний (аккредитованы Минцифры*).
- Возможность разрабатывать IT-решения для разных отраслей, пробовать новые технологии.
- У нас выстроены процессы удаленной работы, при этом есть просторные офисы с зонами коворкинга, где можно с комфортом пообщаться, поиграть в настолки или в тишине обдумать рабочие задачи.
- Возможность прокачаться во всех интересующих направлениях.
- Развитую систему наставничества, сертификацию за счёт компании, участие в конференциях, изучение английского языка.
- Активный обмен опытом, внутренние и внешние митапы по разработке, хакатоны, доклады по развитию hard и soft skills.
- 50+ клубов по интересам и профессиональных сообществ внутри компании.
- Уютный мерч.
- Полный соцпакет и белую зарплату.
- Корпоративную базу знаний и социальную сеть для удобства общения с каждым из 1500+ сотрудников.
- Гибкую систему бонусов, которая настраивается под индивидуальные потребности: различные уровни ДМС, оплата обучения и занятий любыми видами спорта.
- Заботу о ментальном здоровье: онлайн-консультации с психологом.
* Решение Министерства цифрового развития, связи и массовых коммуникаций РФ о предоставлении государственной аккредитации организации, осуществляющей деятельность в области информационных технологий от 10.03.2022 АО-20220309-3771014210-3
9 часов назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
Специалист по внедрению искусственного интеллекта (ML-инженер/MLOps)
до
200 000 руб.
Описание Мы одни из лидеров в нашем направлении! Более 20 лет мы осуществляем доставку питьевой, минеральной и лечебной воды, а также сопутствующих товаров на дом и в офис. Мы верим в возможности ...
10.01.2026
Инженер MLOps (ML Engineer)
... сервисов и инструментов DevOps/MLOps; Специфичные операции для ML : Поддержка жизненного цикла ... более года работы ML инженером с опытом MLOps / DevOps для ML, из них минимум ...
25.12.2025
ML-инженер
250 000 - 300 000 руб.
... условиях труда. Мы ищем ML-инженеров на наши проекты! Обязанности: ... , мониторинга и поддержки (MLOps). Участие в создании и ... Series Forecasting . Знание фреймворков для MLOps: MLflow, Kubeflow, Airflow, ...
25.12.2025