Локация

ML инженер (MLOps)

СимбирСофт
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Мы в поиске практикующего эксперта, готового работать на стыке DevOps и ML-инфраструктуры. Нам нужен человек с архитектурным мышлением, способный полностью вести инфраструктурные проекты от идеи до результата.

Чем предстоит заниматься:

1. Поддержка и развитие инфраструктуры LLM

  • Разворачивать и обновлять inference-сервисы (vLLM, TGI, Ollama) в кластере Deckhouse Kubernetes
  • Управлять GPU-нодами (2 H100): профили, квоты, allocation, DCGM-мониторинг.
  • Настраивать OpenWebUI (обновления, кастомные ассистенты, плагины, pipelines)
  • Настраивать CI/CD пайплайны для моделей и ассистентов (через GitLab CI/CD, Helm, ArgoCD).
  • Управлять хранилищами (PVC, MinIO/S3) для индексов и документов.

2. RAG

  • Настраивать пайплайны загрузки документов (Confluence, регламенты, файлы).
  • Оптимизировать параметры retrieval: chunk size, overlap, embedding-модели.
  • Настраивать интеграции с Langfuse (datasets, traces, evals) для оценки качества.
  • Разворачивать и обновлять LlamaIndex, Chroma, Postgres Vector по мере масштабирования.

3. Интеграции и инструменты

  • Подключать новые MCP-инструменты (Jira, 1С, DWH, Контур-Фокус и др.) к ассистентам.
  • Разворачивать новые сервисные модули (например, Langfuse, LlamaIndex, Eval серверы).
  • Прокидывать порты, настраивать Ingress, Secrets, RBAC.

4. Наблюдаемость и качество

  • Настраивать мониторинг (Prometheus/Grafana, Langfuse)
  • Настраивать nightly evals (через Langfuse Datasets + judge-скоры).

5. Безопасность и контроль

  • Настраивать роли и лимиты в RBAC (OpenWebUI + Keycloak).
  • Реализовывать маскировку PII (телефоны, ИНН, e-mail) в пайплайнах.

Мы ищем человека, который:

  • Обладает с системным мышлением, способный вести инфраструктурные проекты от концепции до промышленной эксплуатации;
  • Работает на стыке DevOps и ML-инфраструктуры, предпочитая задачи построения продуктовой LLM-платформы исследовательским экспериментам.

Что нужно от тебя:

  • Опыт работы с LLM-моделями (vLLM, TGI, Hugging Face, Ollama).
  • Практический опыт с Python (FastAPI, скрипты, CLI).
  • Понимание архитектуры RAG и работы с embedding-моделями.
  • Навыки настройки Prometheus/Grafana, анализа метрик производительности.
  • Опыт работы с системами аутентификации (Keycloak, JWT).
  • Уверенные знания Kubernetes, Docker, CI/CD (GitLab/Helm).
  • Понимание принципов RBAC, изоляции данных, PII-безопасности.

Будет плюсом:

  • Опыт работы с Deckhouse или другими K8s-дистрибутивами.
  • Знание Langfuse, LlamaIndex, Postgres Vector, Chroma.
  • Базовые знания MLOps (модели, fine-tuning, quantization, caching).
  • Опыт интеграции API внешних систем (Jira, 1С, DWH).
  • Умение писать внутренние утилиты и документацию.

Мы предлагаем:

  • Работу в команде экспертов.
  • Широкий технологический стек, сотни проектов.
  • Гибкий график работы, который позволяет высыпаться и выделять время на хобби.
  • Льготы и меры господдержки, предусмотренные для IT-компаний (аккредитованы Минцифры*).
  • Возможность разрабатывать IT-решения для разных отраслей, пробовать новые технологии.
  • У нас выстроены процессы удаленной работы, при этом есть просторные офисы с зонами коворкинга, где можно с комфортом пообщаться, поиграть в настолки или в тишине обдумать рабочие задачи.
  • Возможность прокачаться во всех интересующих направлениях.
  • Развитую систему наставничества, сертификацию за счёт компании, участие в конференциях, изучение английского языка.
  • Активный обмен опытом, внутренние и внешние митапы по разработке, хакатоны, доклады по развитию hard и soft skills.
  • 50+ клубов по интересам и профессиональных сообществ внутри компании.
  • Уютный мерч.
  • Полный соцпакет и белую зарплату.
  • Корпоративную базу знаний и социальную сеть для удобства общения с каждым из 1500+ сотрудников.
  • Гибкую систему бонусов, которая настраивается под индивидуальные потребности: различные уровни ДМС, оплата обучения и занятий любыми видами спорта.
  • Заботу о ментальном здоровье: онлайн-консультации с психологом.
    * Решение Министерства цифрового развития, связи и массовых коммуникаций РФ о предоставлении государственной аккредитации организации, осуществляющей деятельность в области информационных технологий от 10.03.2022 АО-20220309-3771014210-3
9 часов назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Специалист по внедрению искусственного интеллекта (ML-инженер/MLOps)

до 200 000 руб.
  • ВОДОВОЗ.RU
  • Москва
Описание Мы одни из лидеров в нашем направлении! Более 20 лет мы осуществляем доставку питьевой, минеральной и лечебной воды, а также сопутствующих товаров на дом и в офис. Мы верим в возможности ...
10.01.2026
до 200 000 руб.

Инженер MLOps (ML Engineer)

  • Современные Фонды Недвижимости
  • Москва
... сервисов и инструментов DevOps/MLOps; Специфичные операции для ML : Поддержка жизненного цикла ... более года работы ML инженером с опытом MLOps / DevOps для ML, из них минимум ...
25.12.2025

ML-инженер

250 000 - 300 000 руб.
  • В Кадре
  • Москва
... условиях труда. Мы ищем ML-инженеров на наши проекты! Обязанности: ... , мониторинга и поддержки (MLOps). Участие в создании и ... Series Forecasting . Знание фреймворков для MLOps: MLflow, Kubeflow, Airflow, ...
25.12.2025
250 000 - 300 000 руб.