MLOps Engineer

red mad robot

Москва Опыт работы от 3 лет Постоянная занятость Полный день

Поделиться Сохранить

Описание

Что предстоит делать:

- Понимание принципов разработки AI-агентов:Агенты с использованием self-hosted LLM (Qwen, Mistral, LLaMA, Mixtral и др.).
- Продвинутые механики: Planning (планирование), Tool-usage (использование инструментов) и Memory (долговременная память).
- Участие в выборе архитектурных решений (мультиагентные системы, task orchestration).
Интеграция и RAG:
- Построение RAG (Retriever-Augmented Generation) пайплайнов на локальных моделях.
Интеграция агентов с внутренними источниками данных: векторные базы (Qdrant, Milvus, Faiss, ChromaDB), базы знаний и корпоративные API.
Развертывание и MLOps (LLMOps):
- Упаковка моделей и сервисов в Docker-контейнеры и их развертывание в Kubernetes (K8S).
- Развертывание и оптимизация инференса с помощью специализированных серверов (vLLM, Triton Inference Server, Ollama).
- Настройка и поддержка CI/CD пайплайнов для ML-моделей и сервисов агентов.
- Инфраструктура и эксплуатация (Ops):
- Управление GPU-кластерами; работа с NVIDIA container runtime.
- Обеспечение безопасности, изолированности и отказоустойчивости LLM-сервисов.
- Управление инфраструктурой как кодом (IaC) с помощью Terraform и Ansible.
- Внедрение и поддержка мониторинга (Prometheus stack), логирования, трейсинга и аудита поведения агентов.

От тебя:

- Языки и фреймворки: Отличное знание Python. Практический опыт с LLM-фреймворками, такими как LangChain, LlamaIndex или Haystack.

- Опыт с LLM: Опыт работы и развертывания open-source LLM (Mistral, LLaMA, Falcon и т.д.) в on-premise среде.
- Концепции AI-агентов: Понимание концепций Tool-usage, Planning, Memory и Prompt Chaining.
RAG и Векторные БД: Опыт построения RAG-систем. Знание принципов работы и опыт применения векторных баз данных (Qdrant, Weaviate, Milvus, Faiss).
DevOps/Ops:
- Уверенный опыт работы с Docker и Kubernetes (K8S) в production.
Глубокие знания Linux и Network.
- Опыт построения CI/CD пайплайнов (GitLab CI, Jenkins и т.п.).
GPU и Инференс:
Навыки работы с GPU-инфраструктурой и трекинга ресурсов.
- Опыт работы с серверами инференса, такими как vLLM, Ollama или Triton.
- Мониторинг: Опыт настройки и использования Prometheus stack для мониторинга инфраструктуры и ML-сервисов.

Будет плюсом:

- Оптимизация моделей: Опыт fine-tuning или quantization моделей (LoRA, QLoRA, GGUF).
- Инфраструктура (IaC): Практический опыт с Terraform и Ansible.
- Распределенные системы: Понимание принципов распределенного обучения (Distributed learning) и технологий (NVLink, Infiniband).
- Языки: Опыт работы с Go (Golang) для написания высокопроизводительной инфраструктурной обвязки.
- Безопасность (Security): Опыт внедрения DevSecOps практик (SAST, DAST, управление секретами).
- ML: Базовые принципы классического машинного обучения: датасеты, временные ряды, NLP, принципы обучения классических табличных моделей, глубоких моделей и языковых трансформеров

Чего ждать от роботов

Работа в сильной команде, где ценят инициативу, договорённости и честную обратную связь. Влиться и освоиться тебе поможет ментор. Позже ты тоже сможешь стать ментором для других.
Развитие наш пунктик: берёмся за сложные задачи, которые нас продвинут. Проводим школы и интенсивы, чтобы прокачаться. Зовём интересных гостей для развития кругозора. Пользуемся бесплатной электронной библиотекой.
Всё по-честному: у нас белая зарплата и оформление в штат с первого дня, прозрачная система развития с персональным планом и ДМС с хорошими условиями через 3 месяца работы.
И телу приятно: выбираем комфортный формат работы - удаленно из любого региона или гибрид в Москве в удобном БЦ рядом с парком им. Горького.

Откликнуться

17 дней назад Источник: hh.ru

Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.

Рекомендуемые вакансии

Senior MLOps Engineer

Звук
Москва

... Описание Мы ищем Senior MLOps Engineer, который примет активное ... Prometheus, Grafana. Задачи: Создание MLOps-практик (стенды, DevOps, процессы) ... в качестве DevOps/MLOps/ML Engineer не менее 2 лет ...

25.12.2025

Middle MLOps Engineer (Recommendation Systems)

WILDBERRIES
Москва

... Russ. Сейчас мы ищем Middle MLOps Engineer в команду Рекомендаций. Наша команда ... продуктивизации), оптимизировать их производительность; Внедрять MLOps инструменты для автоматизации процессов жизненного ...

27.12.2025

MLOps Engineer Trust and Safety

Wildberries & Russ
Москва

... ищет хорошего специалиста на вакансию MLOps Engineer Trust and Safety . Москва ... Triton Inference Server. Ищем MLOps инженера так как количество ... длительностью 1 час Интервью MLOps 1,5 часа Финальное ...

12.01.2026

Посмотреть все похожие вакансии