Локация

LLMOps / AI Engineer

РУСАЛ
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Мы ищем LLMOps/AI инженера для построения и управления инфраструктурой AI-решений. Вы будете отвечать за создание пайплайнов обработки данных, развертывание LLM-моделей и автоматизацию AI-процессов.

Обязанности:

Разработка и автоматизация:

  • Создание и оптимизация no-code/low-code пайплайнов в n8n (workflow automation);
  • Проектирование и внедрение RAG (Retrieval-Augmented Generation) решений;
  • Проектирование и внедрение MCP серверов;
  • Интеграция AI-моделей (локальные модели на vllm ollama) в бизнес-процессы;
  • Настройка и оптимизация взаимодействия с различными API (разработка API).

DevOps и инфраструктура:

  • Развертывание и управление контейнеризованными приложениями с использованием Docker и Kubernetes ;
  • Управление векторными базами данных ( Qdrant или аналоги: Pinecone, Weaviate, ChromaDB);
  • Мониторинг производительности и оптимизация инфраструктуры.

LLM Infrastructure:

  • Работа с LiteLLM или аналогичными решениями для унификации доступа к LLM;
  • Развертывание и настройка Ollama для локального запуска моделей;
  • Конфигурация vLLM для высокопроизводительного inference;
  • Настройка и кастомизация Open WebUI , в том числе пайплайнов.

Разработка и расширение функциональности:

  • Создание кастомных нод для n8n ;
  • Разработка микросервисов и API интеграций;
  • Написание скриптов для автоматизации процессов;
  • Написание конфигураций для разных моделей и сервисов.

Требования:

  • Уверенное владение Python (для написания скриптов, автоматизации, разработки нод);

  • DevOps практики: Docker, Kubernetes , базовые знания оркестрации;
  • Опыт работы с n8n или аналогичными системами автоматизации (Zapier, Make, Airflow, Flowise);
  • LiteLLM или аналогичные инструменты для работы с множественными LLM провайдерами;
  • Практический опыт настройки и развертывания RAG пайплайнов ;
  • Понимание принципов работы LLM (промпт-инжиниринг);
  • Знание векторных баз данных и embedding моделей;
  • Опыт интеграции AI/ML сервисов через API.

Будет значительным плюсом:

  • Создание кастомных нод для n8n (JavaScript/TypeScript);
  • Опыт разработки плагинов и расширений для LLM инструментов;
  • Знание LangChain, LlamaIndex для построения сложных AI пайплайнов;
  • Опыт работы с одним из фреймворков: SinaraML, MLFlow, DVC, ClearML;
  • Опыт оптимизации моделей (квантование, прунинг, ONNX/TensorRT).

Также будет плюсом:

  • Опыт работы с базами данных (PostgreSQL, MongoDB);
  • Системами очередей (Kafka, RabbitMQ, Redis);
  • Знание систем мониторинга (Prometheus, Grafana);
  • Английский язык на уровне чтения технической документации.

Условия:

  • Возможность присоединиться к команде, работающей над цифровизацией реального сектора экономики;

  • Возможность участвовать в интересных и сложных проектах с ведущими специалистами индустрии;

  • Пятидневная рабочая неделя (5/2) с 9:00 до 18:00;

  • Работа в крупной международной компании (69 тыс. сотрудников, 1-е место по объему производства алюминия в мире), официальное трудоустройство (белая ЗП, отпуск, больничный);

  • Оформление, оплата отпусков и больничных в соответствии с ТК РФ.

7 дней назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

AI Engineer

  • Aston
  • Москва
Описание Aston аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Heal...
09.12.2025

AI Engineer

  • Мосгосэкспертиза
  • Москва

Описание

В связи с расширением штата приглашаем к нам в команду профессионала на позицию AI Engineer.

Обязанности:

  • Разработка и ...
23.12.2025

AI Engineer (web agents)

  • EmFi Technologies Limited
  • Москва

Описание

We are seeking a motivated and talented Python/AI Engineer to join our dynamic, fast-growing team. The ideal candidate will have a strong foundation in Python ...

01.12.2025