Локация

Архитектор ML-решений

СимбирСофт
Екатеринбург Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

SimbirSoft уже более 20 лет реализует амбициозные проекты на рынке разработки!

Сейчас есть уникальная возможность для талантливых и инициативных профессионалов присоединиться к нашей команде. Если ты хочешь расти, развиваться и участвовать в захватывающих проектах присоединяйся к нам и вместе мы достигнем новых высот!

Чем предстоит заниматься:

1. Поддержка и развитие инфраструктуры LLM

  • Разворачивать и обновлять inference-сервисы (vLLM, TGI, Ollama) в кластере Deckhouse Kubernetes
  • Управлять GPU-нодами (2 H100): профили, квоты, allocation, DCGM-мониторинг.
  • Настраивать OpenWebUI (обновления, кастомные ассистенты, плагины, pipelines)
  • Настраивать CI/CD пайплайны для моделей и ассистентов (через GitLab CI/CD, Helm, ArgoCD).
  • Управлять хранилищами (PVC, MinIO/S3) для индексов и документов.


2. RAG

  • Настраивать пайплайны загрузки документов (Confluence, регламенты, файлы).
  • Оптимизировать параметры retrieval: chunk size, overlap, embedding-модели.
  • Настраивать интеграции с Langfuse (datasets, traces, evals) для оценки качества.
  • Разворачивать и обновлять LlamaIndex, Chroma, Postgres Vector по мере масштабирования.


3. Интеграции и инструменты

  • Подключать новые MCP-инструменты (Jira, 1С, DWH, Контур-Фокус и др.) к ассистентам.
  • Разворачивать новые сервисные модули (например, Langfuse, LlamaIndex, Eval серверы).
  • Прокидывать порты, настраивать Ingress, Secrets, RBAC.


4. Наблюдаемость и качество

  • Настраивать мониторинг (Prometheus/Grafana, Langfuse)
  • Настраивать nightly evals (через Langfuse Datasets + judge-скоры).


5. Безопасность и контроль

  • Настраивать роли и лимиты в RBAC (OpenWebUI + Keycloak).
  • Реализовывать маскировку PII (телефоны, ИНН, e-mail) в пайплайнах.


Мы ищем человека, который

  • мыслит системно и умеет замыкать инфраструктурные задачи под ключ;
  • не боится сочетания DevOps и ML-инфры;
  • готов работать в продуктовой LLM-платформе, а не в исследовательской среде;
  • хочет выстроить архитектуру корпоративного AI-движка, а не просто деплоить модели.


Что нужно от тебя:

  • Опыт работы с LLM-моделями (vLLM, TGI, Hugging Face, Ollama).
  • Практический опыт с Python (FastAPI, скрипты, CLI).
  • Понимание архитектуры RAG и работы с embedding-моделями.
  • Навыки настройки Prometheus/Grafana, анализа метрик производительности.
  • Опыт работы с системами аутентификации (Keycloak, JWT).
  • Уверенные знания Kubernetes, Docker, CI/CD (GitLab/Helm).
  • Понимание принципов RBAC, изоляции данных, PII-безопасности.


Будет плюсом:

  • Опыт работы с Deckhouse или другими K8s-дистрибутивами.
  • Знание Langfuse, LlamaIndex, Postgres Vector, Chroma.
  • Базовые знания MLOps (модели, fine-tuning, quantization, caching).
  • Опыт интеграции API внешних систем (Jira, 1С, DWH).
  • Умение писать внутренние утилиты и документацию.


Мы предлагаем:

  • Работу в команде экспертов.
  • Широкий технологический стек, сотни проектов.
  • Гибкий график работы, который позволяет высыпаться и выделять время на хобби.
  • Льготы и меры господдержки, предусмотренные для IT-компаний (аккредитованы Минцифры*).
  • Возможность разрабатывать IT-решения для разных отраслей, пробовать новые технологии.
  • У нас выстроены процессы удаленной работы, при этом есть просторные офисы с зонами коворкинга, где можно с комфортом пообщаться, поиграть в настолки или в тишине обдумать рабочие задачи.
  • Возможность прокачаться во всех интересующих направлениях.
  • Развитую систему наставничества, сертификацию за счёт компании, участие в конференциях, изучение английского языка.
  • Активный обмен опытом, внутренние и внешние митапы по разработке, хакатоны, доклады по развитию hard и soft skills.
  • 50+ клубов по интересам и профессиональных сообществ внутри компании.
  • Уютный мерч.
  • Полный соцпакет и белую зарплату.
  • Корпоративную базу знаний и социальную сеть для удобства общения с каждым из 1500+ сотрудников.
  • Гибкую систему бонусов, которая настраивается под индивидуальные потребности: различные уровни ДМС, оплата обучения и занятий любыми видами спорта.
  • Заботу о ментальном здоровье: онлайн-консультации с психологом.

    * Решение Министерства цифрового развития, связи и массовых коммуникаций РФ о предоставлении государственной аккредитации организации, осуществляющей деятельность в области информационных технологий от 10.03.2022 АО-20220309-3771014210-3
день назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Архитектор

  • Т-Банк
  • Екатеринбург
... до инвестиционных площадок и ML-продуктов. Наша пользовательская ... добавляет новые фичи. Ищем архитекторов, которые будут развивать проекты ... банк и финансовые сервисы, решения для бизнеса и инвестиций, ...
25.12.2025

Архитектор

  • Практика
  • Екатеринбург
Описание Компания Практика уже более 18 лет занимает лидирующие позиции на уральском строительном рынке. Мы не просто строим здания, мы создаем инновационные пространства, улучшая качество жизни ...
12.01.2026

Главный архитектор проекта по коммерческой инфраструктуре (развитие продукта)

  • Брусника
  • Екатеринбург
Описание О компании Брусника российская девелоперская компания. Специализируется на строительстве жилых многоэтажных домов. Основана в 2004 году. Штаб-квартира находится в Екатеринбурге. Брусника ...
11.01.2026