Локация

ML Data engineer (LLM Gigachat)

Сбер
  • от 200 000 руб.
Москва Постоянная занятость Полный день
Поделиться

Описание

Компания Сбер ищет хорошего специалиста на вакансию ML Data engineer (LLM Gigachat) . Москва (Россия), Санкт-Петербург (Россия). От 200 000 . Требуемые навыки: #middle, #Python, #Машинноеобучение, #Обработкаестественногоязыка, #NumPy, #PyTorch, #Математическоемоделирование, #Компьютерноезрение, #DeepLearning, #LLM, #NLP.

Требования

Python, Машинное обучение, Обработка естественного языка, NumPy, PyTorch, Математическое моделирование, Компьютерное зрение, Deep Learning, LLM, NLP

Обязанности

О компании и команде

Мы - команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококачественных технических и кодовых данных для обучения моделей.

Наши основные направления:
Validation & Metrics инструменты валидации и замера моделей
Data Engineering пайплайны чистки и синтеза данных
Code & Technical Data генерация кодовых/технических данных
MLOps хостинг и использование opensource моделей
Model Training эксперименты с LoRA и SFT

Если тебе интересно создавать инфраструктуру для развития LLM и работать с передовыми технологиями в области данных приходи к нам.

Обязанности

Validation & Metrics:
- разрабатывать инструменты для валидации и замера качества моделей
- создавать метрики оценки производительности и точности LLM
- автоматизировать процессы тестирования и бенчмаркинга.

Data Engineering:

- строить и оптимизировать пайплайны чистки и синтеза данных
- разрабатывать системы контроля качества данных
- автоматизировать процессы фильтрации и предобработки

Code & Technical Data:

- генерировать высококачественные кодовые и технические датасеты
- работать с различными форматами программного кода и технической документации
- создавать синтетические данные для обучения моделей на технических задачах

MLOps:

- развертывать и поддерживать инфраструктуру для хостинга opensource моделей
- интегрировать и использовать opensource модели в продуктовых решениях
- обеспечивать мониторинг и масштабирование ML-сервисов

Model Training & Experiments:

- обучать LoRA адаптеры для экспериментальных задач
- проводить SFT обучение в рамках исследований данных
- анализировать результаты экспериментов и итерировать подходы.

Ожидания от кандидата

- отличное знание Python и опыт работы с ML-библиотеками (LangChain/LangGraph, PyTorch, llm-foundry, verl)

- опыт работы с LLM (как opensource: Llama, Mistral, Qwen, так и проприетарными: GPT, Claude)

- понимание принципов работы с данными для обучения моделей: сбор, очистка, валидация

- навыки построения ML пайплайнов и автоматизации процессов

- понимание процессов, знание подходов к валидации и тестированию моделей машинного обучения

- понимание основ MLOps и работы с контейнеризацией (Docker).

Условия работы

- комфортный современный офис - в Москве (м. Кутузовская) или Санкт-Петербурге

- ежегодный пересмотр зарплаты, годовой бонус

- корпоративный спортзал и зоны отдыха

- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития

- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа

- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ

- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров

- вознаграждение за рекомендацию друзей в команду Сбера

- корпоративная пенсионная программа.
Откликнуться
2 дня назад Источник: career.habr.com
Обращаем Ваше внимание, что вакансия взята с внешнего источника career.habr.com. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Senior Data Engineer (LLM / RAG)

  • Прямой работодатель
  • Москва
Описание Компания Centicore находится в поисках Senior Data Engineer (LLM / RAG). Мы занимаемся продуктовой и платформенной разработкой под ключ для крупных заказчиков. В рамках проекта команда ...
22.12.2025

Data Engineer

  • РУССКИЙ ПРОДУКТ
  • Москва
Описание АО РУССКИЙ ПРОДУКТ - крупный отечественный производитель бакалейной продукции. Успешно работает на рынке с 1996 года. Наши бренды: Геркулес , Суперсуп , "Печем дома", "Традиция", и др. Мы ...
23.12.2025

Data Engineer (RAG / AI Platform)

  • Т-Банк
  • Москва
Описание Мы строим DataPlatfrom и AI-инфраструктуру, в которой инженеры, аналитики и разработчики смогут использовать современные подходы Retrieval-Augmented Generation (RAG) без боли и ручных ...
12.01.2026