Главная
Работа в Москве
ML Data engineer (LLM Gigachat)

ML Data engineer (LLM Gigachat)

Сбер

от 200 000 руб.

Москва Постоянная занятость Полный день

Поделиться Сохранить

Описание

Компания Сбер ищет хорошего специалиста на вакансию ML Data engineer (LLM Gigachat) . Москва (Россия), Санкт-Петербург (Россия). От 200 000 . Требуемые навыки: #middle, #Python, #Машинноеобучение, #Обработкаестественногоязыка, #NumPy, #PyTorch, #Математическоемоделирование, #Компьютерноезрение, #DeepLearning, #LLM, #NLP.

Требования

Python, Машинное обучение, Обработка естественного языка, NumPy, PyTorch, Математическое моделирование, Компьютерное зрение, Deep Learning, LLM, NLP

Обязанности

О компании и команде

Мы - команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококачественных технических и кодовых данных для обучения моделей.

Наши основные направления:
Validation & Metrics инструменты валидации и замера моделей
Data Engineering пайплайны чистки и синтеза данных
Code & Technical Data генерация кодовых/технических данных
MLOps хостинг и использование opensource моделей
Model Training эксперименты с LoRA и SFT

Если тебе интересно создавать инфраструктуру для развития LLM и работать с передовыми технологиями в области данных приходи к нам.

Обязанности

Validation & Metrics:
- разрабатывать инструменты для валидации и замера качества моделей
- создавать метрики оценки производительности и точности LLM
- автоматизировать процессы тестирования и бенчмаркинга.

Data Engineering:
- строить и оптимизировать пайплайны чистки и синтеза данных
- разрабатывать системы контроля качества данных
- автоматизировать процессы фильтрации и предобработки

Code & Technical Data:
- генерировать высококачественные кодовые и технические датасеты
- работать с различными форматами программного кода и технической документации
- создавать синтетические данные для обучения моделей на технических задачах

MLOps:
- развертывать и поддерживать инфраструктуру для хостинга opensource моделей
- интегрировать и использовать opensource модели в продуктовых решениях
- обеспечивать мониторинг и масштабирование ML-сервисов

Model Training & Experiments:
- обучать LoRA адаптеры для экспериментальных задач
- проводить SFT обучение в рамках исследований данных
- анализировать результаты экспериментов и итерировать подходы.

Ожидания от кандидата

- отличное знание Python и опыт работы с ML-библиотеками (LangChain/LangGraph, PyTorch, llm-foundry, verl)

- опыт работы с LLM (как opensource: Llama, Mistral, Qwen, так и проприетарными: GPT, Claude)

- понимание принципов работы с данными для обучения моделей: сбор, очистка, валидация

- навыки построения ML пайплайнов и автоматизации процессов

- понимание процессов, знание подходов к валидации и тестированию моделей машинного обучения

- понимание основ MLOps и работы с контейнеризацией (Docker).

Условия работы

- комфортный современный офис - в Москве (м. Кутузовская) или Санкт-Петербурге

- ежегодный пересмотр зарплаты, годовой бонус

- корпоративный спортзал и зоны отдыха

- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития

- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа

- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ

- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров

- вознаграждение за рекомендацию друзей в команду Сбера

- корпоративная пенсионная программа.

Откликнуться

2 дня назад Источник: career.habr.com

Обращаем Ваше внимание, что вакансия взята с внешнего источника career.habr.com. Администрация сайта не несет ответственность за ее содержание.

Рекомендуемые вакансии

Senior Data Engineer (LLM / RAG)

Прямой работодатель
Москва

Описание Компания Centicore находится в поисках Senior Data Engineer (LLM / RAG). Мы занимаемся продуктовой и платформенной разработкой под ключ для крупных заказчиков. В рамках проекта команда ...

22.12.2025

Data Engineer

РУССКИЙ ПРОДУКТ
Москва

Описание АО РУССКИЙ ПРОДУКТ - крупный отечественный производитель бакалейной продукции. Успешно работает на рынке с 1996 года. Наши бренды: Геркулес , Суперсуп , "Печем дома", "Традиция", и др. Мы ...

23.12.2025

Data Engineer (RAG / AI Platform)

Т-Банк
Москва

Описание Мы строим DataPlatfrom и AI-инфраструктуру, в которой инженеры, аналитики и разработчики смогут использовать современные подходы Retrieval-Augmented Generation (RAG) без боли и ручных ...

12.01.2026

Посмотреть все похожие вакансии