Локация

Старший инженер по инфраструктуре ML

WILDBERRIES
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Объединённая компания Wildberries и Russ это международная технологическая компания, образованная в результате слияния двух лидеров рынка IT-компании Wildberries и оператора наружной рекламы Russ.
Сейчас мы в поисках Старшего инженера по инфраструктуре ML .


Вам предстоит:

  • Обеспечивать стабильную, производительную и масштабируемую аппаратную платформу для ML;
  • Оперативно устранять сбои, поддерживать SLA, разрабатывать проактивные меры по предотвращению инцидентов;
  • Выбирать и закупать оборудование, составлять ТЗ, (Техническое проектирование), тестировать и валидировать оборудование (Performance & Compatibility);
  • Активно участвовать в проектах по ML, координировать работы смежных команд, взаимодействовать с поставщиками, подрядчиками и ЦОД;
  • Администрировать кластеры GPU/TPU и распределенных вычислительных систем;
  • Заниматься мониторингом и отслеживанием состояния инфраструктуры;
  • Автоматизировать развертывания и обновления сервисов и рутинных операций;
  • Заниматься оптимизацией затрат на вычислительные ресурсы;
  • Заниматься поддержкой команды Data Science;
  • Вести техническую документацию по архитектуре и процессам, разрабатывать стандарты, best practice, подготавливать отчеты по состоянию инфраструктуры.

Вы нам подходите, если имеете следующий опыт:

  • Обеспечение стабильной, производительной и масштабируемой аппаратной платформы для ML;
  • Оперативное устранение сбоев, поддержка SLA, разработка проактивных мер по предотвращению инцидентов;
  • Выбор и закупка оборудования, составление ТЗ, (Техническое проектирование), тестирование и валидация оборудования (Performance & Compatibility);
  • Активное участие в проектах по ML, координация работ смежных команд, взаимодействие с поставщиками, подрядчиками и ЦОД;
  • Администрирование кластеров GPU/TPU и распределенных вычислительных систем;
  • Мониторинг и отслеживание состояние инфраструктуры;
  • Автоматизация развертывания и обновления сервисов и рутинных операций;
  • Оптимизация затрат на вычислительные ресурсы;
  • Поддержка команды Data Science;
  • Ведение технической документации по архитектуре и процессам, разработка стандартов, best practice, подготовка отчетов по состоянию инфраструктуры.

Будет плюсом:

  • Оптимизация затрат на вычислительные ресурсы;
  • Поддержка команды Data Science;
  • Ведение технической документации по архитектуре и процессам, разработка стандартов, best practice, подготовка отчетов по состоянию инфраструктуры.

Условия для сотрудников:

  • Обучение и развитие: языковые клубы, собственный корпоративный университет, программы развития управленческих навыков и многое другое;
  • Благополучие сотрудников: корпоративный пакет ДМС со стоматологией, корпоративный спорт, консультации психолога и дополнительные возможности аккредитованной IT-компании;
  • Множество сообществ: клуб спикеров, футбола, йоги, шахмат и т.д.;
  • Забота о семьях: создаем условия, в которых легко сочетать карьеру и заботу о близких от гибкого подхода до масштабных проектов для детей сотрудников;
  • Скидки и партнерские программы: на обучение, страхование, покупки и многое другое;
  • Комфортная рабочая среда: бесплатное питание в офисе, современные офисы рядом с метро, корпоративная техника и портал для сотрудников.
12 часов назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Старший инженер по инфраструктуре Linux

  • ANCOR
  • Москва
Описание Мы - одна из крупнейших производственных компаний, инвестирующих в пищевое и перерабатывающее производство. Мы стремимся обеспечить продовольствием население мира. В нашу новую ИТ структуру ...
12.01.2026

Старший инженер мультимедиа

  • ВИЖУ
  • Москва
Описание ВИЖУ - аккредитования IT-компания, в которой работают активные, прогрессивные и творческие люди. Сегодня ВИЖУ является одним из лидеров рынка по проектам в сфере создания музеев, больших ...
10.01.2026

Старший инженер по внедрению и эксплуатации облачных решений

  • Киберпротект
  • Москва
Описание П РИВЕТ! МЫ КИБЕРПРОТЕКТ российская аккредитованная ИТ-компания, разработчик решений для защиты данных. Наши продукты, внесенные в реестр российского ПО, обеспечивают безопасность данных ...
11.01.2026