Локация

Lead Site Reliabily Engineer в One Cloud

VK
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

One Cloud это технологический фундамент для всех продуктов компании. Мы предоставляем единую среду запуска приложений, хранилищ, баз данных и любых других сервисов.

Сейчас One Cloud это 12 000 серверов в 9 дата-центрах, загрузка более 1 000 000 процессорных ядер, объём хранилища в 5000 терабайт и 400 Тбит/сек по сети.

Перед командой стоят задачи развития и масштабирования, повышения надёжности, разработки внутренних инструментов и онбординг новых проектов. Ключевая цель стать самым передовым внутренним облаком среди аналогичных платформ.

Мы ищем Site Reliability Engineer, готовых разделить с нами задачи по эксплуатации, инцидент-менеджменту, R&D, а также принять технический вызов кратного роста Облака и амбициозности поставленных перед командой задач.

Стек: Linux, Python, Go, CFEngine, AWX.

Задачи

  • Управлять командой от пяти человек
  • Эксплуатировать парк серверов облака (в том числе bare metal) более 10 000 хостов
  • Постоянно обновлять парк серверов мы стараемся эффективнее использовать каждый юнит в дата-центрах
  • Управлять инцидентами в связке с командами мониторинга и разработки устранять сбои и предотвращать их повторение
  • Автоматизировать процессы эксплуатации и оркестрации при наших объёмах задачи решаются через код
  • Участвовать в разработке и внедрении новой функциональности облака

Требования

  • Коммерческий опыт работы в релевантной роли лида команды от трёх лет
  • Опыт работы с серверной инфраструктурой на базе Linux, уверенные знания Linux
  • Опыт работы с сетью iptables, BGP, VRRP
  • Опыт работы с SCM Puppet, Salt, Ansible
  • Опыт автоматизации на Bash

Будет плюсом

  • Опыт работы с системами на базе RHEL
  • Опыт работы с веб-хостингом nginx, серверы приложений, MySQL, Postgres
  • Опыт работы с CFEngine, Cassandra, Zabbix и Vault
  • Знание Go и Java
день назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Старший Java-разработчик в One Cloud

  • VK
  • Москва
Описание Нашими продуктами и сервисами пользуется больше 95% аудитории рунета. Мы развиваем продукты и услуги для цифровизации бизнес-процессов от интернет-продвижения и предиктивной аналитики до ...
17.12.2025

Site Reliability Engineer (SRE)

  • Finstar Financial Group
  • Москва
Описание В NOVACARD мы создаём продукт, который меняет подход к кредитованию: первая в Мексике карта без процентов и годового обслуживания, полностью управляемая через мобильное приложение. Сейчас мы ...
16.12.2025

Site Reliability Engineer (SRE)

  • EYES OF WONDER SOFTWARE LLC
  • Москва
Описание Хэллоу! Мы Eyes of Wonder , венчурная студия с более чем 10-летним опытом запусков и масштабирования стартапов. Cейчас ищем Site Reliability Engineer (SRE) для наших продуктов Nextbrowser ( ...
24.12.2025