Локация

Data Engineer (Hadoop, Scala)

Медиалогия
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Медиалогия лидер в разработке продуктов для мониторинга и анализа данных из СМИ и социальных медиа.

Наши системы обрабатывают 100+ млн сообщений в сутки (1.7 млрд метрик), сканируя интернет в режиме реального времени. С помощью уникальных лингвистических технологий мы помогаем клиентам анализировать упоминания в соцсетях, блогах, форумах и управлять репутацией.

Чем предстоит заниматься:

  • Разработка и оптимизация ETL/ELT-конвейеров для обработки больших данных.

  • Настройка и администрирование Hadoop/Spark-инфраструктуры (HDFS, YARN, Hive, HBase).

  • Оптимизация распределенных вычислений и запросов.

  • Работа с потоковыми данными (Kafka, Spark Streaming, RabbitMQ).

  • Участие в проектировании и масштабировании архитектуры данных.

  • Автоматизация процессов с использованием DevOps-практик (Docker, CI/CD).

Ключевые требования:

  • Опыт работы с Java/Scala и Big Data-фреймворками (Apache Spark, Hadoop).

  • Глубокие знания Hadoop-экосистемы (YARN, HDFS, Hive, HBase, Parquet).

  • Опыт оптимизации производительности распределенных систем.

  • Работа с потоковой обработкой (Kafka, Spark Streaming).

  • Навыки работы с SQL/NoSQL (PostgreSQL, MS SQL, MongoDB).

Будет плюсом:

  • Опыт с PySpark, Flink, Airflow.

  • Знание Elasticsearch, ClickHouse, Vertica.

  • Навыки настройки кластеров и инфраструктуры.

Что мы предлагаем:

  • Официальное оформление по ТК РФ, белую зарплату.

  • Гибкий график и удалённый формат работы.

  • ДМС (включая международную страховку после испытательного срока).

  • Массажист в офисе.

Развитие и возможности:

  • Участие в сложных Big Data-проектах с высокой нагрузкой.

  • Карьерный рост в сильной data-команде.

  • Посещение профильных конференций за счет компании.

  • Система лояльности с партнёрами.

8 часов назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Senior Data Engineer

  • Flocktory
  • Москва
... 70%. Мы ищем опытного Data Engineer, который усилит команду ... - разработка витрин Yandex Data processing (Apache Hadoop, Apache Spark) - ... Pytnon (для Airflow) и Scala (для Spark) JIRA, Confluence ...
17.12.2025

Data Engineer в IT-компании

  • Прямой работодатель
  • Москва
... Мигрирование существующих пайплайнов с Hadoop/HDFS на новую архитектуру ... : Опыт на позиции Data Engineer / Big Data Engineer от 5+ лет; ... языков программирования, например, Scala; Работа с ClickHouse; SQL ...
16.12.2025

Data Engineer

  • Лига Цифровой Экономики
  • Москва
Описание Наша команда предоставляет для Банка ТОП-3 сервис обеспечения бизнес-процессов агрегированными и структурированными внешними данными . Разрабатываем дата-продукт внешнего профиля клиента, ...
26.12.2025