Локация

Data Engineer (PostgreSQL, ClickHouse, Trino)

Филиал The Visa Services в г. Москва
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

thevisa.com продукт о визах и путешествиях. У нас есть сайты, интеграции с партнёрами и CRM, поэтому данных много и они приходят со всех сторон.
Нам нужен Data Engineer , который приручит эти данные и обезвредит кучу API , Airbyte, ClickHouse и Trino так, чтобы бизнес видел цифры, а не звёздочки в глазах.

Чем предстоит заниматься

- Проектировать и развивать хранилище данных: PostgreSQL (операционные/ODS данные) + ClickHouse (аналитика, витрины, отчёты).

- Настраивать и стабилизировать загрузки из кучи API (включая Bitrix24 CRM, партнёрские и продуктовые сервисы): ELT/ETL, инкремент, дедупликации, SLA на пайплайны.

- Приручить Airbyte: довести до продакшн-состояния (стабильность, ретраи, алерты) и/или написать кастомные коннекторы; сравнить с альтернативами и предложить план миграции при необходимости.

- Развернуть и обкатать Trino как единый слой запросов (federated SQL), настроить каталоги, безопасность, ресурсные группы.

- Оптимизировать ClickHouse: партиционирование, первичные/скученные ключи, TTL, материализованные представления, агрегирующие таблицы, компрессия.

- Спроектировать модель данных (слои raw staging marts), договориться о схемах именования, версионировании и SLA/SLI по данным.

- Настроить мониторинг и качество данных: алерты, проверки полноты/свежести, DQ тесты, техдолг-борд.

- Совместно с аналитиками и продуктом выпускать надёжные витрины/дашборды и отчёты.

Требования

- 3+ года опыта в Data Engineering или близких ролях.

- Сильный SQL: сложные запросы, оконные функции, оптимизация планов.

- Опыт продакшн эксплуатации ClickHouse: партиционирование, TTL, MV, агрегирующие таблицы, профайлинг запросов.

- Уверенный PostgreSQL: индексы, планировщик, репликация/бэкапы на уровне понимания, CDC как плюс.

- Реальная интеграция с живыми API: инкрементальные выгрузки, лимиты/квоты, ретраи, идемпотентность.

- Trino/Presto: базовая админка и тюнинг (или быстрый апскилл под менторством, если остальное закрываете сильно).

- Python для коннекторов/утилит и работы с API.

Будет плюсом

- dbt (моделирование и тесты), Airflow/Prefect/Orchest как оркестратор.

- Уверенное пользование linux, ssh, bash

- Kafka/Debezium/CDC подходы, очереди и событийная архитектура.

- Опыт с Bitrix24 API и/или CRM системами.

- Опыт выбора и миграции между Airbyte/Meltano/Fivetran/Hevo и т.п.

- Облака (Yandex Cloud/AWS/GCP), Terraform/Ansible, мониторинг (Prometheus/Grafana).

Формат работы и условия

- Формат работы - удаленный

- График: гибкий, синхронизации по договорённости.

- Конкурентная заработная плата

- Крутая команда

Почему это интересно

- Сильно повлияете на архитектуру данных: решения коротким путём, минимум бюрократии.

- Реальные, не книжные задачи: нестабильные источники, рост трафика, меняющиеся API.

- Можно и нужно спорить с Airbyte а если не выйдет, смело выбирать замену.

месяц назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Senior Data Engineer / Старший инженер данных

  • UZUM TECHNOLOGIES
  • Москва
... высокое качество данных Делать Data-продукты, которые влияют ... платформу Стек: PySpark, Airflow, Clickhouse, Trino, PostgreSQL, Kafka Connect, Debezium, ... работы на роли Data Engineer от 5 лет Уверенные ...
09.01.2026

Data Engineer в IT-компании

  • Прямой работодатель
  • Москва
Описание Data Engineer в аккредитованную IT-компанию, которая создаёт карту городов со справочником компаний, маршрутами общественного транспорта и навигатором. Компания рассматривает кандидатов ...
16.12.2025

Data Engineer

  • Velpharm Group (Велфарм Групп)
  • Москва
Описание Velpharm Group это ведущий игрок в фармацевтической индустрии, специализирующийся на разработке, производстве и дистрибуции лекарственных средств. Мы стремимся к инновациям и улучшению ...
19.12.2025