Локация

Разработчик на С++ в группу разработки YQL over YT

Яндекс
Москва Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

YTsaurus одна из ключевых инфраструктурных систем Яндекса, которая используется для хранения и обработки данных.

Яндекс работает с эксабайтами данных, которые нужно эффективно хранить, обрабатывать и передавать между приложения ми. Для этого мы создали YTsaurus распределённую платформу, которая сочетает в себе единое хранилище и ряд инструментов для обработки данных под разные сценарии. Почти каждый сервис в Яндексе использует нашу платформу для решения своих задач. Платформа активно развивается, а исходный код выложен в опенсорс.

Внутри YTsaurus есть поддержка целого ряда SQL-диалектов, которые позволяют обращаться к данным. Один из таких диалектов YQL. Он преобразует SQL-запросы в последовательность MapReduce-операций и/или выполняет их в движке DQ, который и предстоит развивать.

Движок DQ, в отличие от MapReduce, позволяет выполнять части запроса полностью в памяти без промежуточной материализации на диск. Это существенно сокращает накладные расходы и время, затрачиваемое на выполнение всего запроса.

Какие задачи вас ждут

Развитие гибридного режима выполнения запросов
Во время выполнения запроса объём данных часто уменьшается на каждом этапе из-за фильтрации, пересечений и агрегаций. На определённом этапе использование MapReduce может стать избыточным. В таких случаях выгодно переключиться на выполнение оставшихся операций в движке DQ.

Пользовательский кластер DQ
Пользовательская нагрузка может быть настолько разнообразной, что сложно подобрать универсальные параметры для работы движка. Мы хотим реализовать возможность настройки пользовательского кластера DQ под конкретные сценарии и профили нагрузки.

Ускорение YQL over YT по бенчмаркам
YQL over YT в Яндексе работает на десятках тысяч машин и сотнях тысяч ядер. Нам важно постоянно искать точки для оптимизации исполнения запросов. Мы используем популярные бенчмарки для выявления возможностей улучшения производительности.

Публикации и вклад в продукт
Ваши результаты могут стать основой для публикаций, докладов и выступлений на крупных конференциях, а коммиты будут попадать в общую кодовую базу YTsaurus.

Мы ждем, что вы

  • Уверенно владеете C++ и готовы разрабатывать на нём высокопроизводительные системы
  • Понимаете, как анализировать производительность, находить узкие места, и готовы предлагать способы решения проблем
  • Знаете Python на уровне, достаточном для написания тестов

Будет плюсом, если вы

  • Имеете представление, как устроены СУБД, и участвовали в их разработке
  • Знаете один из диалектов SQL
8 дней назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Разработчик на С++ в команду распределённой системной инфраструктуры YDB

  • Яндекс
  • Москва
Описание YDB это распределённая отказоустойчивая реляционная БД с открытым исходным кодом. Вместе со стеком serverless-технологий YDB позволяет организовать систему хранения и обработки данных для ...
25.12.2025

Бизнес-аналитик в Группу разработки и развития ПО (РКО, AML)

  • Пихта Банк
  • Москва
Описание Обязанности: Анализ, формализация и оптимизация бизнес-процессов в области РКО (открытие/закрытие счетов, платежные поручения, валютный контроль, cash management) и AML; Разработка и ...
23.12.2025

Ведущий разработчик информационных систем, Группа разработки хранилища логов

  • Ozon
  • Москва
Описание Привет! Это команда разработки хранилища логов, занимаемся разработкой seq-db - базы данных, отвечающей за хранение и обработку большинства логов и трейсов в Озоне. Суммарно храним > 1Пб ...
20.12.2025