Локация

Работа и вакансии "ов" в Москве (1 вакансия)

Сортировать:

Technical Lead CUDA/Triton Kernel Development for LLM Acceleration

  • СБЕР
  • Москва
... LLM тесно взаимодействовать с ML-инженерами и research-командами для понимания workload ов и bottleneck ов (например: multinode inference, sparse attention, mixture-of-experts, long-context inference ...
11.01.2026