Сортировать:
- по релевантности
- по дате
- по зарплате
Technical Lead CUDA/Triton Kernel Development for LLM Acceleration
... LLM тесно взаимодействовать с ML-инженерами и research-командами для понимания workload ов и bottleneck ов (например: multinode inference, sparse attention, mixture-of-experts, long-context inference ...
11.01.2026