Анализ и оптимизация производительности ИИ вычислений на различных аппаратных платформах и ML фреймворках
Определение подходящих рабочих нагрузок и микро-тестов, которые будут использоваться для тестирования производительности
Отслеживание трендов в области ИИ алгоритмов и моделей, а также их аппробация на оборудовании компании
Эксперименты с различными техниками оптимизации моделей, такими как квантование, прорежевание, сжатие и т.д.
Диагностика и отладка сложных гетерогенных вычислительных систем и ПО
Взаимодействие с командами разработки софта и встроенного ПО для достижения поставленных целей производительности, эффективности и качества разрабатываемого ПО
Требования
5+ опыта программирования на C++ и Python
Глубокое понимание архитектуры компютера и специализированных ускорителей (GPU/TPU/NPU/...), низкоуровневых оптимизаций, иерархии памяти, планировщиков исполнения инструкций, компромиссов производительности и т.д.
Практический опыт работы с DL фреймворками (PyTorch, TensorFlow) и моделями (CNN, RNN, Transformers)
Общий опыт обучения и развертывания ML моделей
Знакомство с лучшими практиками разработки ПО, включая тестирование, профилирование, отладку, документирование, версионирование, отслеживание ошибок и планирование
Опыт разработки распределенных ИИ систем и параллельных программ является плюсом
Опыт разработки и развертывания LLM является плюсом