Мы в поиске Специалиста на проект по исследованию в области ИИ (оптимизация моделей глубокого обучения на edge-платформах).
Задача: участие в разработке техники сжатия моделей и квантования для повышения производительности AI-задач на устройствах с ограниченными ресурсами.
Исследовать и внедрять QAT/PTQ, эффективные алгоритмы инференса с фокусом на латентность, память и энергопотребление.
Работать с PyTorch, ONNX Runtime, TVM для развертывания моделей.
Сотрудничать с hardware-инженерами edge NPU.
Исследовать производительность и отслеживать тренды в AI efficiency и acceleration.
Знания и опыт в машинном обучении, оптимизации.
Опыт QAT/PTQ, mixed precision; Python/C++/CUDA/OpenCL; фреймворки (PyTorch/TensorFlow/ONNX/TVM/TensorRT).
Знание аппаратных ускорителей (SIMD/AVX/Tensor Cores) и компиляторных оптимизаций (XLA/MLIR/LLVM).
Умение общаться на английском обязательно.
RealTrac Technologies
Санкт-Петербург
от 250000 RUR
Новые Технологии Телекоммуникаций (ООО НПП НТТ)
Санкт-Петербург
от 200000 RUR
Санкт-Петербург
до 170000 RUR
Санкт-Петербург
до 300000 RUR