Команда RnD CV занимается исследованиями мультимодальных моделей в области компьютерного зрения. Мы стремимся довести результаты исследований до прикладного применения и сделать флагманскую модель GigaChat умнее, лучше и полезнее.
Обязанности
- Практический опыт в компьютерном зрении, включая обработку видео (распознавание, трекинг, анализ временных последовательностей)
- Работа с большими мультимодальными языковыми моделями, VLM (LLaVA, QwenVL, DeepSeekVL и т.д.)
- Обучение, валидация и имплементация новых state-of-the-art подходов для задач CV
- Работа с VLM в домене видео и омни-модальности
- Публикация результатов исследований в топовых научных конференциях
Требования
- Опыт дообучения моделей (Supervised Fine-Tuning)
- Публикации уровня А/А* и опыт написания статей (при желаниии)
- Призовые места в соревнованиях по машинному обучению (Kaggle, etc.)
Условия
- Достойная заработная плата + бонусы
- Удаленка или современный agile-офис по желанию
- ДМС, с первого рабочего дня, программы лояльности для сотрудников
- Бесплатный фитнес-зал, бесплатная парковка
- Локация: Москва (Сбер-Сити)