Вакансия Data Scientist в городе Москва

Описание вакансии

Департамент информационных технологий Москвы создает и развивает цифровые проекты, которые делают столицу комфортнее, а жизнь горожан — удобнее и мобильнее. Для системы управления столицей технологии — это незаменимый инструмент, который применяется во всех отраслях экономики, городского хозяйства и социальной сферы. А для миллионов горожан — повседневный помощник, который позволяет получать сотни услуг и сервисов в удобном цифровом формате в режиме 24/7.

Лаборатория ИИ — небольшая команда ДИТ г. Москвы, создающая пилотные решения на базе искусственного интеллекта для городских сервисов. Мы разрабатываем прототипы в областях компьютерного зрения и обработки естественного языка, быстро проверяя гипотезы и внедряя решения в реальных условиях мегаполиса.

В команду требуется Data Scientist уровня Middle, который специализируется на компьютерном зрении (CV) или обработке текста (NLP). Вы будете заниматься разработкой моделей для прототипов новых сервисов города.

Что нужно делать:

Если ваш фокус — компьютерное зрение:

Заниматься разработкой и обучением моделей для задач object detection, semantic segmentation, OCR, трекинга объектов
Работать с изображениями и видео: предобработка данных, аугментации, подготовка датасетов
Заниматься подбором и кастомизацией архитектур (YOLO, Faster R-CNN, RetinaNet, UNet, ViT и др.)
Оценивать качество моделей (IoU, mAP и др.)
Работать с инструментами аннотации данных (CVAT, Supervisely, Label Studio)
Принимать участие в создании пайплайнов инференса и оптимизации моделей для реального применения

Если ваш фокус — обработка естественного языка:

Заниматься разработкой NLP-решений: классификация текстов, извлечение сущностей (NER), определение тональности, тематическое моделирование
Заниматься построением систем семантического поиска и сопоставлением текстов
Заниматься обучением и дообучением моделей на базе трансформеров (BERT, RoBERTa, GPT и др.)
Работать с пайплайнами подготовки текстовых данных
Настраивать и заниматься оценкой качества моделей (Precision, Recall, F1, BLEU и др.)
Разрабатывать прототипы чат-ботов и интеллектуальных агентов

Наш технологический стек:

Язык программирования: Python

Computer Vision:

PyTorch, Detectron2, MMDetection, YOLO (v5, v7, v8)
OpenCV, Albumentations
torchvision, timm

NLP:

HuggingFace Transformers (BERT, RoBERTa, DistilBERT, GPT)
spaCy, NLTK, Sentence Transformers

Обработка данных: pandas, numpy, scikit-learn

Инструменты аннотации: CVAT, Supervisely, Label Studio

Инфраструктура и MLOps: MLflow, DVC, Docker, Git

Рабочая среда: Linux, JupyterLab, VSCode

Какие знания и навыки нам важны:

Опыт в области Data Science от 2 лет в одной из областей: Computer Vision или NLP
Глубокие знания Python и библиотек для работы с данными и моделями
Умение подбирать и адаптировать архитектуры под задачи
Навыки подготовки данных для обучения и оценки моделей
Умение быстро разрабатывать прототипы и проверять гипотезы
Способность работать в маленькой, динамичной команде

Будет плюсом:

Опыт оптимизации моделей для продакшн-систем: квантизация, дистилляция, pruning
Навыки профилирования и ускорения инференса моделей (ONNX, TensorRT)
Опыт в обработке видео (для CV) или генерации текстов (для NLP)
Участие в соревнованиях Kaggle или аналогичных платформах
Навыки работы с большими вычислительными ресурсами (GPU, распределённое обучение)

Что предлагаем:

Участие в создании реальных пилотных AI-решений для города Москвы
Возможность заниматься исключительно исследованиями и разработкой без "корпоративной рутины"
Небольшая команда, прямая коммуникация и быстрая обратная связь
Оформление по ТК в аккредитованной IT-компании
Годовое премирование по результатам работы
Возможность поработать с самыми разными технологиями и решениями, применять новое в работе
Участие в социально-полезных проектах
Адаптивная система обучения
Развитая корпоративная культура, мероприятия и приятные бонусы для сотрудников
Офис в бизнес-центре класса А (в пешей доступности от метро Курская)
Корпоративное обучение и доступ к онлайн-библиотеке

Навыки

Python
NLP
CV
PyTorch
OpenCV
NLTK
Linux
VSCode
JupyterLab

Посмотреть контакты работодателя

Адрес

Зарплата
Не указана
Занятость
Полная занятость, Полный день
Опыт работы
От 1 года до 3 лет
Дата размещения:
14.08.2025 09:11:49

Data Scientist

Data Scientist

Описание вакансии

Навыки

Адрес

Краткое описание вакансии

Зарплата

Занятость

Опыт работы

Дата размещения:

Похожие вакансии

Хотите оставить вакансию?