Департамент информационных технологий Москвы создает и развивает цифровые проекты, которые делают столицу комфортнее, а жизнь горожан — удобнее и мобильнее. Для системы управления столицей технологии — это незаменимый инструмент, который применяется во всех отраслях экономики, городского хозяйства и социальной сферы. А для миллионов горожан — повседневный помощник, который позволяет получать сотни услуг и сервисов в удобном цифровом формате в режиме 24/7.
Лаборатория ИИ — небольшая команда ДИТ г. Москвы, создающая пилотные решения на базе искусственного интеллекта для городских сервисов. Мы разрабатываем прототипы в областях компьютерного зрения и обработки естественного языка, быстро проверяя гипотезы и внедряя решения в реальных условиях мегаполиса.
В команду требуется Data Scientist уровня Middle, который специализируется на компьютерном зрении (CV) или обработке текста (NLP). Вы будете заниматься разработкой моделей для прототипов новых сервисов города.
Что нужно делать:
Если ваш фокус — компьютерное зрение:
- Разработка и обучение моделей для задач object detection, semantic segmentation, OCR, трекинга объектов;
- Работа с изображениями и видео: предобработка данных, аугментации, подготовка датасетов;
- Подбор и кастомизация архитектур (YOLO, Faster R-CNN, RetinaNet, UNet, ViT и др.);
- Оценка качества моделей (IoU, mAP и др.);
- Работа с инструментами аннотации данных (CVAT, Supervisely, Label Studio);
- Участие в создании пайплайнов инференса и оптимизации моделей для реального применения.
Если ваш фокус — обработка естественного языка:
- Разработка NLP-решений: классификация текстов, извлечение сущностей (NER), определение тональности, тематическое моделирование;
- Построение систем семантического поиска и сопоставления текстов;
- Обучение и дообучение моделей на базе трансформеров (BERT, RoBERTa, GPT и др.);
- Работа с пайплайнами подготовки текстовых данных;
- Настройка и оценка качества моделей (Precision, Recall, F1, BLEU и др.);
- Разработка прототипов чат-ботов и интеллектуальных агентов.
Наш технологический стек:
Язык программирования: Python
Computer Vision:
- PyTorch, Detectron2, MMDetection, YOLO (v5, v7, v8);
- OpenCV, Albumentations;
- torchvision, timm.
NLP:
- HuggingFace Transformers (BERT, RoBERTa, DistilBERT, GPT);
- spaCy, NLTK, Sentence Transformers.
Обработка данных: pandas, numpy, scikit-learn.
Инструменты аннотации: CVAT, Supervisely, Label Studio.
Инфраструктура и MLOps: MLflow, DVC, Docker, Git.
Рабочая среда: Linux, JupyterLab, VSCode.
Какие знания и навыки нам важны:
- Опыт в области Data Science от 2 лет в одной из областей: Computer Vision или NLP;
- Глубокие знания Python и библиотек для работы с данными и моделями;
- Умение подбирать и адаптировать архитектуры под задачи;
- Навыки подготовки данных для обучения и оценки моделей;
- Умение быстро разрабатывать прототипы и проверять гипотезы;
- Способность работать в маленькой, динамичной команде.
Будет плюсом:
- Опыт оптимизации моделей для продакшн-систем: квантизация, дистилляция, pruning;
- Навыки профилирования и ускорения инференса моделей (ONNX, TensorRT);
- Опыт в обработке видео (для CV) или генерации текстов (для NLP);
- Участие в соревнованиях Kaggle или аналогичных платформах;
- Навыки работы с большими вычислительными ресурсами (GPU, распределённое обучение).
Что предлагаем:
- Участие в создании реальных пилотных AI-решений для города Москвы;
- Возможность заниматься исключительно исследованиями и разработкой без "корпоративной рутины";
- Небольшая команда, прямая коммуникация и быстрая обратная связь;
- Оформление по ТК в аккредитованной ИТ компании;
- Годовое премирование по результатам работы;
- Возможность поработать с самыми разными технологиями и решениями, применять новое в работе;
- Участие в социально-полезных проектах;
- Адаптивная система обучения;
- Развитая корпоративная культура, мероприятия и приятные бонусы для сотрудников;
- Офис в бизнес-центре класса А (в пешей доступности от метро Курская);
- Корпоративное обучение и доступ к онлайн-библиотеке.