VizorLabs – один из ведущих российских поставщиков систем видеоаналитики для промышленного применения.
Мы ищем специалиста, который будет заниматься исследованием, прототипированием и валидацией ML-моделей для решения бизнес-задач клиентов. Работа напрямую с клиентами и командой Data Engineering для подготовки данных и создания готового рабочего прототипа модели, который затем передается MLE-команде для индустриализации.
Ключевые Обязанности:
- Клиентская работа и анализ требований
- Проведение глубоких интервью с клиентами для выявления и формализации их бизнес-проблем.
- Перевод бизнес-задач на язык конкретных ML-постановок (классификация, регрессия, детекция аномалий и т.д.).
- Формирование гипотез и предложений по их решению с помощью данных и ML.
- Подготовка и презентация результатов анализа и прототипов моделей для технических и нетехнических аудиторий.
Исследовательская работа и прототипирование:
- Проведение полного цикла исследовательского анализа данных (EDA).
- Разработка, обучение и валидация прототипов машинного обучения и глубокого обучения (в основном в средах типа Jupyter Notebook +Docker).
- Подбор и тонкая настройка алгоритмов и их гипер параметров для достижения максимального качества на валидационных выборках.
- Анализ ошибок модели, интерпретация ее решений.
Работа с данными и разметка:
- Тесное взаимодействие с Data Engineering по формированию и доставке сырых данных.
- Составление ТЗ и управление процессом разметки данных (работа с менеджерами по разметке, аутсорсом или краудсорсинговыми платформами).
- Контроль качества размеченных данных, их очистка.
Документирование и передача:
- Создание исчерпывающей технической документации на прототип: использованные данные, фичи, алгоритмы, метрики качества, ограничения модели.
- Передача обученных моделей, кода и документации команде MLE для последующего внедрения.
- Консультация MLE-команды по вопросам, связанным с логикой работы модели.
Ожидаем от кандидатов:
- Опыт работы на позиции Data Scientist от 2-х лет.
- Знание Python и основных библиотек для анализа и ML: Pandas, NumPy, Scikit-learn, Matplotlib/Seaborn.
- Понимание принципов оценки качества моделей (кросс-валидация, выбор метрик: AUC-ROC, F1, Precision, Recall, MAPE и т.д.).
- Опыт работы с Jupyter Notebook/Lab
- Опыт работы с Docker на уровне запуска контейнеров.
- Опыт работы с глубоким обучением (CNN, RNN, Transformers) и фреймворками: TensorFlow или PyTorch (именно на уровне создания и обучения прототипов, а не продакшн-развертывания).
- Опыт работы с компьютерным зрением (CV)
- Мониторинг качества работы системы и обученной модели.
- Участие в создании документации компонентов системы и процессов видеоаналитики.
Будет преимуществом:
- Опыт работы с инструментами для управления экспериментов (MLflow, Weights & Biases, ClearML).
- Опыт fine-tuning MLLM (multimodal large language models) и разработка решений на основе Retrieval-Augmented Generation (RAG).
- Умение разрабатывать структурированные и ёмкие презентации для наглядной коммуникации сложных идей.
- умение работать с командной строкой (Linux)Предлагаем:
Предлагаем:
- Работа в аккредитованной ИТ компании, входящей в топ-100 ИТ-компаний России;
- Программы обучения сотрудников, возможности для повышения квалификации и сертификации;
- ДМС;
- Корпоративная мобильная связь;
- Офис ст. метро Бауманская/Электрозаводская