Проект - Антифрод, формат работы - офис на время ИС
Чем предстоит заниматься:
- Формализация и декомпозиция исследовательских задач
- Cбор данных (структурированных и неструктурированных) из различных систем
- Подготовка датасетов для ML-задач
- Разработка предиктивных признкаов (feature engineering)
- Разработка ML-моделей и подбор гиперпараметров (классические ML-алгоритмы, бустинг, нейронные сети)
- Оценка качества ML-моделей, выбор адекватных задаче метрик
- Поддержка и сопровождение разработанных ML-моделей
- Участие в автоматизации поставки данных для моделей
Что для этого нужно:
- Опыт работы с БД Oracle (SQL диалект, аналитические функции, триггеры, PL\SQL, hint-ы, оптимизация запросов) или PostgreS, Clickhouse
- Желание понимать и работать с данными: видеть за ними физический смысл, понимать назначение источников и их характеристики, сопоставлять данные, уметь делать обоснованные выводы
- Уверенное владение Python и основными библиотеками анализа данных и ML
- Опыт проведения аналитических исследований, формирования и проверки гипотез
- Навыки разработки в VSCode, PyCharm, Jupyter Notebook
Будет плюсом:
- Опыт работы с BI платформами (Splunk)
- Опыт текстовой аналитики (NLP, NER в Pytorch)
- Опыт анализа звука/голоса
- Знаете основы Apache Spark, Hadoop, Airflow