В команду SOC (центр мониторинга и реагирования на инциденты) требуется аналитик данных. От Вас не требуется знания информационной безопасности, работа будет в классическом виде для аналитика данных. Однако такие знания сможем дать мы!
Что будет делать сотрудник:
- Разрабатывать ML-модели для обнаружения аномалий в транзакциях и пользовательской активности на основе нормализованных данных;
- Проводить классификацию и кластеризацию данных для выявления подозрительных паттернов (например, мошеннические кластеры);
- Настраивать простые ETL-пайплайны для сбора и трансформации данных;
- Оркестрировать задачи обработки данных через Airflow, обеспечивая надежность процессов;
- Визуализировать метрики и результаты анализа в Superset/Tableau/Grafana;
- Оптимизировать запросы в PostgreSQL, ClickHouse и Elasticsearch. (по возможности избегать дорогостоящих\высоконагруженных запросов);
- Участвовать в сборе прототипов витрин данных;
- Документировать разработанные решения;
Примеры задач:
- Построить модель обнаружения аномальных транзакций;
- Провести кластеризацию пользователей для выявления групп с подозрительным поведением;
- Настроить дашборды в Superset для мониторинга аномалий и метрик эффективности моделей;
- Создать Airflow DAG для переобучения моделей;
- Оптимизировать сложные SQL-запросы в ClickHouse для ускорения анализа больших объемов данных.
Ожидания от кандидата
Технические навыки:
- Опыт работы с Python (Pandas, Scikit-learn, PySpark, Numpy) для анализа данных и ML;
- Уверенное знание SQL (оконные функции, оптимизация) и опыт работы с PostgreSQL и ClickHouse;
- Навыки настройки Airflow для оркестрации ETL/ML-пайплайнов;
- Понимание потоковой обработки данных и работы с Elasticsearch\Clickhouse (поиск паттернов в логах);
- Опыт визуализации данных в Superset/Tableau и Grafana;
- Знание ClickHouse (оптимизация запросов, материализованные представления).
Предметные знания:
- Методы обнаружения аномалий (isolation forest, autoencoders) и кластеризации (DBSCAN, HDBSCAN);
- Базовое понимание архитектуры данных (хранилища, конвейеры, мониторинг).
Soft skills:
- Аналитическое мышление: умение интерпретировать сложные данные и предлагать решения;
- Проактивность: инициативность в улучшении процессов и моделей;
- Командная работа: взаимодействие с Data Engineers и аналитиками.
Будет преимуществом(опциональные навыки):
- Опыт работы с графовыми данными (выявление связанных сущностей);
- Знание Docker для контейнеризации задач;
- Настройка алертинга в Grafana/Kibana на основе данных из ClickHouse/Elasticsearch;
- Опыт в LLM, RAG, Agents.
Что предлагаем:
- Удалённо или офис Москва/СПБ (на выбор кандидата);
- Трудовой договор, график 5/2;
- Имеется юр.лицо с ИТ аккредитацией;
- ДМС, скидки от партнёров и бонусы в наших внутренних сервисах;
- Материальная помощь сотрудникам в трудных жизненных ситуациях;
- Зарплатный проект с возможностью экономить в отпусках.