Глубокое понимание теоретических основ машинного обучения, математической статистики и методов оптимизации.
Свободное владение Python и основными библиотеками для data science: * ML-фреймворки: Scikit-Learn, XGBoost/LightGBM/CatBoost * Глубокое обучение: PyTorch и/или TensorFlow * Обработка данных: Pandas, NumPy, Polars
Опыт работы с большими данными (BigData): * Обработка: Apache Spark (PySpark), Hadoop (HDFS) * Аналитические СУБД: ClickHouse, или аналоги (Vertica, Greenplum)
Опыт построения и поддержки ML-пайплайнов с использованием оркестраторов: Airflow, Dagster, Prefect или аналоги.
Понимание принципов контейнеризации и оркестрации (Docker, Kubernetes).
Опыт работы с инструментами для визуализации данных: Tableau, Power BI, Yandex DataLens или аналоги.
Экспертиза в области Machine Learning & AI.
Практический опыт реализации проектов в ключевых domains: * Классическое ML (регрессия, классификация, кластеризация) * Обработка естественного языка (NLP) * Компьютерное зрение (Computer Vision)
Понимание архитектурных принципов построения современных GenAI-решений, включая работу с LLM (Large Language Models) и паттернами RAG (Retrieval-Augmented Generation).
Опыт работы с геологическими, геофизическими данными или данными дистанционного зондирования Земли (ДЗЗ).
Знание открытых и корпоративных источников и баз геологических данных является значительным преимуществом.
Наличие успешного опыта внедрения корпоративных AI/ML-решений «под ключ» в нефтегазовой, геологоразведочной или смежных областях.
Опыт работы с облачными платформами (Yandex Cloud, AWS, GCP, Azure) и их ML-сервисами.
Умение доносить сложные технические концепции до нетехнических специалистов.
Обязанности:
Разработка, обучение, тестирование и производственная оптимизация моделей машинного обучения для анализа геолого-геофизических данных.
Создание и внедрение end-to-end ML-сервисов и пайплайнов обработки данных.
Полный цикл разработки AI/ML-решений: от исследования и прототипирования до внедрения в production и мониторинга.
Разработка и поддержка ML-инфраструктуры и платформенных решений для геологического отдела.
Глубокий анализ больших объемов данных, написание и поддержка эффективных скриптов на Python и SQL.
Исследование и экспериментирование с новыми подходами и техниками в области искусственного интеллекта для решения бизнес-задач.
Условия:
Удаленная работа (Remote) с периодическим посещением головного офиса (для ключевых встреч, планирования и интеграции с командой). Офис в г. Москва (Новый Арбат).
Официальное трудоустройство на бессрочный трудовой договор (испытательный срок до 3 месяцев).
ДМС (в т.ч., для несовершеннолетних детей) после прохождения испытательного срока.