OGPT — технологическая it-компания, ориентированная на создание и внедрение передовых решений в области искусственного интеллекта и физико-математического моделирования в производственные процессы нефтегазодобычи. Мы разрабатываем уникальные продукты, которые помогают бизнесу значительно повышать свою эффективность, улучшать принятие решений и автоматизировать процессы. Наши технологии уже сегодня позволяют компаниям достигать выдающихся результатов, используя возможности искусственного интеллекта.
В OGPT мы стремимся создавать инновационную среду, где каждый сотрудник может раскрыть свой потенциал, применяя свои знания и навыки для решения реальных и амбициозных задач. Мы ищем людей, которые готовы не только работать, но и развиваться вместе с нами, внося свой вклад в создание высококачественных продуктов, которые меняют будущее.
Если вы хотите работать в динамичной и поддерживающей команде, где ценится креативность, экспертиза и стремление к совершенству, OGPT — это место для вас. Мы уверены, что только вместе, с лучшими специалистами, можно достигать высоких целей и воплощать инновации в жизнь.
И сейчас мы ищем Data Engineer для направления разработки систем, направленных на моделирование и оптимизацию процессов добычи нефти и газа.
Обязанности:
- автоматизация процесса инжеста больших объемов данных с физических носителей (HDD) в Data Lake (MinIO). Включая валидацию, каталогизацию, обработку ошибок;
- разработка пайплайнов для обработки сырых данных (включая обработку данных временных рядов) и загрузки структурированных/агрегированных данных в аналитические СУБД (ClickHouse, PostgreSQL);
- администрирование, оптимизация, масштабирование и мониторинг объектного хранилища MinIO S3 (с учетом роста);
- управление жизненным циклом данных.
- проектирование схем данных, партиционирование, индексация, оптимизация запросов в ClickHouse и PostgreSQL для обеспечения высокой производительности при работе с большими объемами данных;
- обеспечение резервного копирования, восстановления и мониторинга состояния БД.
- обеспечение своевременной доступности подготовленных данных для нескольких команд аналитиков (Python, MATLAB).
- активное участие в проектировании и реализации механизмов симуляции/воспроизведения потоков телеметрии для среды разработки и тестирования аналитиков.
- тесная работа с командами аналитиков для понимания их требований к данным и форматам;
- взаимодействие с DevOps по вопросам инфраструктуры для данных-пайплайнов и хранилищ;
- сотрудничество с Backend/Edge разработчиками по вопросам интеграции данных.
- автоматизация рутинных задач по управлению данными.
Требования:
Будет плюсом:
Python, SQL, ClickHouse, MongoDB ,PostgreSQL, MinIO (S3), Linux, Airflow/Prefect/Dagster (или аналоги), Docker, GitLab CI, Bash, MATLAB.
Условия:
Яндекс
Санкт-Петербург
до 440000 RUR
Санкт-Петербург
от 200000 RUR
RoadAR
Санкт-Петербург
от 200000 RUR
Санкт-Петербург
от 120000 RUR
Первый Бит
Санкт-Петербург
от 260000 RUR