Data Engineer (направление качества пунктов выдачи)

Ozon

Data Engineer (направление качества пунктов выдачи)

Москва, Московский международный деловой центр Москва-Сити, многофункциональный комплекс Башня на Набережной

Метро: Деловой центр

Описание вакансии

В подгруппу инфраструктуры данных требуется инженер данных для выполнения задач по изменению и развитию инфраструктуры данных в соответствии с общими изменениями в компании, включая переход на собственную схему хранения данных.

Вам предстоит:

Построение и поддержка ETL/пайплайнов:

Разработка, оптимизация и мониторинг для гарантированной доставки данных.

Развитие сервисной модели для аналитиков:

Предоставление качественных, документированных и актуальных данных через витрины и инструменты автоматизации, сокращая время на рутинные запросы.

Повышение надежности и прозрачности:

Помощь во внедрении единых стандартов на тестирование, мониторинг и алертинг для всех data-процессов.

Технологический стек проекта:

Оркестрация: Apache Airflow. Обработка данных: SQL, Python (Pandas), Apache Spark (PySpark).

Аналитические СУБД: ClickHouse, Vertica, Trino

Инфраструктура и инструменты: Git, Docker, Hadoop (HDFS, Hive), Kafka. Язык программирования: Python (Pandas, requests, асинхронное программирование).

Мы ожидаем:

Знание SQL (CTE, оконные функции, оптимизация запросов).

Базовые навыки профилирования и оптимизации SQL-запросов (чтение explain plan, понимание индексов).

Понимание принципов построения ETL/ELT-пайплайнов и опыт работы с Apache Airflow.

Базовые знания Python для целей обработки данных (Pandas, PySpark). Опыт работы с Git.

Понимание концепций распределенных систем и работы с большими данными (архитектура Spark, Kafka, Hadoop).

Будет преимуществом:

Практический опыт работы с Apache Kafka. Знание специфики ClickHouse (движки таблиц, особенности кластерной работы).

Опыт работы с Vertica/Trino. Навыки работы с Docker и оркестраторами (Rancher/Kubernetes).

Понимание принципов работы gRPC.

Привычка к ведению документации, понимание принципов Data Catalog (что такое глоссарий, метаданные, lineage).

Навыки
  • Clickhouse
  • Vertica
  • ETL
  • Python
  • Ozon офис и коммерция
Посмотреть контакты работодателя

Адрес

Похожие вакансии

АНО ЦИСМ

Data Engineer

АНО ЦИСМ

  • Москва

  • Не указана

Рекомендуем
Вкусно — и точка

Data Engineer

Вкусно — и точка

  • Москва

  • Не указана

Рекомендуем
ARK
  • Москва

  • Не указана

Рекомендуем
Rostic’s (Интернэшнл Ресторант Брэндс)

Senior Data-инженер

Rostic’s (Интернэшнл Ресторант Брэндс)

  • Москва

  • Не указана

ЭКОПСИ Консалтинг

Junior Data Engineer

ЭКОПСИ Консалтинг

  • Москва

  • Не указана

Mediascope
  • Москва

  • Не указана

EcoFinance
  • Москва

  • до 300000 RUR

Тера Интегро

Data engineer (DBT)

Тера Интегро

  • Москва

  • до 300000 RUR

Стрит Фалькон

Data-аналитик

Стрит Фалькон

  • Москва

  • до 300000 RUR

Тера Интегро

Hadoop-инженер

Тера Интегро

  • Москва

  • до 300000 RUR

Цифровой аудит

Lead Data Engineer

Цифровой аудит

  • Москва

  • до 300000 RUR

УК Комфорт
  • Москва

  • до 250000 RUR

Navio
  • Москва

  • до 250000 RUR

ТрансЛом

DevOps-инженер

ТрансЛом

  • Москва

  • до 250000 RUR

BND LLC
  • Москва

  • до 100000 RUR

ТехВилл

DevOps-инженер

ТехВилл

  • Москва

  • до 100000 RUR

Лаборатория Касперского

Аналитик данных / Data Analyst

Лаборатория Касперского

  • Москва

  • до 100000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию