Ведущий Data Engineer

VK

Ведущий Data Engineer

Описание вакансии

Наш продукт, VK Data Platform, — универсальная платформа для end‑to‑end работы с большими объёмами данных и машинным обучением. В его основе лежат собственные разработки и лучшие практики работы с данными, проверенные на масштабных проектах с многомиллионной аудиторией.

Мы создаём VK Data Platform как инструмент, который поможет решить инфраструктурные задачи:

  • Сократить совокупную стоимость хранения и обработки данных
  • Эффективно утилизировать аппаратное обеспечение
  • Повысить качество и достоверность данных
  • Централизовать инструменты управления инфраструктурой данных
  • Унифицировать технологический стек компании и упростить поддержку и обновление программного обеспечения
  • И направить усилия Data Office на поиск инсайтов и решение бизнес-задач

У нас многослойная команда: аналитики, DevOps, проектное управление и всё-всё от пресейла до поддержки.

Задачи

  • Разрабатывать и сопровождать ETL-пайплайны и типовые интеграционные решений в data platform
  • Проектировать, реализовывать и оптимизировать сложные ETL-процессы (в том числе разработки DAG для автоматизации)
  • Реализовывать обработку потоковых данных
  • Разрабатывать решения с различными системами хранения и системами распределённых SQL-движков
  • Внедрять подходы и процессы управления данными
  • Участвовать в подготовке пилотов и внедрении VK DataPlatform

Требования

Опыт в обработке данных:

  • Работа в NiFi/AirFlow
  • Проектирование пайплайнов обработки данных
  • Проектирование пайплайнов с проверкой качества данных
  • Опыт и понимание работы с Spark
  • Программирование на Java/Scala/Python
  • Работа с Kafka/RabbitMQ

Опыт в организации хранения данных:

  • PostgreSQL, ClickHouse — от трёх лет
  • S3/Hadoop
  • Построение дата-архитектуры (DWH,OLAP,ELT/ETL/Data Lake/LakeHouse)
  • Знание SQL
  • Работы с NoSQL базами данных
  • Опыт и понимание работы распределённых SQL-движков trino/dbt

Управление данными:

  • Понимание приципов Data Governance
  • Опыт работы с Data Catalog OpenMetadata/DataHub/Atlas

Будет плюсом

  • Знание DataOps-практик
  • Опыт работы с оркестрацией в Kubernetes, BI-инструментами, Data Mesh / Data Fabric
  • Понимание интеграции ML-моделей в ETL-процессы
Навыки
  • PostgreSQL
  • Clickhouse
  • Hadoop
  • S3
  • DWH
  • OLAP
  • ETL
  • ELT
  • SQL
  • NoSQL
  • trino
  • dbt
  • Data Governance
  • Data Catalog
  • OpenMetadata
  • DataHub
  • Atlas
  • DataOps
  • Kubernetes
  • BI
  • Data Mesh
  • Data Fabric
  • ML
Посмотреть контакты работодателя

Похожие вакансии

Oil and Gas Production Tools

Data Engineer

Oil and Gas Production Tools

Удаленная работа
  • Санкт-Петербург

  • Не указана

Рекомендуем

Data Analyst (SQL, Python, OLAP, Airflow)

Цивин Борис Львович

Удаленная работа
  • Санкт-Петербург

  • Не указана

Рекомендуем
Линсофтверпродакшн

Senior cистемный архитектор

Линсофтверпродакшн

Удаленная работа
  • Санкт-Петербург

  • до 500000 RUR

Рекомендуем
Инситех
Удаленная работа
  • Санкт-Петербург

  • до 500000 RUR

ЭДГОУ

Middle Data Analyst

ЭДГОУ

Удаленная работа
  • Санкт-Петербург

  • до 200000 RUR

Сервер Молл

Lead Cloud (Openstack) Engineer

Сервер Молл

Удаленная работа
  • Санкт-Петербург

  • до 200000 RUR

2ГИС
Удаленная работа
  • Санкт-Петербург

  • до 200000 RUR

Арго Медиа
Удаленная работа
  • Санкт-Петербург

  • от 300000 RUR

Enjoypro
Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

Датаджайл
Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

Novakid Inc
Удаленная работа
  • Санкт-Петербург

  • от 4500 USD

Decart IT-production

DevOps инженер

Decart IT-production

Удаленная работа
  • Санкт-Петербург

  • от 4500 USD

VK
Удаленная работа
  • Санкт-Петербург

  • от 4500 USD

Доксинбокс

Team lead developer (Java)

Доксинбокс

Удаленная работа
  • Санкт-Петербург

  • от 4500 USD

Just AI
Удаленная работа
  • Санкт-Петербург

  • от 4500 USD

V4Scale
Удаленная работа
  • Санкт-Петербург

  • от 4000 USD

Lenvendo
Удаленная работа
  • Санкт-Петербург

  • от 4000 USD

Бизнес Технологии

Senior fullstack java developer

Бизнес Технологии

Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

SEOWORK
Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

Газпром нефть

Data Engineer (Senior)

Газпром нефть

Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию