Data Engineer (Middle/Senior)

Генотек

Data Engineer (Middle/Senior)

Москва, Наставнический переулок, 17с1

Метро: Чкаловская

Описание вакансии

Привет! Мы — Genotek, молодая и современная medtech компания. Работаем с технологиями будущего: проводим исследования, которые помогают людям узнать всё про свои гены, происхождение и особенности здоровья.

Сейчас мы находимся в поиске опытного инженера данных, который возьмет на себя разработку и внедрение масштабируемой системы обработки событий (event processing pipeline). Вам предстоит построить отказоустойчивую платформу для сбора, трансформации и анализа данных.

Чем предстоит заниматься:

  • Мониторинг, оптимизация и масштабирование баз данных (MySQL, ClickHouse): анализ медленных запросов, настройка индексов, планирование и реализация партиционирования и шардинга.

  • Полный цикл разработки витрин данных: от проектирования и рефакторинга существующих до создания новых. Очистка сырых данных, дедубликация, оптимизация ETL-процессов.

  • Интеграция данных из внешних источников (Яндекс.Метрика, Roistat и др.) через API: обеспечение отказоустойчивости, обработка ошибок, retry-логика, валидация и обеспечение качества и полноты данных.

  • Разработка, поддержка и оптимизация сложных данных пайплайнов в Apache Airflow (создание новых DAG).

  • Подготовка и поддержание актуальной технической документации: схемы данных, дата-словари, описание витрин и ETL-процессов.

  • Участие в процессе разработки: code review, работа по Git Flow, внедрение и соблюдение стандартов кодирования.

Что мы ожидаем от вас:
  • Опыт коммерческой разработки в роли Data Engineer от 3-х лет (для Middle) и от 5-ти лет (для Senior).

  • Продвинутый SQL: глубокое понимание и большой опыт написания и оптимизации сложных запросов.

  • Опыт работы с СУБД:

    • MySQL: знания по оптимизации производительности (индексы, анализ execution plan).

    • ClickHouse: понимание специфики column-oriented БД

  • Сильный Python для ETL: опыт написания надежного и эффективного кода для данных пайплайнов (библиотеки: pandas, SQLAlchemy, requests и т.д.).

  • Глубокое знание Apache Airflow: опыт создания сложных, отказоустойчивых и идемпотентных DAG, использование сенсоров, хуков, XCom.

  • Опыт построения и поддержки DWH/витрин данных: понимание принципов dimensional modeling (звезда, снежинка), типов таблиц (факты, измерения).

  • Навыки работы с API: опыт интеграции с различными REST API (пагинация, ограничения, обработка ошибок, retry-механизмы).

  • Приверженность best practices: уверенная работа с Git (Git Flow), обязательный опыт проведения code review, понимание принципов CI/CD.

Будет плюсом:
  • Опыт построения инфраструктуры данных с нуля (greenfield project).

  • Знание концепций и инструментов обеспечения Data Quality (валидация, мониторинг аномалий).

  • Опыт работы с контейнеризацией (Docker) и оркестрацией (Kubernetes).

  • Базовое понимание WEB-технологий (React/Angular) на уровне, достаточном для взаимодействия с фронтенд-разработчиками.

  • Знание облачных платформ (Yandex Cloud, AWS) и их сервисов для данных.

Что мы предлагаем:

  • Оформление по ТК РФ и его полное соблюдение (оплачиваемые отпуска, больничные), бонусы работы в аккредитованной IT-компании;

  • Формат работы: удалённый, но при желании можно ходить в офис в Москве или в Питере (в Питере можно ходить в офис в ИТМО или на Пионерской)

  • ДМС, занятия английским в Skyeng, психологические консультации от сервиса Youtalk и Генетический паспорт Genotek для всех сотрудников;

  • Дружную команду и уважительное отношение к инициативе

Посмотреть контакты работодателя

Адрес

Похожие вакансии

Делимобиль

Data Engineer (middle, senior)

Делимобиль

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Napoleon IT
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
HeadHunter

Data engineer

HeadHunter

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
SSP SOFT

Data Engineer

SSP SOFT

Удаленная работа
  • Москва

  • Не указана

Skillbox

Data Engineer

Skillbox

Удаленная работа
  • Москва

  • Не указана

Удаленная работа
  • Москва

  • Не указана

Платформа

Data Engineer

Платформа

Удаленная работа
  • Москва

  • Не указана

Детский мир
Удаленная работа
  • Москва

  • Не указана

Beresnev Games

Senior Data Engineer

Beresnev Games

Удаленная работа
  • Москва

  • Не указана

2ГИС
Удаленная работа
  • Москва

  • Не указана

S8 Capital
Удаленная работа
  • Москва

  • Не указана

S8 Capital
Удаленная работа
  • Москва

  • Не указана

Альфа-Банк

Data Engineer

Альфа-Банк

Удаленная работа
  • Москва

  • Не указана

Фогейм

Data Engineer

Фогейм

Удаленная работа
  • Москва

  • Не указана

билайн
Удаленная работа
  • Москва

  • Не указана

WILDBERRIES
Удаленная работа
  • Москва

  • Не указана

А101
Удаленная работа
  • Москва

  • Не указана

Онлайн-школа Тетрика

Data Engineer

Онлайн-школа Тетрика

Удаленная работа
  • Москва

  • Не указана

Ок Софт
Удаленная работа
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию