Data-инженер (ClickHouse)

LIAN

Data-инженер (ClickHouse)

Описание вакансии

LIAN — системный интегратор с фокусом в аналитике и управлении данными.

Мы работаем в трех направлениях:

1. Автоматизация управленческой отчетности (BI) в малом и среднем бизнесе. Строим хранилища данных, настраиваем сбор и интеграцию, разрабатываем отчеты и дэшборды. Наш стек в BI включает все современные инструменты, в том числе open-source ПО.

2. Заказная разработка аналитических систем. Когда у нашего клиента есть специфичный запрос, мы разрабатываем аналитические системы с нуля. Часто применяем подходы BigData, Data Science, актуальные подходы к программному анализу данных и прогнозированию.

3. Запуск и ресурсное обеспечение команд разработки в комплексных проектах цифровой трансформации. Мы усиливаем команды наших партнеров и клиентов собственными сотрудниками и обеспечиваем максимально быстрый старт новых проектов. Среди наших заказчиков - крупные системные интеграторы, банки, нефтегазовые, химические производства, логистические компании, стартапы.

Мы ищем инженера, который станет владельцем аналитической инфраструктуры на базе ClickHouse.

Обязанности:
1. Проектирование и разработка витрин данных
  • Трансформация сырых данных (бинлоги, события, транзакции) в оптимизированные витрины для BI и ad-hoc аналитики.

  • Выбор модели данных (звезда, снежинка, плоские таблицы) в зависимости от бизнес-задач.

  • Проектирование таблиц под MergeTree:

    • корректный выбор ORDER BY и PRIMARY KEY;

    • партиционирование (PARTITION BY);

    • настройка TTL;

    • использование Skip Indexes;

    • работа с материализованными представлениями.

  • Оптимизация запросов и структуры хранения данных.
    2. Контроль качества данных

  • Разработка автоматических проверок и тестов для витрин (контрольные суммы, сверка с эталоном, поиск «дыр» в данных).

  • Построение мониторинга качества данных и SLA.

  • Анализ и устранение медленных запросов.

  • Работа с EXPLAIN, system.tables, system.query_log.
    3. Обучение и стандартизация

  • Разработка внутренних гайдлайнов по работе с ClickHouse.

  • Проведение код-ревью SQL-запросов и логики трансформаций.

  • Проведение внутренних митапов и консультаций для аналитиков.

  • Формирование культуры эффективной работы с данными.
    4. Администрирование и эксплуатация

  • Настройка конфигурации серверов (память, потоки, max_memory_usage и др.).

  • Работа с распределенным кластером: шардирование, репликация.

  • Оптимизация нагрузки и профилей настроек (profiles).

  • Поддержка streaming ingestion (Kafka → ClickHouse).

Требования:
Обязательные:
  • Коммерческий опыт работы с ClickHouse от 1–3+ лет.

  • Глубокое понимание движка MergeTree:

    • первичные и разреженные индексы;

    • гранулы;

    • влияние ORDER BY на производительность.

  • Опыт проектирования схем хранения данных под аналитические нагрузки.

  • Продвинутый SQL:

    • оконные функции;

    • сложные JOIN (с учетом ограничений ClickHouse);

    • работа с массивами, Nested-типами.

  • Опыт построения ETL / ELT-пайплайнов.

  • Навыки валидации и тестирования данных.

  • Готовность выступать внутренним экспертом и наставником.

    Будет плюсом:

  • Опыт администрирования Linux.

  • Работа с распределенными кластерами ClickHouse.

  • Опыт работы с Apache Kafka и ClickHouse Kafka Engine.

  • Знание PostgreSQL и понимание различий OLTP vs OLAP.

  • Опыт работы в highload-проектах.

Условия:
  • Трудоустройство по ИП/СЗ
  • Гибридный график работы, 1-2 дня в офисе, офис в г. Москва, м. Кутузовская
  • Работа с современными и передовыми технологиями
  • Широкие возможности для профессионального и карьерного роста
Навыки
  • Clickhouse
  • SQL
  • ETL
  • Apache Kafka
  • Linux
Посмотреть контакты работодателя

Похожие вакансии

Rostic’s (Интернэшнл Ресторант Брэндс)

Senior Data-инженер

Rostic’s (Интернэшнл Ресторант Брэндс)

  • Москва

  • Не указана

Рекомендуем
Альфа-Банк
  • Москва

  • Не указана

Рекомендуем
Цифровой аудит

Lead Data Engineer

Цифровой аудит

  • Москва

  • Не указана

Рекомендуем
Тера Интегро

Data Engineer (Spark, NiFi)

Тера Интегро

  • Москва

  • Не указана

ГРЧЦ, ФГУП
  • Москва

  • Не указана

ГКУ Инфогород

Data Engineer

ГКУ Инфогород

  • Москва

  • Не указана

EcoFinance
  • Москва

  • Не указана

Ак Барс Цифровые Технологии

Data Engineer

Ак Барс Цифровые Технологии

  • Москва

  • Не указана

Эвокарго

Lead Data Engineer

Эвокарго

  • Москва

  • Не указана

Bell Integrator

Data Engineer

Bell Integrator

  • Москва

  • Не указана

Онлайн-школа Тетрика

Data Engineer

Онлайн-школа Тетрика

  • Москва

  • Не указана

  • Москва

  • Не указана

  • Москва

  • Не указана

Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Tech Lead Data Engineering (Lakehouse, ETL/DWH)

Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

  • Москва

  • Не указана

2ГИС
  • Москва

  • Не указана

2ГИС
  • Москва

  • Не указана

РТК-ЦОД

Data Engineer

РТК-ЦОД

  • Москва

  • Не указана

Navio
  • Москва

  • Не указана

БЮРО 1440
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию