Data Engineer

Описание вакансии

Наша команда активно занимается разработкой интеллектуального ассистента для автоматизации работы с офисными данными. Мы в поисках Data-инженера с желанием получить уникальный опыт

Твои задачи:

Подключаться к источникам бизнеса (ERP/CRM/биллинги/лог-шины/API), консолидировать разрозненные данные
Строить и поддерживать надёжные конвейеры (батч/стриминг) с оркестрацией, мониторингом и алертингом
Готовить «ML-готовые» датасеты и фичи: схемы, слои, форматы, версионирование
Обеспечивать хранение: проектировать DWH/даталейк/лейкхаус, индексацию, партиционирование, компрессию
Настраивать data quality/контракты данных (валидации, тесты, SLA)
Оптимизировать стоимость и производительность: планирование ресурсов, профилирование, кэш/материализация
Интегрировать ML/LLM-пайплайны: оффлайн/онлайн фичи, фичастор, подготовка корпусов для RAG, векторные БД.

Мы ждем от тебя:

Опыт от 3-х лет в data-инженерии: проектирование и эксплуатация конвейеров данных (батч/стриминг)
Уверенный SQL (аналитический, оконные функции, оптимизация) и Python для пайплайнов/утилит
Опыт с Airflow (DAG, зависимости, сенсоры, SLA, retries)
Опыт проектирования слоёв данных и форматов, S3-совместимые стораджи
Практика data quality (тесты, профили, контракты)
Понимание ML-пайплайнов на уровне подготовки признаков/датасетов для обучения и сервинга

Что мы обеспечим:

Команда профессионалов, где каждый увлечен своим делом и готов поделиться экспертизой, а также возможность нести новые знания и технологии
Безграничная прокачка скиллов
Поездки на конференции и тренинги за счет компании, внутренние семинары, внутренние митапы, мы очень любим учиться новому
Новая техника для комфортной работы
Корпоративная культура с своими ценностями и традициями
Сессия профессионального развития персонала дважды в год, результатом которой является план индивидуального развития каждого сотрудника и получение обратной связи

Посмотреть контакты работодателя