Разработка и поддержка ETL-процессов для загрузки и обработки данных из различных источников
Оптимизация и автоматизация потоков данных
Настройка пайплайнов данных (Airflow или аналогичные инструменты)
Интеграция данных между системами (API, файловые источники, внешние сервисы)
Работа с базами данных (PostgreSQL, ClickHouse, MS SQL и др.)
Очистка данных от повреждений и исправление ошибок кодирования и связанных с ними проблем.
Проведение анализа данных для оценки их качества и ценности.
Поддерживать работоспособность рабочих систем (Django, Airflow и т.п)
Подготовка и обновление технической документации.
Сотрудничество с программистами, аналитиками и руководителями для выявления возможностей улучшения процессов, предложения модификаций системы и разработки стратегий управления данными.
Подготовка отчетов в соответствии с запросами менеджера.
Требования:
Хорошее знание SQL и принципов построения реляционных баз данных
Опыт работы с Django (DRF)
Опыт работы с Python (pandas, SQLAlchemy, psycopg2 и др.)
Аналитическое мышление
Развитые коммуникативные навыки
Понимание принципов CI/CD и работы с Git
Навыки работы с ОС Linux
Знание Docker и Docker Compose
Навыки оптимизации производительности запросов и пайплайнов данных
Умение читать и писать техническую документацию на английском языке
Будет плюсом опыт работы с Airflow
Будет плюсом опыт работы с системами хранения данных (Data Warehouse, Datalake)
Условия:
График работы: 6/1, Пн-Пт с 9:00 – до 18:00, Сб: 10:00-16:00
Официальное трудоустройство с первого рабочего дня по ТК РУз
Комфортабельный офис в центре города
Заработная плата обговаривается по итогам собеседования.