Описание:
Вы станете частью команды, ответственной за построение Data Warehouse для одной из ведущих компаний-дистрибьюторов.
Обязанности:
- Разработка платформы, отвечающей за сбор, обработку и анализ большого количества данных, получаемых из разнообразных источников.
- Решения задач нормализации, линковки и дедупликации данных.
- Интеграция с гетерогенными системами, поставляющими и потребляющими потоки данных.
- Разработка высоконагруженных микросервисов, выполняющих AI-задачи.
Учитываются опыт работы и знания в следующих областях (чем больше, тем лучше):
- Работа с SQL/NoSQL базами данных: Postgresql, Mongo, Redis, MySQL и т.д.
- Опыт построения Data Warehousе, умение писать большие сложные SQL/NoSQL запросы, проектировать эффективные схемы БД, оптимизировать производительность ее работы
- Опыт работы с ETL-фреймворками
- Опыт работы с Workflow Management системами: Airflow, Luigi и др.
- Знания Python Web frameworks (FastAPI / Aiohttp / Django / Flask / Tornado и др.)
- Умение писать асинхронный код: asyncio
- Опыт ведения исследований в среде Jupyter
- Работа с массивами и табличными данными: Numpy, Pandas, Polars
- Умение работать со средствами визуализации: matplotlib, seaborn, plotly, bokeh
- Опыт работы с очередями сообщений: Kafka, RabbitMQ
- Docker, Kubernetes, Helm
- Работа в Unix-окружении (Ubuntu)
О нас:
- Компания на рынке с 2009 года;
- Мы аккредитованная IT-компания со всеми соответствующими отсрочками от срочной службы и мобилизации;
- Ключевые сотрудники вышли из питерского Intel. Работаем вместе долго, но принимаем новых коллег с радостью;
- Принцип работы у нас прост: мы доверяем по максимуму, и нам важен результат. Помощь всегда окажем.
Условия:
- Полностью "белая" зарплата;
- ДМС со стоматологией и спортзал после испытательного срока;
- Гибкий график работы;
- Работа у нас в офисе на пл. Конституции, удаленно или в гибридном режиме.