Ищем специалисты по работе с большими данными
Мы готовим и выгружаем данные для дата-сайентистов (DS) Блока Финансы для обучения моделей машинного обучения. Задачи Блока - работа с розничными, корпоративными, экосистемными данными (продукты, клиенты, операции)
Наша команда использует современный техстек: Hadoop (+ Trino, HDFSGateway), SPARK, Python, GreenPlum
Работаем в тесной кооперации с бизнес-аналитиками и дата-сайентистами, чтобы максимально быстро доставить качественные данные
Чем предстоит заниматься:
- поиск и анализ исходных данных в DWH и исходных системах Банка
- разработка выгрузок (извлекающих запросов), ad-hoc запросов
- работа с бизнес-заказчиками, сбор и формализация требований в бизнес-терминах
- проектирование, разработка витрин и наполнение данными
- оптимизация запросов
Мы ждем от вас:
- уверенные навыки SQL или SPARK API
Будет преимуществом:
- опыт разработки сложных SQL-запросов (несколько и более таблиц >100млн строк, использование аналитических функций)
- знание банковских продуктов и опыт работы с банковскими данными (физические и юридические лица)
- опыт сбора и документирования требований
- опыт разработки промышленных решений (документирование требований, согласование, описание архитектуры решения, постановка задачи на разработку и приемка и т.д.)
- опыт работы (написание и оптимизация запросов, проектирование витрин и т.п.) на классических СУБД (Teradata, Oracle, MS SQL, My SQL, Postgre и т.п.)
- опыт работы на Hadoop(Hive\Impala) и\или SPARK
- опыт проектирования и внедрения СУБД или DWH или BI
- опыт разработки отчетности
Мы предлагаем:
- комфортный современный офис рядом с м. Кутузовская
- ежегодный пересмотр зарплаты, годовую премию
- уникальную систему обучения Сбера для профессионального и карьерного развития
- расширенный ДМС и льготное страхование для семьи
- гибкий дисконт по ипотечному кредитованию, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- корпоративная пенсионная программа