Анализ проблем в алгоритмах, предложение пути их решения и подготовка тест-кейсов;
Разработка технических заданий на создание аналитических систем;
Создание методологической документации;
Описание бизнес-процессов и требований к данным;
Формирование инструкций для пользователей;
Написание сложных SQL-запросов;
Обработка данных с использованием PySpark;
Работа с распределенными системами хранения данных;
Оптимизация процессов обработки данных.
Требования:
Уверенное знание SQL (продвинутый уровень);
Уверенное знание Python (продвинутый уровень);
Опыт работы с PySpark не менее 1-го года;
Понимание принципов работы Hadoop-стека;
Опыт работы с системами хранения данных не менее 1 года;
Опыт работы с Airflow не менее 1 года;
Опыт работы с форматами - паркет, xml, json, yaml.
Условия:
работа в крупной аккредитованной ИТ компании, занимающей лидирующие позиции на рынке разработки ПО в России;
развивающая эко-среду проектного офиса в кругу единомышленников и близких по духу сотрудников;
возможность участвовать в перспективных социально значимых проектах федерального масштаба;
ранжированные программы ДМС с полным пакетом медицинских услуг;
программы продвинутого обучения - менторинг и наставничество;
услуги штатного психолога, терапевта и массажиста;
система грейдов и бенефитов;
программы внутреннего и внешнего профессионального обучения и сертификации;
разнообразные корпоративные активности (тимбилдинги, витаминные дни, детские мероприятия, регулярные турниры по киберспорту, шахматам, настольному теннису, футболу и волейболу);
широкий перечень корпоративных программ лояльности для сотрудников (изучение английского языка по корпоративным ценам);
современный комфортабельный офис (бизнес-центр класса В+) в шаговой доступности от ст. метро Парк Победы/Фили.