Мы — команда специалистов, создающая сервисы и компоненты для платформы внутренней безопасности, а также разрабатывающая AI-агенты для выявления внутренних угроз и мошенничества. Нам нужен специалист, способный эффективно анализировать табличные и текстовые данные, необходимые для построения AI-агентов.
Ищем Data Engineer c уклоном в Data Science, которому предстоит заниматься извлечением, подготовкой и очисткой данных, а также поддержкой моделей машинного обучения. Мы предлагаем карьерный рост как в Data Engineering, так и в Data Science направлениях. Ты станешь частью команды опытных инженеров и аналитиков, работающих над сложными проектами в сфере информационной безопасности.
Задачи:
- анализ структур данных в разных источниках и форматов, оценка их пригодности для конкретных бизнес-задач
- загрузка, обработка и преобразование больших объемов данных из разнородных хранилищ (Oracle, Teradata, MS SQL, GreenPlum) в рабочие среды (GreenPlum, Hadoop)
- проектирование и создание аналитических витрин данных
- подготовка и препроцессинг данных для обучения моделей машинного обучения
- мониторинг и оптимизация рабочих процессов обработки и загрузки данных
- контроль качества входных данных и автоматизация проверки качества данных
- разработка инфраструктуры и внутренних сервисов для эффективной обработки больших объемов данных
- автоматизация повторяющихся операций с данными
- создание технической документации и поддержка баз знаний по работе с данными
- консультация пользователей внутри компании по вопросам использования данных.
Требования
- высшее образование
- опыт работы от 2х лет в роли Data Engineer, Data Analyst или ETL-разработчика
- продвинутый уровень владения SQL (аналитические функции, подзапросы, хранимые процедуры, производительность запросов)
- практический опыт работы с большими объемами данных в реляционных СУБД (Oracle, Teradata, MS SQL, GreenPlum)
- понимание концепции и принципов организации хранилища данных (DWH)
- работа с технологическим стеком Hadoop (HDFS, YARN, Hive) и Apache Spark
- опыт программирования на Java/Scala
- понимание базовых принципов построения распределенных систем хранения и обработки данных.
Будет плюсом:
- опыта проектирования витрин данных
- опыт переноса и интеграции больших объемов данных между разными источниками
- владение инструментами системы контроля версий (например Git)
- начальные знания и интерес к развитию в области Machine Learning и Data Analysis
- осведомленность в процессах ETL и технологиях хранилищ данных (DWH).
Мы предлагаем:
- работа в офисе по адресу г. Москва, Кутузовский проспект, 32
- на испытательном периоде работа в офисе, далее возможен смешанный режим работы возможен (но не более 1-2 дней в неделю удаленно)
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.