Data Engineer (SafeHub)

СБЕР

Data Engineer (SafeHub)

Москва, Кутузовский проспект, 32

Метро: Кутузовская

Описание вакансии

Мы — команда специалистов, создающая сервисы и компоненты для платформы внутренней безопасности, а также разрабатывающая AI-агенты для выявления внутренних угроз и мошенничества. Нам нужен специалист, способный эффективно анализировать табличные и текстовые данные, необходимые для построения AI-агентов.

Ищем Data Engineer c уклоном в Data Science, которому предстоит заниматься извлечением, подготовкой и очисткой данных, а также поддержкой моделей машинного обучения. Мы предлагаем карьерный рост как в Data Engineering, так и в Data Science направлениях. Ты станешь частью команды опытных инженеров и аналитиков, работающих над сложными проектами в сфере информационной безопасности.

Задачи:

  • анализ структур данных в разных источниках и форматов, оценка их пригодности для конкретных бизнес-задач
  • загрузка, обработка и преобразование больших объемов данных из разнородных хранилищ (Oracle, Teradata, MS SQL, GreenPlum) в рабочие среды (GreenPlum, Hadoop)
  • проектирование и создание аналитических витрин данных
  • подготовка и препроцессинг данных для обучения моделей машинного обучения
  • мониторинг и оптимизация рабочих процессов обработки и загрузки данных
  • контроль качества входных данных и автоматизация проверки качества данных
  • разработка инфраструктуры и внутренних сервисов для эффективной обработки больших объемов данных
  • автоматизация повторяющихся операций с данными
  • создание технической документации и поддержка баз знаний по работе с данными
  • консультация пользователей внутри компании по вопросам использования данных.

Требования

  • высшее образование
  • опыт работы от 2х лет в роли Data Engineer, Data Analyst или ETL-разработчика
  • продвинутый уровень владения SQL (аналитические функции, подзапросы, хранимые процедуры, производительность запросов)
  • практический опыт работы с большими объемами данных в реляционных СУБД (Oracle, Teradata, MS SQL, GreenPlum)
  • понимание концепции и принципов организации хранилища данных (DWH)
  • работа с технологическим стеком Hadoop (HDFS, YARN, Hive) и Apache Spark
  • опыт программирования на Java/Scala
  • понимание базовых принципов построения распределенных систем хранения и обработки данных.

Будет плюсом:

  • опыта проектирования витрин данных
  • опыт переноса и интеграции больших объемов данных между разными источниками
  • владение инструментами системы контроля версий (например Git)
  • начальные знания и интерес к развитию в области Machine Learning и Data Analysis
  • осведомленность в процессах ETL и технологиях хранилищ данных (DWH).

Мы предлагаем:

  • работа в офисе по адресу г. Москва, Кутузовский проспект, 32
  • на испытательном периоде работа в офисе, далее возможен смешанный режим работы возможен (но не более 1-2 дней в неделю удаленно)
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию