Data Scientist

Описание вакансии

Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера.

Что мы делаем?

Департамента Глобальных Рынков (ДГР) – предоставляет корпоративным и розничным клиентам широкий спектр продуктов и услуг на финансовых рынках. Ключевые направления бизнеса: торговые операции с ценными бумагами, деривативами, ликвидностью, на валютном, товарно-сырьевом рынках, структурные продукты.

Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных.

Наша команда решает очень широкий спектр DS-задач с применением самых передовых ML/DL алгоритмов и инструментов. В нашей компетенции — разработка, тестирования и вывод в промышленную среду моделей .

Мы ищем талантливого специалиста, который обладает опытом работы с большими языковыми моделями (LLM). В этой роли вы будете играть ключевую роль в исследовании и применении нашей LLM для решения широкого спектра задач, включая генерацию текста, извлечение информации, Q&A системы, логическое мышление и другие.

Обязанности

  • участие в разработке решения на основе обучения/ файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4)
  • построение пайплайна обработки данных и обучения LLM (LLM цепочек);
  • разработка векторизованных баз знаний с использованием LangChain, ChromaDB
  • организация процесса мониторинга качества LLM
  • тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения
  • участие в формировании требований и необходимых данных по улучшению моделей
  • оценка как полученное решение достигает поставленных целей;
  • следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике
  • разработка документации и руководства для пользователей и разработчиков
  • подготовка и анализ новостей для обучения модели.

Требования

  • знание Python на уровне middle-разработчика
  • Опыт анализа и обработки данных (numpy/pandas) и их визуализация (matplotlib, seaborn, plotly)
  • опыт web scraping (в идеале – playwright/parsel/httpx, возможно – selenium/beautifulsoup/requests)
  • опыт работы с БД (ORM)
  • опыт создания dashboards (streamlit/gradio/dash)
  • опыт асинхронного программирования (asyncio)
  • Linux
  • Git
  • Docker.

Навыки NLP:

  • уверенное владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении
  • знание PyTorch или Tensorflow для возможности fine-tuning LLM под конкретную задачу
  • знание LLM-фреймворков и библиотек (в идеале – langchain, дополнительно как пример - llama-index, openai) для создания LLM-приложений
  • опыт использования LLM (gpt-3.5-turbo/gpt-4/open source), в идеале – опыт использования их API для создания LLM-приложений
  • знание методов Prompt Engineering.

Личностные качества:

  • навыки и желание самостоятельного изучения новых технологий для проведения экспериментов и реализации MVP с участием в дальнейшим развитии проектов.

Проекты:

  • наличие публичных проектов, и/или активное участие в разработке open source проектов в области NLP/LLM
  • наличие блога по NLP/LLM.

Условия

  • формат работы: офис (ул.Вавилова,19). Возможен гибрид
  • стабильный оклад и социальная поддержка сотрудников
  • расширенное ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров: СберМаркет, Самокат, Еаптека, Мегамаркет
  • корпоративная пенсионная программа
  • корпоративное обучение за счет компании
  • реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей
  • корпоративный спортзал и скидки в спортзалы-партнеры
  • скидки на продукты Сбера и компаний-партнеров.
Посмотреть контакты работодателя

Похожие вакансии

Компания БКС

Data Scientist (GenAI)

Компания БКС

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Компания БКС

Data Scientist (Classic ML/NLP)

Компания БКС

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
ИНИТИ
Удаленная работа
  • Москва

  • от 351000 RUR

СБЕР
Полный день
  • Москва

  • от 351000 RUR

СБЕР

Data Engineer

СБЕР

Полный день
  • Москва

  • от 351000 RUR

СБЕР
Полный день
  • Москва

  • от 351000 RUR

Негосударственный Пенсионный Фонд Сбербанка

Data Scientist Junior+

Негосударственный Пенсионный Фонд Сбербанка

Полный день
  • Москва

  • от 351000 RUR

ПКО АйДи Коллект

Data Scientist (Senior)

ПКО АйДи Коллект

Полный день
  • Москва

  • от 351000 RUR

СБЕР

Data science

СБЕР

Полный день
  • Москва

  • от 351000 RUR

СБЕР
Полный день
  • Москва

  • от 351000 RUR

Ингосстрах
Удаленная работа
  • Москва

  • от 351000 RUR

Мокка
Удаленная работа
  • Москва

  • от 351000 RUR

Домклик
Полный день
  • Москва

  • от 351000 RUR

СБЕР

Data Analyst

СБЕР

Полный день
  • Москва

  • от 351000 RUR

Lamoda Tech
Полный день
  • Москва

  • от 351000 RUR

Mr.Flip
Полный день
  • Москва

  • от 351000 RUR

Яндекс
Полный день
  • Москва

  • от 351000 RUR

СБЕР
Полный день
  • Москва

  • от 351000 RUR

СберПраво

Data Scientist NLP

СберПраво

Полный день
  • Москва

  • от 351000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию