Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера.
Департамент Глобальных Рынков (ДГР) – предоставляет корпоративным и розничным клиентам широкий спектр продуктов и услуг на финансовых рынках. Ключевые направления бизнеса: торговые операции с ценными бумагами, деривативами, ликвидностью, на валютном, товарно-сырьевом рынках, структурные продукты.
Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных.
Наша команда решает очень широкий спектр DS-задач с применением самых передовых ML/DL алгоритмов и инструментов. В нашей компетенции — разработка, тестирования и вывод в промышленную среду моделей .
Мы ищем талантливого специалиста, который обладает опытом работы с большими языковыми моделями (LLM). Вы будете играть ключевую роль в исследовании и применении нашей LLM для решения широкого спектра задач, включая генерацию текста, извлечение информации, Q&A системы, логическое мышление и другие.
Обязанности
- участие в разработке решения на основе обучения/ файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4)
- построение пайплайна обработки данных и обучения LLM (LLM цепочек)
- разработка векторизованных баз знаний с использованием LangChain, ChromaDB
- организация процесса мониторинга качества LLM
- тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения
- участие в формировании требований и необходимых данных по улучшению моделей
- разработка документации и руководства для пользователей и разработчиков
- подготовка и анализ новостей для обучения модели.
Требования
- знание Python на уровне middle-разработчика
- опыт анализа и обработки данных (numpy/pandas) и их визуализация (matplotlib, seaborn, plotly)
- опыт web scraping (в идеале – playwright/parsel/httpx, возможно – selenium/beautifulsoup/requests)
- опыт работы с БД (ORM)
- опыт создания dashboards (streamlit/ gradio/ dash)
- опыт асинхронного программирования (asyncio)
- Linux, Git, Docker.
Навыки NLP:
- владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении
- знание PyTorch или Tensorflow для возможности fine-tuning LLM под конкретную задачу
- знание LLM-фреймворков и библиотек (в идеале – langchain, дополнительно как пример - llama-index, openai) для создания LLM-приложений
- опыт использования LLM (gpt-3.5-turbo/gpt-4/open source), в идеале – опыт использования их API для создания LLM-приложений
- знание методов Prompt Engineering.
Условия
- формат работы: офис (ул.Вавилова,19). Возможен гибрид
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.