Сегодня почти вся онлайн-жизнь собрана в почтовых и облачных сервисах. Лента фото и документов в Облаке, билеты, заказы и чеки в Почте — это далеко не все артефакты, которые при правильном подходе могут улучшить качество онлайн-потребления для пользователей Mail. Наша задача как ML-команды заключается в том, чтобы эту информацию отфильтровать, структурировать и предоставить пользователю в наиболее удобном и ценном виде. Это умная часть сервисов Mail.
Что мы предлагаем
- Возможность работать над продуктами, которыми пользуются миллионы людей
- Реализация передовых ML-решений в HighLoad-окружении: через нас проходят миллиарды писем и файлов пользователей, которые необходимо обрабатывать и анализировать
- Работа над широким спектром задач: классический ML, NLP/LLM, CV
- Возможность тесной связи с продуктовыми командами и прямое влияние на ключевые бизнес-показатели
Мы ищем специалистов, которые
- Любят разбираться во внутренних тонкостях алгоритмов и кастомизировать их для повышения продуктового эффекта
- Проявляют живой интерес к последним тенденциям в машинном обучении и практикам разработки, стремятся их применять в наших сервисах
Мы будем рады вашему отклику и при обоюдном интересе предложим условия и проекты, от которых не захочется отказываться.
Задачи - Representation learning для описания поведения и интересов пользователей
- Извлечение сущностей и создание событий в Календаре и Покупках
- Развитие наших LLM-моделей
- Разработка нейродайджеста
- Автоматизация поддержки пользователей генеративными и дискриминативными моделями
Требования - Отличное знание основ машинного обучения
- Два-три года опыта разработки с использованием Python/C++
- Уверенное знание теории вероятностей и математической статистики
- Понимание структур данных и алгоритмов
- Знания современных алгоритмов обработки естественного языка (Word Embeddings, LSTM, Transformers, LLM, etc.)
- Опыт работы с библиотеками для глубокого обучения (Pytorch, Transformers, etc.)
Будет плюсом - Отличные коммуникативные навыки
- Опыт разработки микросервисных архитектур
- Знание стека технологий Hadoop (Spark/YT)
- Опыт работы с фреймворками vLLM/TensorRT
- Опыт обучения LLM с использованием RL, а также разработки проектов на базе агентов и RAG
- Опыт использования Docker/Kubernetes