Инженер NLP/PLP Senior

Описание вакансии

LIAN — системный интегратор с фокусом в аналитике и управлении данными.

Мы работаем в трех направлениях:

1. Автоматизация управленческой отчетности (BI) в малом и среднем бизнесе. Строим хранилища данных, настраиваем сбор и интеграцию, разрабатываем отчеты и дэшборды. Наш стек в BI включает все современные инструменты, в том числе open-source ПО.

2. Заказная разработка аналитических систем. Когда у нашего клиента есть специфичный запрос, мы разрабатываем аналитические системы с нуля. Часто применяем подходы BigData, Data Science, актуальные подходы к программному анализу данных и прогнозированию.

3. Запуск и ресурсное обеспечение команд разработки в комплексных проектах цифровой трансформации. Мы усиливаем команды наших партнеров и клиентов собственными сотрудниками и обеспечиваем максимально быстрый старт новых проектов. Среди наших заказчиков - крупные системные интеграторы, банки, нефтегазовые, химические производства, логистические компании, стартапы.

Сейчас мы приглашаем опытного Инженера NLP/PLP

Чем предстоит заниматься:

Сфокусироваться на instruction tuning LLM для задач Text-to-SQL и анализа программного кода (PLP).
Вести полный цикл ML-исследований: дизайн экспериментов, проверка гипотез, анализ результатов.
Самостоятельно работать с кодом, данными и инфраструктурой: готовить датасеты, писать код для моделей, запускать обучение на кластерах.
Внедрять лучшие модели в продакшн-среду, работая в команде с ML-инженерами и разработчиками.
Быть в курсе последних трендов AI/ML, читать arXiv и внедрять state-of-the-art подходы в наши проекты.

Наши пожелания к кандидатам:

Опыт работы в Machine Learning / Data Science от 4 лет, с фокусом на NLP или смежных областях.
Глубокие теоретические знания в области Deep Learning, особенно в современных архитектурах (трансформеры) и трендах NLP.
Практический опыт обучения и тонкой настройки (fine-tuning) больших языковых моделей (LLM), включая знание методов эффективной настройки (PEFT, SFT), таких как LoRA, P-Tuning.
Опыт распределенного обучения моделей на GPU-кластерах с использованием инструментов (DeepSpeed, FSDP, torch.distributed, Accelerate).
Свободное владение стеком технологий: Python, PyTorch, библиотеки Hugging Face.
Навык полного цикла ML-исследования: умение самостоятельно спроектировать, обосновать, провести эксперимент и проанализировать его результаты.
Знакомство с ключевыми датасетами и бенчмарками в области NL2SQL (например, Spider, CoSQL).
Искренний интерес к области NLP/PLP и глубокому обучению.

Будет преимуществом:

Опыт работы на аналогичной исследовательской позиции.
Участие и высокие результаты в соревнованиях по ML (Kaggle и аналоги).
Наличие сабмитов на публичных лидербордах (NLP/PLP).
Научные публикации в топовых конференциях (уровня A*/A, Q1).
Практический опыт развертывания и обучения моделей в продакшн-среде на кластерах.

Что мы предлагаем:

Форма трудоустройства на ваш выбор: договору оказания услуг с ИП или самозанятым
Участие в интересных масштабных проектах с Заказчиками федерального и международного уровня
Работа с передовыми технологиями
Возможности профессионального и карьерного роста
Полностью удаленная работа
Регулярная и достойная оплата труда

В нашей команде работают профессионалы с разносторонним опытом. Здесь ты найдешь профессиональные задачи и новые вызовы, сможешь реализовать свой потенциал.
Хочешь стать частью нашей команды? Мы ждем твоего отклика и свяжемся с тобой !

Посмотреть контакты работодателя