LIAN — системный интегратор с фокусом в аналитике и управлении данными.
Мы работаем в трех направлениях:
1. Автоматизация управленческой отчетности (BI) в малом и среднем бизнесе. Строим хранилища данных, настраиваем сбор и интеграцию, разрабатываем отчеты и дэшборды. Наш стек в BI включает все современные инструменты, в том числе open-source ПО.
2. Заказная разработка аналитических систем. Когда у нашего клиента есть специфичный запрос, мы разрабатываем аналитические системы с нуля. Часто применяем подходы BigData, Data Science, актуальные подходы к программному анализу данных и прогнозированию.
3. Запуск и ресурсное обеспечение команд разработки в комплексных проектах цифровой трансформации. Мы усиливаем команды наших партнеров и клиентов собственными сотрудниками и обеспечиваем максимально быстрый старт новых проектов. Среди наших заказчиков - крупные системные интеграторы, банки, нефтегазовые, химические производства, логистические компании, стартапы.
Сейчас мы приглашаем опытного Инженера NLP/PLP
Чем предстоит заниматься: - Сфокусироваться на instruction tuning LLM для задач Text-to-SQL и анализа программного кода (PLP).
- Вести полный цикл ML-исследований: дизайн экспериментов, проверка гипотез, анализ результатов.
- Самостоятельно работать с кодом, данными и инфраструктурой: готовить датасеты, писать код для моделей, запускать обучение на кластерах.
- Внедрять лучшие модели в продакшн-среду, работая в команде с ML-инженерами и разработчиками.
- Быть в курсе последних трендов AI/ML, читать arXiv и внедрять state-of-the-art подходы в наши проекты.
Наши пожелания к кандидатам: - Опыт работы в Machine Learning / Data Science от 4 лет, с фокусом на NLP или смежных областях.
- Глубокие теоретические знания в области Deep Learning, особенно в современных архитектурах (трансформеры) и трендах NLP.
- Практический опыт обучения и тонкой настройки (fine-tuning) больших языковых моделей (LLM), включая знание методов эффективной настройки (PEFT, SFT), таких как LoRA, P-Tuning.
- Опыт распределенного обучения моделей на GPU-кластерах с использованием инструментов (DeepSpeed, FSDP, torch.distributed, Accelerate).
- Свободное владение стеком технологий: Python, PyTorch, библиотеки Hugging Face.
- Навык полного цикла ML-исследования: умение самостоятельно спроектировать, обосновать, провести эксперимент и проанализировать его результаты.
- Знакомство с ключевыми датасетами и бенчмарками в области NL2SQL (например, Spider, CoSQL).
- Искренний интерес к области NLP/PLP и глубокому обучению.
Будет преимуществом:
- Опыт работы на аналогичной исследовательской позиции.
- Участие и высокие результаты в соревнованиях по ML (Kaggle и аналоги).
- Наличие сабмитов на публичных лидербордах (NLP/PLP).
- Научные публикации в топовых конференциях (уровня A*/A, Q1).
- Практический опыт развертывания и обучения моделей в продакшн-среде на кластерах.
Что мы предлагаем:
- Форма трудоустройства на ваш выбор: договору оказания услуг с ИП или самозанятым
- Участие в интересных масштабных проектах с Заказчиками федерального и международного уровня
- Работа с передовыми технологиями
- Возможности профессионального и карьерного роста
- Полностью удаленная работа
- Регулярная и достойная оплата труда
В нашей команде работают профессионалы с разносторонним опытом. Здесь ты найдешь профессиональные задачи и новые вызовы, сможешь реализовать свой потенциал.
Хочешь стать частью нашей команды? Мы ждем твоего отклика и свяжемся с тобой !