Мы в поиске Data Scientist в группу нейросетевых технологий, занимающуюся применением DL подходов в задачах Lamoda.
Наша цель – с помощью глубокого обучения научиться выделять новую информацию о наших товарах (атрибуты, генерировать текстовое описание), автомодерировать и обрабатывать фотографий товаров (в том числе снятых на нашей собственной фотостудии).
Чем предстоит заниматься:
- Развивать и применять подходы, позволяющие работать с данными различных модальностей, например CLIP и SigLIP;
- Обогащать атрибуты товаров: извлекать атрибуты из фотографий, описаний товаров, отзывов, генерировать описания с помощью нейронных сетей
- Построение моделей автомодерации фотографий товаров: валидация отступов, определение ракурсов и др.
- Автоматизированная обработка и ретушь фотографий товаров
- Выбор оптимального порядка фото (в каталоге и карточке товара)
Мы ожидаем:
- Опыт работы в ML от 3-4 лет, в Deep Learning от 2 лет (CV, NLP)
- Владение Python и умение писать сложные SQL-запросы, опыт работы с Hadoop, Spark, Airflow, Docker.
- Опыт вывода ML-моделей в прод для решения бизнес-задач.
- Знания математической статистики, теории вероятности, алгоритмов и структур данных.
- Английский язык на уровне технического чтения.
Будет плюсом:
- Высшее образование в области прикладной математики, информационных технологий и т.п.
- Опыт проведения A/B-тестов и анализа их результатов.
- Опыт в рекламных технологиях, рекомендательных системах и других высоконагруженных сервисах.
- Опыт работы в e-commerce индустрии
Стэк технологий: Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL.
Почему у нас классно:
- Мы аккредитованная IT-компания
- Есть возможность работать по "гибриду" из Москвы, либо удалённо из любой точки
- Всё необходимое железо для работы: мощные ресерч-сервера с GPU и большой Hadoop-кластер
- Зрелый сетап разработки ML-решений полного цикла: современный стек, высокий уровень культуры разработки, более 30 ML-моделей в проде, есть культура ML OPS
- Полный жизненный цикл разработки data-driven продуктов с применением ML - от генерации идеи и до подведения результатов АБ-теста
- Проекты НЕ в стол, более 95% инициатив доходят до A/b теста/прода (можно видеть результаты своей работы буквально с первого квартала; хороший time-to-market)
- Культура code review и принятия решений на основании данных
- Сильные кросс-функциональные команды middle и senior специалистов, развитое DS-сообщество, любим обмениваться знаниями на внутренних шерингах и митапах
- Можно и нужно предлагать свои идеи; каждый может влиять на то, что делается в рамках его команды или всего DS-отдела/продукта
- Персональные карьерные маршруты для каждого члена DS команды
- Минимум бюрократии, доступы за 1-2 дня