Москва, Центральный административный округ, район Хамовники, квартал Красная Роза
Метро: Парк культурыРанжирование — это сердце Поиска, который ежедневно помогает сотням миллионов пользователей находить нужную информацию, и фундамент для Алисы — генеративного поиска будущего. Вам предстоит проектировать передовую ML-систему для одного из самых популярных сервисов в России.
Главный наш вызов — спроектировать ML-систему с учётом множества аспектов:
Какие задачи вас ждут
Научиться определять и показывать действительно качественный контент
Вместе с продакт-менеджерами и аналитиками вам предстоит разобраться, что сегодня значит «качественный сайт». Необходимо сделать модели, способные предсказывать экспертность, достоверность и степень зарекламленности контента. Научиться обучаться без байеса на популярность: даже люди-разметчики часто принимают красивый и популярный сайт за хороший по умолчанию. Помимо этого, нужно научиться отличать оригинальный контент от сгенерированного.
Спроектировать систему, чувствительную к изменениям внешнего мира
Эта система позволит понимать, когда информация устарела. Например, обновились пошлины на автомобили, и старые статьи теперь дезинформируют пользователей. Нужно будет научиться улавливать появление новых смыслов запросов: ещё вчера «Сплит» — это фильм, а сегодня —платёжная система. Предстоит разработать механизм регулярного дообучения и выстроить устойчивую систему контроля качества релизов.
Понять, как лучше всего визуализировать сайт на выдаче
Наша цель — сделать так, чтобы пользователь до клика понял, что документ решает его задачу. Необходимо научиться выделять нужный контекст с сайта — текст, изображение или другой фрагмент — и умещать его в несколько строк сниппета.
Создать механизм справедливого продвижения контента
Важно давать шанс новым сайтам, даже если пользователи привыкли к старым и узнаваемым. Для этого нужно исключить монополизацию выдачи, поддерживая честную конкуренцию и рост новых качественных игроков.
Мы ждем, что вы