Москва, проспект Андропова, 10А
Метро: АвтозаводскаяКаждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет строить MVP-алгоритмы расчета различных метрик автономных машин.
Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Spark и Polars/Pandas где объемы данных позволяют.
Примеры задач на первое время:
Выстраивать коммуникацию с owners (владельцами) функций автономного вождения.
Разрабатывать на SQL/PySpark алгоритмы расчёта метрик функций автономного вождения (например: качество удержания в полосе, качество локализации, дальность распознавания).
Документировать разработанные алгоритмы.
Проверять качество расчёта метрик после их передачи на регламентный расчёт data-инженерами.
Визуализировать метрики в BI-системе.
Чем предстоит заниматься:
Формировать выборки данных в соответствии с техническими заданиями;
Разрабатывать MVP (минимально жизнеспособные продукты) витрин данных;
Визуализировать данные для анализа и представления результатов;
Проектировать и документировать алгоритмы расчёта метрик для автономной технологии и других продуктов;
Собирать и анализировать требования к метрикам.
Что мы ждём от кандидата:
Хорошее знание SQL (на уровне написания сложных запросов с джойнами и оконными функциями);
Опыт анализа данных с использованием Python и библиотек Pandas/Polars;
Опыт работы хотя бы с одной из BI-систем (Metabase, Superset, Tableau, DataLens).
Будет плюсом:
Опыт работы со Spark;
Опыт работы с ClickHouse;
Опыт работы с Airflow/Luigi/Dagster.