Тестирование и оценка моделей машинного обучения: Проведение экспериментов с различными ML моделями, анализ их производительности и выявление оптимальных решений для новых сервисов;
Участие в разработке новых сервисов: Активное сотрудничество с командой для создания новых решений на основе искусственного интеллекта, направленных на улучшение бизнес-процессов и оптимизацию существующих систем;
Ведение проектной документации: Создание и поддержание актуальной проектной и технической документации, включая описания архитектуры, алгоритмов и методов, используемых в разработке;
Исследование и внедрение новых технологий: Постоянный мониторинг актуальных тенденций в области машинного обучения и искусственного интеллекта, а также поиск способов их применения в рамках компании.
Мы ожидаем:
Глубокая экспертиза в Python, уверенное использование asyncio, threading и multiprocessing, а также навыки в профилировании и решении задач, связанных с памятью и процессором.;
Опыт работы с FastAPI и Pydantic v2: знание асинхронной архитектуры и уверенное владение структурой проектов;
Опыт работы с PostgreSQL, Redis, MongoDB, грамотное проектирование схем, индексация, выбор между ORM и raw SQL;
Знание Docker и Docker Compose, базовое понимание Kubernetes;
Опыт в настройке RabbitMQ, Kafka, Celery и Redis, включая реализацию retry-логики, управление дубликатами и dead-letter очередями, а также экшн локеры;
Опыт разработки микросервисов, выделение высоконагруженных зон, кэширование и создание stateless приложений;
Умение быстро собрать интерфейс на HTMX/Bootstrap или Streamlit.
Будет преимуществом:
Опыт работы с LLM, включая OpenAI, Claude и DeepSeek: навыки в кастомизации промптов, оптимизации затрат и качества, а также в использовании функциональных вызовов и потоковой передачи данных;
Знания в области RAG-систем: опыт построения полного пайплайна от чанкинга до эффективного поиска информации. Понимание выбора векторных баз данных и графов знаний;
Умение создавать чат-ботов ассистентов с цепочками вызовов, memory, fallback, multi-agent;
Знание решений TorchServe, Triton и ONNX, а также понимание квантования модели и интеграции локальных моделей с GPT;
Опыт работы с MLOps (MLflow, Weights & Biases, мониторинг метрик, логирование, отслеживание версий).
Мы предлагаем:
Работу в крупной международной компании;
Официальное оформление по ТК РФ;
Полностью белую заработную плату;
График: 5/2, полностью удаленный формат работы;
Возможность посещения офиса - м. Проспект Мира (5 минут пешком).
Дополнительные бонусы:
Работа в дружной команде и развитая корпоративная жизнь;
Возможность профессионального и карьерного роста, гибкое отношение к новым идеям;
Возможность повышения квалификации и переподготовки по выбранной специальности в нашем корпоративном университете с получением сертификата или диплома;
Программа ДМС;
Корпоративные скидки в фитнес-клубы;
Премиум доступ к платформе со скидками от партнеров;
Подарки на день рождения;
Доплата к больничным и отпускам до полной заработной платы.