«АльфаСтрахование» - крупнейшая российская частная страховая компания и технологический лидер отрасли - усиливает команду машинного обучения и работы с данными. Задача: создание и поддержка решений, в т.ч. ИИ агентов, с использованием машинного обучения, преимущественно LLM моделей и связанной инфраструктуры (RAG, MCP). Также возможны задачи Classic ML.
Мы ищем data scientist’а в команду, занимающуюся развитием ML-подходов в страховании. Если у вас хорошая математическая подготовка, вы любите анализировать большие объемы данных и хотите получить опыт участия в полном цикле разработки ML-решений, а также готовы внедрять эти решения и влиять на бизнес, то мы будем рады видеть вас в нашей команде.
Наши модели работают в online-режиме 24/7, решая задачи оценки риска, выявления фрода, ценообразования и формирования индивидуальных предложений. Мы оцениваем влияние нашей работы на бизнес-метрики с помощью A/B-тестов. Используем в работе open-source решения: Spark, MLFlow, DVC, Feast, CatBoost, Docker, данные готовим на Hadoop-кластере.
Обязанности:
- Разработка решений (подготовка данных, выбор решения, обучение, тесты, запуск в production-среде) на основе больших языковых моделей (LLM)
- Разработка ML-моделей (подготовка данных, выбор решения, обучение, тесты, запуск в production-среде)
- Сопровождение ML и LLM решений (мониторинг сервисов и моделей, отслеживание дрейфа данных, работа над развитием). Оценка влияния на бизнес предложенных решений.
- Подготовка признаков для feature store (используем Feast)
- Взаимодействие с DA/DE/DevOps для улучшения и автоматизации процессов.
Требования: - Понимание работы LLM моделей, их использования в связке RAG, MCP
- Понимание работы базовых ML-алгоритмов
- Знание метрик машинного обучения и их интерпретации
- Уверенное владение Python
- Знание основных фреймворков для построения RAG: llamaindex, langchain и т.п.
- Общее представление об A/B-тестах
- Навыки работы с Git
- Опыт самостоятельного обучения и вывода моделей в production
Желательно:
- Навыки построения пайплайнов обработки данных с использованием pyspark
- Опыт проведения A/B-экспериментов
- Знакомство с MLFlow, dvc
- Наличие представления о REST API (плюсом будет опыт работы с FastAPI)
- Опыт работы с Docker
- Представление о различных источниках данных: реляционные базы данных, Redis, Hive, Kafka.
Что мы предлагаем: - Работу в профессиональной команде, которая готова делиться знаниями и опытом;
- Возможность внешнего обучения и прокачки твоих скиллов за счет Компании;
- Заботу о сотрудниках: возможность прохождения медицинских chek-апов, безлимитные бесплатные консультации с финансовыми консультантами, юристами и психологом. В компании поддерживается и развивается культура ЗОЖ;
- Отличный социальный пакет, включающий ДМС, скидки на страховые продукты компании, скидки от наших партнеров (туризм, фитнес и т.д.);
- Обеспечение техникой для работы;
- Гибридный график работы 5\2 (гибкое начало дня с 8 до 10)