Команда проекта Nastavnik (компания Simbioz) приглашает ML‑инженера, который поможет построить «мозг» нашего AI‑наставника для адаптивного обучения. Мы развиваем инновационную платформу в сфере EdTech, где ИИ подстраивает обучение под каждого ученика в режиме реального времени.
Наша технология — гибридная система, которая диагностирует знания ученика и выбирает оптимальную образовательную стратегию. Это сложная и амбициозная задача на стыке современного AI и образования, и вы можете стать тем, кто её решит.
Ключевые задачи:
- Разработка, обучение и валидация DKT-модели (на базе LSTM/GRU или аналогов) для отслеживания вектора знаний пользователя в реальном времени.
- Проектирование и создание симуляционной среды («цифрового двойника» ученика) на основе собранных данных для безопасного офлайн-обучения RL-агента.
- Реализация и обучение DQN-агента, который будет принимать педагогические решения (какой контент показать следующим).
- Проектирование эффективной функции вознаграждения (reward function) для RL-агента, мотивирующей его на реальное улучшение знаний пользователя.
- Проведение экспериментов, анализ метрик и итеративное улучшение всего ML-пайплайна.
Что мы ожидаем от вас:
- Глубокое знание Deep Learning, опыт работы с нейросетями для обработки последовательностей (RNN, LSTM, Transformers).
- Четкое понимание принципов обучения с подкреплением (Reinforcement Learning).
- Опыт коммерческой разработки на Python и глубокое знание фреймворков PyTorch или TensorFlow.
- Опыт работы с классическими задачами Data Science: от сбора и очистки данных до инженерии признаков.
- Умение и желание читать научные статьи и применять state-of-the-art подходы на практике.
- Практический опыт оптимизации промптов и знание инструментов
- MLFlow, Git, Postgres, FastApi, Docker, CI/CD, PrompLayer или LangSmith
Идеально, если вы:
- Имеете практический опыт обучения RL-агентов, в частности DQN.
- Разрабатывали симуляционные среды для RL-задач.
- Участвовали в Kaggle-соревнованиях или имеете другие примеры решения сложных ML-задач.
Мы предлагаем:
- Уникальную и сложную R&D задачу, результаты которой станут ядром инновационного продукта.
- Возможность работать с передовыми технологиями в области AI.
- Минимум бюрократии и максимум влияния на технические решения.
- Удаленный формат работы и гибкий график.
- Конкурентную заработную плату по итогам собеседования.
Если вы увлечены Reinforcement Learning и хотите применить свои знания для создания продукта, который изменит образование, — мы ждем ваше резюме!