Обязанности:
Мы ищем увлеченного данными инженера широкого профиля, интересы которого распространяются от источников данных, их статистической обработки и построения AI/ML-инфраструктуры до участия в проектах класса GenAI.
Мы начинаем развивать проекты ИИ, у нас разнообразные задачи – от классического ML до LLM, RAG и MLOps.
На данной позиции хотим видеть человека способного быстро разбираться в задачах, создавать MVP, экспериментировать и доводить решения до продакшена.
Что предстоит делать:
- Развивать проекты компьютерного зрения (CV – Computer Vision) в частности FVC – Food Visual Computing
- Разрабатывать и внедрять ML – модели
- Строить и оптимизировать RAG-архитектуру: чанкеры, векторизация, retrieval, маршрутизация запросов.
- Проведение исследований данных: feature engineering, эксперименты
- Подготовка данных и участие в построении ETL/ELT-пайплайнов совместно с Data Engineering-командой
- MLOps цикл: контейнеризация, мониторинг, управление экспериментами, вывод моделей в продакшн
- Развивать AI-инфраструктуры: автоматизация экспериментов, воспроизводимость окружений, MLflow, DVC.
- Построение ASR-пайплайнов (Whisper, диаризация, адаптация под доменную лексику).
Мы ожидаем кандидатов:
Технический бэкграунд
- Понимание архитектуры аналитических платформ
- Уверенный Python и DS-стек: Pandas, NumPy, Scikit-learn, PyTorch/TensorFlow
- Опыт решения задач ML: классификация, регрессия, NLP или CV
- Понимание полного жизненного цикла ML-проекта: от данных до продакшена
- Хорошие знания SQL, работа с реляционными и NoSQL хранилищами.
- Базовые навыки MLOps: Docker, MLflow/Weights&Biases, Airflow (или аналоги)
Опыт GenAI / LLM
- Настройка LLM (OpenAI API, HF-сервера, локальные модели)
- Создание промптов, chains, системной логики
- RAG-концепции: embedding, векторные БД, retrieval стратегии
- Опыт в CV: классификация, детекция, сегментация
MLOps & Infrastructure:
- Kubernetes, KServe, BentoML.
- CI/CD: GitLab CI, GitHub Actions.
- Monitoring: Prometheus, Grafana.
- DVC или аналоги для управления экспериментами.
Cloud:
- Yandex Cloud, SberCloud, VK Cloud, AWS, GCP или Azure.
Что мы ценим:
- Умение работать как исследователь и как инженер.
- Способность переводить бизнес-задачу в архитектуру решения.
- Проактивность и аккуратность в работе с данными и продакшн-моделями.
- Желание развиваться в GenAI и широком ML-стеке.
Условия -
- Работа в офисе или по гибридному графику (по договоренности) после испытательного срока
- Бесплатное питание
- Дружная команда ИТ-специалистов