- Определять стратегическое направление развития DS/ML в компании.
- Формировать roadmap ML инициативы и приоритизировать задачи.
- Проводить research и proof of concept для новых технологий и подходов.
- Взаимодействовать с product и business для понимания требований.
- Планировать ресурсы и координировать с Data Engineering и DevOps командами.
- Разрабатывать ML модели и алгоритмы решений бизнес-задач.
- Проектировать архитектуру ML систем и data pipeline.
- Дизайн feature engineering решений и структур данных.
- Разрабатывать цепочки обработки данных с использованием сервисов Data Engineering.
- Интеграция ML-сервисов с backend сервисами через API.
- Оптимизировать производительность моделей и их inference latency.
- Мониторинг качества моделей в production (Model Monitoring).
- Внедрять best practices по обработке данных.
- Координировать с Data Engineering по подготовке и инжинирингу данных.
- Работать с DevOps по deploy и инфраструктуре для ML моделей.
- Консультировать backend-команды по интеграции ML-сервисов.
- Участвовать в архитектурных обсуждениях с техническими лидерами других направлений.
- Проводить Code review и feedback для смежных команд по ML-related задачам.
Для нас важно:
- От 5 лет опыта разработки на Python со специализацией в Data Science.
- Опыт управления направлением/инициативами без формального подчинения команды.
- Опыт управления командами DS и ML инженерами.
- Опыт взаимодействия и координации с соседними инженерными командами (Data Engineering, DevOps).
- Опыт превращения бизнес-задач в технические решения ML/AI.
- Опыт работы с LLM и Transformer архитектурами.
- Опыт fine-tuning и prompt engineering для LLM.
- Знание RAG (Retrieval Augmented Generation) систем.
- Глубокие знания Machine Learning.
- Опыт работы с Deep Learning (PyTorch, TensorFlow/Keras).
- Опыт разработки и деплоя ML моделей в production.
- Глубокие знания SQL и работы с Data Warehouse (ClickHouse, PostgreSQL).
- Опыт работы с временными рядами и прогнозированием (Time Series Forecasting).
- Знание основ NLP и Computer Vision (преимущество).
- Data Science: scikit-learn, pandas, numpy, statsmodels, scipy.
- Deep Learning: PyTorch, TensorFlow/Keras, Hugging Face transformers.
- ML Operations: MLfow, Kubeflow.
- Базы данных: PostgreSQL, ClickHouse, MongoDB, S3.
- Streaming: Apache Kafka.
- Инфраструктура: Docker, Kubernetes, Cloud Native решения.
- Visualization: Jupyter, Grafana.
- Testing: pytest, unittest.
- Языки: Python, SQL, Bash.
- Техническое лидерство.
- Умение принимать ответственные решения в условиях неопределенности.
- Развитые навыки коммуникации и презентации технических решений.
- Способность к стратегическому мышлению и долгосрочному планированию.
- Самостоятельность и инициативность в решении проблем.
- Дисциплинированность и ответственность за результат.
- Ориентация на достижение целей.
- Внимание к деталям и ответственность за качество.
- Готовность делиться знаниями и помогать коллегам.
- Адаптивность к изменениям и открытость к новым технологиям.
- Умение работать в быстро меняющемся окружении.
- Проактивность в выявлении и решении проблем.
- Конструктивный подход к решению задач и конфликтов.
- Понимание принципов Feature Engineering и Feature Store.
- Опыт работы с фреймворками ML Ops (MLflow, Weights & Biases, Kubeflow).
- Опыт работы с большими данными (Apache Spark, Distributed systems).
- Опыт работы с Kafka для потоковой обработки данных.
- Опыт написания тестов и документирования ML-кода.
- Опыт определения и внедрения governance-политик для ML-моделей.
- Опыт работы на позициях Senior/Lead в стартапах или быстрорастущих компаниях.
- Опыт работы с инструментами мониторинга и наблюдаемости (Prometheus, Grafana).
- Знание Cloud Native решений (Kubernetes, Docker).
Главный принцип SkillStaff - Выбирай!