Сейчас мы ищем Middle/Senior Python Developer в ML-направление Samokat.tech.
Для эффективной работы сервисов мы активно используем модели машинного обучения, число которых измеряется десятками (ценообразование, прогноз спроса, рекомендации). Каждая из моделей вносит существенный вклад в развитие бизнеса, при этом разрабатывает их небольшая команда, каждый участник которой влияет на продукт напрямую.
На данной позиции необходимо разрабатывать и принимать участие в разработке ML-микросервисов в существующем стеке , а также прорабатывать архитектуру, интеграции с другими сервисами и другие решения для удовлетворения потребностей бизнеса.
Обязанности:разработка, запуск и поддержка сервисов с моделями машинного обучения в продовой среде;
подготовка моделей машинного обучения к выводу в прод;
написание тестов к коду;
обеспечение высокой доступности, надежности и масштабируемости сервисов с моделями машинного обучения;
настройка мониторинга и контроль за работой сервисов;
проведение регулярного code-review;
разработка и внедрение инструментов для автоматизации процессов разработки сервисов и их внедрения;
работа с datascience командой для улучшения цикла разработки и внедрения моделей.
опыт разработки на Python от 3-х лет;
использование контейнеризации (Docker, Kubernetes);
понимание концепций DevOps и CI/CD;
знание паттернов разработки, принципов SOLID;
опыт работы с SQL и NO SQL базами данных, понимание принципов их работы;
опыт проектирования структуры базы данных, оптимизации запросов;
знание и понимание микросервисной архитектуры и принципов взаимодействия сервисов.
Будет плюсом:
опыт работы с развертыванием моделей машинного обучения в производственной среде;
понимание концепций алгоритмов машинного обучения и способов их применения на практике;
опыт работы с инструментами и технологиями Big Data (Hive, Spark, pyspark, pandas, polars).
разработка: Python 3.10, FastAPI, PySpark, pytest, psycopg2, asyncpg;
данные: Hive, PostgreSQL, Cassandra, Greenplum, Clickhouse;
мониторинги и логи: VictoriaMetrics, Grafana, ELK;
задачи: Jira, Confluence;
инфраструктура: Airflow,, Kafka, Kubernetes, GitLab.