Платформа ОФД - аккредитованная IT-компания, крупнейший в России оператор фискальных данных. Мы анализируем рынок российского ритейла на данных из магазинных чеков. Из плохо структурированной информации создаём аналитические решения для производителей, крупных ритейлеров, финансовых организаций, маркетинговых агенств. У нас много данных: каждый 3-й чек, пробиваемый в России, находится на наших серверах. Мы принимаем 60 млн чеков в день, имеем 5 млрд SKU в базе.
Чем предстоит заниматься:
- Руководить отделом из 2 команд: аналитики и DS. Также доступен ресурс асессоров
- Рабочие активности в рамках задач: декомпозиция, планирование, оценка, груминг, приемка
- Найм, контроль подбора, онбординг. Мотивация и развитие сотрудников
- Обеспечение команды необходимыми ресурсами
- Координировать работу со смежными подразделениями (DE, Продуктовые команды, Техническая эксплуатация) как в роли исполнителя, так и в роли заказчика
- Развивать целевую систему классификации и атрибуции чековых наименований как продукт: архитектура решения, модели, витрины, деплой
- Лидировать разработку решений на базе ML-алгоритмов для продуктовых команд, ориентируясь на масштабируемые решения
- Лидировать разработку решений на базе LLM с целью покрытия процессов компании AI-агентами в рамках соответствующей инициативы
- Развивать методологию компании в части валидации, мониторинга разработанных отделом решений, интеграции в промышленный контур и mlops в целом
- Развивать методологию в части синхронизации бизнес-метрик качества разрабатываемых решений и модельных метрик. Достигать целевых метрик, критически подходить к разработанным отделом решениям
Оценивать стоимость и ресурсы разработки, отталкиваясь от окупаемости
Что у нас есть:
- Команда из 3 DS и 5 Аналитиков в стадии расширения
- On-premise GPU-серверы в ведении DS-команды на базе NVIDIA H200
- Hadoop-серверы для работы с данными в ведении DE-команды
- JupyterLab / любая IDE для ресерча и разработок, AirFlow для деплоя, MLFlow для логирования экспериментов
- Оформление по ТК РФ, полностью белая заработная плата
- ДМС (поликлиника, стоматология, госпитализация, скорая и телемедицина)
- График работы гибридный: офис 1 раз в неделю по пятницам. Гибкое время начала рабочего дня
- Офис близко от метро Спортивная/ МЦК Лужники
Требования к кандидату:
- Опыт лидирования / руководства командами в AI-ML в качестве лида или pm – от 2 лет
- Опыт самостоятельной разработки ML-моделей, в частности в области nlp – от 3 лет
- Опыт реализации масштабируемых core-решений на базе ml-моделей в компании
- Глубокие технические навыки в части реализации ML-моделей: pytorch, архитектура трансформеров, fine-tuning LLM, понимание принципов деплоя ml-моделей
- Глубокие аналитические навыки и знания математической статистики для критической оценки производимых решений
Наш стек:
Jupyterhub/PyCharm, python, стандартный python стек (pandas, numpy, sklearn, matplolib), fastext, torch, BERT, HuggingFace, MlFlow
Hadoop, Spark, Hive, PostgreSQL, ClickHouse, Zeppelin/IntelliJ, AirFlow, ElasticSearch, Apache Superset
GitLab, k8s, Docker, Jira, Confluence