В связи с расширением команды и масштабированием проектов находимся в поиске Senior Data Scientist в IT-компанию, которая занимается разработкой и полным сопровождением заказного программного обеспечения, веб-сайтов и мобильных приложений, предоставляя широкий спектр услуг.
Технологии:
Python, NumPy, PyTorch, SciPy, scikit-learn, OpenCV, Triton MongoDB, PostgreSQL, S3 (Ceph), ClickHouse, Kafka Poetry, GitLab, Kubernetes, Argo Workflows, Kubeflow
Чем предстоит заниматься:
Работа с бизнес-стейкхолдерами - уточнение целей, перевод бизнес-задач в формальные ML- проблемы, оценка эффекта от внедрения моделей;
Исследование и оценка источников данных - поиск новых внутренних и внешних датасетов, анализ их качества, полноты и применимости к бизнес-целям; выявление недостающих данных и формирование требований к их сбору;
Разработка инструментов для подготовки обучающих датасетов - автоматизация сбора, очистки, разметки и обогащения данных; обеспечение воспроизводимости и масштабируемости процессов;
Проектирвоание, обучение, оценка и публикация моделей - выбор релевантных подходов, построение и оптимизация ML-решений, проведение экспериментов, контроль качества и интеграция моделей в продакшн-среду;
Продуктовая аналитика и эксперименты - формирование и проверка гипотез, проведение A/B- тестов, анализ результатов моделей и экспериментов в разрезе продуктовых метрик, предоставление бизнес-рекомендаций.
Наши ожидания от кандидата:
Опыт работы Data Scientist от 5 лет;
Глубокое владение Python - уверенное написание промышленного кода, понимание устройства интерпретатора, принципов памяти, асинхронности и параллелизма;
Отличные навыки SQL - уверенное владение сложными запросами, оконными функциями, оптимизацией и профилированием запросов;
Опыт работы с NoSQL-базами (например, MongoDB) и объектными хранилищами (S3, Ceph);
Знание и практическое применение классических алгоритмов машинного обучения (регрессия, деревья, бустинг, кластеризация и др.);
Глубокое понимание процессов обучения и инференса нейронных сетей;
Умение применять статистические методы для анализа данных, валидации гипотез, продуктовой аналитики;
Опыт полного цикла разработки ML-моделей - от подготовки датасетов до продакшн-деплоя;
Практический опыт с ML-инструментами: numpy, pandas, scipy, scikit-learn, pytorch, opencv, triton.
Плюсом будет:
Опыт data-аналитики и построения отчётности;
Опыт работы с Kubeflow;
Опыт обучения, интеграции или применения LLM;
Опыт создания и оптимизации RAG-систем.
Мы предлагаем:
Данное рабочее место является планируемым к созданию и замещению (перспективным).
Finstar Financial Group
Минск
до 3000 USD