Департамент консалтинга приглашает талантливого Middle+ Data Scientist для участия в исследовательских проектах и разработки промышленных AI-решений, повышающих эффективность индустриальных и энергетических компаний.
Обязанности:
Участие в полном цикле разработки и внедрения AI/ML-решений:
1. Анализ бизнес-потребностей и постановка задач
- Тесное взаимодействие с бизнес-заказчиками и технологическими экспертами (инженерами, технологами) для выявления, формализации и приоритизации проблем, потенциально решаемых методами ИИ.
- Перевод неструктурированных бизнес-требований в конкретные, измеримые задачи машинного обучения.
- Анализ осуществимости и оценка потенциального экономического эффекта от внедрения DS-решений.
- Формирование технических заданий и дорожных карт для Data Science проектов.
2. Работа с данными и Feature Engineering
- Сбор, интеграция и консолидация данных из разнородных источников.
- Проведение анализа данных для выявления закономерностей, аномалий и инсайтов.
- Активная работа с инженерными временными рядами: обработка пропусков, сглаживание, агрегация, построение специфических признаков (фичей).
- Разработка и создание высокоуровневых признаков (feature engineering), отражающих физику и технологию производственных процессов.
3. Разработка, обучение и валидация ML-моделей
- Разработка, обучение и тонкая настройка (fine-tuning) моделей машинного обучения для решения поставленных в проекте задач.
- Применение широкого спектра алгоритмов: от классических (линейные модели, деревья, ансамбли) до нейросетей (LSTM для временных рядов, CNN для изображений).
- Тщательная валидация моделей с использованием кросс-валидации во временном разрезе (TimeSeriesSplit), оценка бизнес-метрик.
4. Внедрение и мониторинг решений (MLOps)
- Участие в процессе развертывания моделей в промышленную эксплуатацию, взаимодействие с ML-инженерами и DevOps.
- Создание прототипов и MVP для демонстрации ценности решения Заказчику.
- Организация мониторинга качества данных (Data Drift) и прогнозов (Concept Drift) работающих моделей, их периодическое переобучение и калибровка.
5. Коммуникация и документирование
- Подготовка прозрачных и интуитивно понятных отчетов и презентаций о результатах работы для технических и нетехнических специалистов.
- Создание и ведение технической документации по проектам.
- Участие в регулярных встречах с командой и заказчиками, демонстрация прогресса.
Требования:
- Высшее образование (математическое/ в сфере информационных технологий)
- Релевантный опыт работы в сфере обработки естественного языка и/или компьютерного зрения или машинного обучения от 3х лет
- Хорошие аналитические навыки, понимание базовых алгоритмов и структур данных
- Понимание этапов разработки модели от подготовки данных до тестирования в продакшн системе
-
Продвинутый Python (pandas, NumPy, логирование, Try-Except, LightGBM, CatBoost, TensorFlow, Keras, PyTorch, SHAP, LIME)
-
Опыт с прогнозными моделями: временные ряды, факторный анализ, классификация, регрессия
-
Навыки работы с LLM, эмбеддингами, многошаговой обработкой изображений (детекция, OCR)
-
Знание DevOps-инструментов: Docker, Git, FastAPI, автоматизация обновления моделей
-
Опыт работы с инструментами визуализации: Visual Studio Code, Plotly, Matplotlib
-
Развитые коммуникативные навыки, умение работать с заказчиками и создавать обучающие материалы
-
Знание английского на уровне B2 и выше.
Мы готовы предложить:
- Работу в аккредитованной ИТ компании
- Дружный коллектив с сильной экспертизой
- Гибридный формат работы (офис + удаленно)
- Премию по итогам года при выполнении показателей эффективности и соблюдении условий премирования
- Полное соблюдение ТК РФ (оформление, оплата больничных, отпусков и пр.)
- Рабочий день: с 9:00 до 18:00
- Добровольное медицинское страхование после прохождения испытательного срока
Погрузись в мир AI и влияй на развитие ключевых отраслей экономики вместе с нами!