глубокое понимание теоретических основ машинного обучения, математической статистики и методов оптимизации;
свободное владение Python и основными библиотеками для data science: * ML-фреймворки: Scikit-Learn, XGBoost/LightGBM/CatBoost * Глубокое обучение: PyTorch и/или TensorFlow * Обработка данных: Pandas, NumPy, Polars;
опыт работы с большими данными (BigData): * Обработка: Apache Spark (PySpark), Hadoop (HDFS) * Аналитические СУБД: ClickHouse или аналоги (Vertica, Greenplum);
опыт построения и поддержки ML-пайплайнов с использованием оркестраторов: Airflow, Dagster, Prefect или аналоги;
понимание принципов контейнеризации и оркестрации (Docker, Kubernetes);
опыт работы с инструментами для визуализации данных: Tableau, Power BI, Yandex DataLens или аналоги;
экспертиза в области Machine Learning & AI;
практический опыт реализации проектов в ключевых domains: * Классическое ML (регрессия, классификация, кластеризация) * Обработка естественного языка (NLP) * Компьютерное зрение (Computer Vision);
понимание архитектурных принципов построения современных GenAI-решений, включая работу с LLM (Large Language Models) и паттернами RAG (Retrieval-Augmented Generation);
опыт работы с геологическими, геофизическими данными или данными дистанционного зондирования Земли (ДЗЗ);
знание открытых и корпоративных источников и баз геологических данных является значительным преимуществом;
наличие успешного опыта внедрения корпоративных AI/ML-решений «под ключ» в нефтегазовой, геологоразведочной или смежных областях;
опыт работы с облачными платформами (Yandex Cloud, AWS, GCP, Azure) и их ML-сервисами;
умение доносить сложные технические концепции до нетехнических специалистов.
Обязанности:
разработка, обучение, тестирование и производственная оптимизация моделей машинного обучения для анализа геолого-геофизических данных;
создание и внедрение end-to-end ML-сервисов и пайплайнов обработки данных;
полный цикл разработки AI/ML-решений: от исследования и прототипирования до внедрения в production и мониторинга;
разработка и поддержка ML-инфраструктуры и платформенных решений для геологического отдела;
глубокий анализ больших объемов данных, написание и поддержка эффективных скриптов на Python и SQL;
исследование и экспериментирование с новыми подходами и техниками в области искусственного интеллекта для решения бизнес-задач.
Условия:
работа в офисе (ЦАО), пешая доступность от метро;
трудоустройство в соответствии с ТК РФ;
корпоративные льготы: новогодние детские подарки, программы лояльности от партнеров, материальная поддержка сотрудников в различных жизненных ситуациях;
культурные мероприятия: тимбилдинги, день работника нефтяной и газовой промышленности, конкурсы для детей сотрудников, Новый год;
программы заботы о здоровье: ДМС со стоматологией для сотрудника и детей, льготное страхование для родственников, дистанционные (телемедицинские) онлайн-консультации врачей.