Российская государственная библиотека — крупнейшая национальная библиотека мира, обладающая более чем 200 миллионами единиц хранения. Мы предоставляем доступ к богатейшему культурному наследию страны, включая книги, диссертации, журналы, газеты, карты, рукописи и нотные фонды. Наша миссия — предоставить доступ к знаниям для десятков миллионов читателей и обеспечить сохранение культурного кода России.
В рамках реализации стратегии цифровизации, основанной на AI-трансформации, мы ищем ML/Data Engineer. Вы будете играть ключевую роль в создании единой национальной платформы для доступа к самому большому национальному «озеру» достоверных данных и разработке экосистемы цифровых B2C, B2B и B2G сервисов.
Что вас ждет:
- Работа с современными LLM, такими как GigaChat, Cotype Nano и другими;
- Возможность заниматься прикладными исследованиями национального и мирового уровня;
- Влияние на развитие индустрии AI и участие в ключевых проектах страны;
- Публикация результатов на конференциях уровня А/А.
Обязанности:
- Разработка и внедрение ML-моделей: участие в полном цикле создания ML-решений — от исследования и прототипирования до продакшена и мониторинга;
- Проектирование и поддержка ETL/ELT процессов: создание эффективных и отказоустойчивых пайплайнов для сбора, очистки, обработки и преобразования данных из различных источников;
- Развертывание моделей: упаковка моделей в контейнеры, организация их работы в продакшене, создание API для интеграции с другими сервисами;
- Взаимодействие с командой разработчиков LLM и CV.
Требования:
- Опыт разработки в области Data Engineering или Machine Learning Engineering от одного года;
- Уверенное владение Python и основными библиотеками для работы с данными;
- Опыт работы с фреймворками для развертывания и управления ML-моделями;
- Глубокие знания SQL и опыт работы с реляционными и нереляционными БД;
- Понимание принципов контейнеризации и оркестрации;
- Опыт построения и поддержки ETL/ELT пайплайнов с использованием инструментов типа Apache Airflow, Luigi, Prefect.
- Знание основных облачных платформ и их сервисов для работы с данными;
- Понимание жизненного цикла ML-проектов и лучших практик инженерии данных;
- Умение писать чистый, поддерживаемый и хорошо документированный код (знание Git обязательно).
- Способность самостоятельно решать сложные задачи и работать в команде.
Мы предлагаем:
- Уникальные проекты, имеющие значительное влияние на доступность знаний в стране;
- Конкурентоспособную заработную плату и социальные гарантии;
- Возможность профессионального и карьерного роста;
- Динамичную рабочую среду с возможностью реализации собственных идей.