Lead LLMOps

Москва, Газетный переулок, 17

Метро: Охотный ряд

Описание вакансии

В 2022 году Московской бирже исполнилось 30 лет. Мы появились вместе с современной Россией и за эти годы с нуля создали рынок инвестиций.

Сегодня миллионы людей и тысячи компаний доверяют нам и пользуются нашей инфраструктурой.

Ежедневно на наших торговых платформах совершаются миллионы транзакций в минуту – без задержек, без перебоев.
Мы храним в депозитарии цифровые записи о каждом активе, который торгуется на бирже.
Мы следим за тем, чтобы все операции соответствовали правилам торгов и требованиям регуляторов.

Мы — команда AI-продуктов Московской Биржи, которая меняет повседневную работу сотрудников и команд внутри биржи.

Мы автоматизируем процессы, убираем ручной труд и создаем AI-инструменты, которые позволяют делать больше, быстрее, точнее и в принципе по-новому.
Сейчас мы усиливаем направление LLMOps и ищем Senior/Middle LLMOps-инженера, который будет участвовать в развитии платформы эксплуатации больших языковых моделей и обеспечении надежной работы AI-сервисов в промышленной среде.

Задачи:

Проектирование, развитие и поддержка инфраструктуры для эксплуатации LLM- и ML- решений в продакшн среде с высокой нагрузкой;
Организация процессов развертывания, обновления и сопровождения больших языковых моделей и связанных AI-сервисов;
Обеспечение надежности отказоустойчивости, наблюдаемости и масштабируемости AI-инфраструктуры;
Развитие и стандартизация CI/CD-процессов для ML/LLM-сервисов;
Построение мониторинга, логирования и алертинга для AI-продуктов;
Оптимизация использования вычислительных ресурсов, производительности инференса и стоимости эксплуатации модели;
Взаимодействие с командами разработки, data science, архитектуры и инфраструктуры для вывода AI-решений в промышленную эксплуатацию.

Мы ожидаем, что у вас:

Опыт работы в роли Senior/Middle MLOps или LLMOps инженера;
Практический опыт проектирования, развертывания и эксплуатации ML-решений в продакшн;
Уверенное знание Docker и Kubernetes;
Опыт настройки и эксплуатации CI/CD в GitLab;
Опыт работы с NGINX;
Опыт работы с облачными платформами и инфраструктурой: AWS, Azure, Yandex Cloud;
Опыт работы с реляционными и NoSQL базами данных: Postgres, Oracle, Redis;
Знание и опыт использования инструментов мониторинга и наблюдаемости: Grafana, Prometheus, ELK;
Опыт работы с Apache Airflow;
Понимание принципов надежной эксплуатации высоконагруженных систем.