Сейчас мы находимся в поиске MLops/DevOps-инженера в Ростелеком ИТ.
«РТК ИТ» специализируется на проектировании и автоматизации процессов продаж, а также обслуживании телекоммуникационной компании в В2С, В2В, B2O сегментах.
Проект: Мы создаем передовую ИИ платформу. Наша цель — предоставить командам исследователей и бизнес-пользователям инструментарий для работы с современными моделями ИИ в условиях ограниченного доступа к облачным ресурсам.
Мы предлагаем:
- Удаленную работу (на территории РФ);
- Оформление по ТК РФ в аккредитованной ИТ-компании;
- Оклад и годовую премию;
- Кафетерий льгот с возможностью выбора категорий (ДМС или компенсация затрат на медицинские услуги, спорт и т.д.).
Вам предстоит:
- Разворачивать инструменты AI/ML-разработки в кластере Kubernetes;
- Разворачивать инференс моделей;
- Настраивать кластер Kubernetes для работы с GPU устройствами Nvidia;
- Обеспечивать высокую доступность приложений в продуктиве;
- Сопровождать работу команд разработки;
- Оптимизировать системы для обучения нейросетевых моделей на GPU с использованием Volcano, PyTorch в Kubernetes;
- Разворачивать и поддерживать хранилище секретов.
Нам важны:
- Опыт работы с GPU;
- Опыт работы с Kubernetes и с Gitlab CI;
- Опыт работы с Linux, понимание сетевой модели OSI.
- Опыт работы с мониторингом: Zabbix, Prometheus, Victoria metrics, Grafana и логированием: Opensearch, Loki.
Будет плюсом:
- Опыт работы со Spark или Airflow;
- Опыт работы с JupyterHub;
- Опыт работы с Kubeflow, MLFlow, ClearML.