Санкт-Петербург, 8-я линия Васильевского острова
Метро: ВасилеостровскаяНаша компания занимается разработкой и развитием масштабной AI-системы, которая анализирует различные источники данных — внутренние архивы, архивы, веб, соцсети и многое другое — с целью выявления событий, акторов, геоданных и связей между ними.
Система формирует динамическую базу знаний и временные ряды для анализа корреляций, визуализации взаимосвязей и прогнозирования.
Вы будете работать с многоуровневой архитектурой данных (ETL, временные базы, векторные представления, графовые модели), участвовать в построении пайплайнов обработки и интеграции ML-моделей (NLP, NER, ASR, OCR, CV), а также создании инструментов для анализа, визуализации и поиска/
Мы решаем комплексные задачи: от построения data flow и feature store — до проектирования семантических графов и оркестрации пайплайнов моделей.
Приглашаем ML Engineer, который умеет работать с разными моделями и готов создавать передовые AI-решения на современных фреймворках.
Обязанности:
Построение и адаптация моделей с различными типами данных: NER, NLP, ASR, OCR, Computer Vision
Проведение fine-tuning и разработка inference pipelines
Подготовка и аннотирование данных для обучения моделей
Работа с HuggingFace для использования и дообучения предобученных моделей
Оптимизация моделей с помощью ONNX для ускорения вывода
Внедрение и сопровождение моделей в продукционных системах
Необходимый стек:
PyTorch, HuggingFace transformers
OpenCV для обработки изображений и видео
Whisper и OCR инструменты (Tesseract, PaddleOCR)
LlamaIndex, LangChain для работы с LLM и цепочками обработки
Векторные базы данных для поиска и хранения эмбеддингов
Triton Inference Server для развертывания и оптимизации inference
Требования:
Опыт разработки и внедрения моделей NLP, CV, ASR, OCR
Знание современных архитектур и методов в области мульти-модального машинного обучения
Умение работать с библиотеками PyTorch и HuggingFace
Опыт создания и оптимизации inference pipeline
Навыки подготовки и обработки данных для ML-задач
Опыт работы с инструментами для производства и управления моделями (ONNX, Triton)
Знание Python, понимание ML-цикла
Работа над передовыми проектами в области мульти-модального ИИ
Участие в масштабных проектах по обработке данных и автоматизации бизнес-процессов
Содействие в развитии компании, возможность влиять на продукт и процессы компании,
Работа в инновационной команде
Достойная, конкурентоспособная заработная плата
Удаленная работа, Гибкий график
Возможность профессионального развития
Лашкевич Наталья Васильевна
Санкт-Петербург
Не указана
Лаборатория институционального проектного инжиниринга
Санкт-Петербург
от 300000 RUR
Санкт-Петербург
от 300000 RUR
Санкт-Петербург
от 300000 RUR
Университет искусственного интеллекта
Санкт-Петербург
от 5000 RUR
СПб ГКУ Санкт-Петербургский информационно-аналитический центр
Санкт-Петербург
от 4000 USD