Location: Remote / Hybrid (Europe preferred)
Type: Full-time
Experience level: Mid to Senior
Reports to: CTO / Founders
About Us
We are building an enterprise-grade AI assistant that helps organizations access and use their knowledge instantly and securely. Our system combines Retrieval-Augmented Generation (RAG), multi-tenant architecture, and secure cloud components to deliver accurate, context-aware answers inside complex corporate environments.
We are now looking for a Machine Learning Engineer to join our core technical team and help us take our RAG stack to the next level.
Your Responsibilities
You will be responsible for designing, improving and maintaining the intelligence layer of our platform. This includes:
RAG System Development
Improve our existing Python-based RAG pipelines (indexing, embedding, retrieval, reranking).
Implement vector database improvements (index updates, migrations, performance tuning).
Build robust document preprocessing & chunking pipelines for multi-format data.
LLM Integration
Integrate and optimize prompts and workflows with OpenAI models.
Experiment with alternative LLMs (optional mode: BYOM/BYO-LLM).
Create guardrails, evaluation metrics, and automated quality tests.
Infrastructure & Backend
Work closely with our AWS engineer to deploy, monitor, and scale the RAG services.
Implement secure data flows (S3, Lambda, Bedrock, IAM, API Gateway, etc.).
Help design multi-tenant and on-prem variations of the architecture.
Search, Ranking & Embeddings
Evaluate new embedding models and retrieval strategies.
Improve semantic search quality and domain-specific relevance.
Research emerging techniques (rerankers, hybrid search, small local LLMs, etc.).
Your Profile
We are a startup, so we value practical engineering ability, ownership, and curiosity.
Required
Solid Python skills (fast, clean, production code).
Hands-on experience with LLMs (OpenAI API or similar).
Extensive experience with RAG systems and vector databases (Qdrant, Pinecone, FAISS, etc.).
Familiarity with AWS (Lambda, S3, EC2, IAM, CloudWatch, API Gateway).
Experience with document extraction (OCR, PDF parsing, pipelines).
Good understanding of embeddings, semantic search, and prompt engineering.
Ability to take a feature from idea to deployed solution.
What We Offer
Work directly with founders on a high-impact AI product.
A modern stack: Python, OpenAI, AWS, Qdrant, FastAPI (and you can shape it further).
High degree of autonomy and real influence on the product architecture.
Opportunity to work at the frontier of enterprise AI & RAG systems.
Flexible remote work
How to Apply
Please send your CV, relevant project samples or GitHub, and a short note about what excites you about applying AI to VR training.
О компании
Мы разрабатываем корпоративного уровня ИИ-ассистента, который помогает организациям мгновенно и безопасно получать доступ к своим знаниям и эффективно их использовать. Наша система сочетает в себе технологии Retrieval-Augmented Generation (RAG), многопользовательскую архитектуру и безопасные облачные компоненты, что позволяет обеспечивать точные и контекстуально осведомленные ответы в сложных корпоративных средах.
В настоящее время мы ищем инженера по машинному обучению, который станет частью нашей основной технической команды и поможет вывести нашу технологию RAG на новый уровень.
Обязанности
Разработка RAG-системы
Совершенствование существующих пайплайнов RAG на базе Python (индексация, встраивание, извлечение, повторное ранжирование).
Реализация улучшений для векторных баз данных (обновления индексов, миграции, настройка производительности).
Разработка надежных пайплайнов для предварительной обработки документов и разделения их на части для данных в различных форматах.
Интеграция с LLM
Интеграция и оптимизация подсказок и рабочих процессов с моделями OpenAI.
Проведение экспериментов с альтернативными LLM (опциональный режим: BYOM/BYO-LLM).
Разработка механизмов контроля качества, метрик оценки и автоматизированных тестов.
Инфраструктура и Backend
Тесное сотрудничество с инженером AWS для развертывания, мониторинга и масштабирования сервисов RAG.
Реализация безопасных потоков данных (S3, Lambda, Bedrock, IAM, API Gateway и т.д.).
Разработка многопользовательских и локальных вариантов архитектуры.
Поиск, ранжирование и встраивание
Оценка новых моделей встраивания и методов извлечения данных.
Совершенствование качества семантического поиска и релевантности в рамках конкретных доменов.
Исследование новых подходов, таких как повторное ранжирование, гибридный поиск, малые локальные LLM и другие.
Требования
Мы являемся стартапом, поэтому ценим практический опыт, ответственность и любознательность.
Уверенные навыки программирования на Python (чистый, эффективный код для производственной среды).
Практический опыт работы с LLM (OpenAI API или аналогичные).
Обширный опыт работы с системами RAG и векторными базами данных (Qdrant, Pinecone, FAISS и т.д.).
Знание сервисов AWS (Lambda, S3, EC2, IAM, CloudWatch, API Gateway).
Опыт извлечения данных из документов (OCR, парсинг PDF, обработка данных).
Хорошее понимание технологий встраивания, семантического поиска и разработки подсказок.
Способность реализовать фичи от концепта до развернутого решения.
Что мы предлагаем
Прямое взаимодействие с основателями при разработке высококачественного ИИ-продукта.
Современный стек технологий: Python, OpenAI, AWS, Qdrant, FastAPI (с возможностью дальнейшей разработки).
Высокая степень автономии и возможность существенно влиять на архитектуру продукта.
Возможность работать на передовой в области корпоративного ИИ и систем RAG.
Гибкие условия удаленной работы.
Как подать заявку
Отправьте ваше резюме, примеры релевантных проектов или ссылку на GitHub и краткое описание, что вас привлекает в применении ИИ для обучения в виртуальной реальности.
Innovative People
Москва
до 7000 USD
Novakid Inc
Москва
от 6000 USD
Москва
до 420000 RUR
Москва
до 300000 RUR
Tevian (ООО Технологии видеоанализа)
Москва
до 345000 RUR