Описание:
Мы — сервисная IT-компания, занимаемся разработкой web-приложений для клиентов из Европы и Северной Америки.
Сейчас ищем AI-инженера, который сможет взять на себя весь цикл работы с LLM, RAG, генерацией текста, аудио и изображений для нашего нового продукта в сфере EdTech.
Нужен специалист, который умеет самостоятельно проектировать, разрабатывать и поддерживать полноценные AI-модули: от ingestion и RAG до QA, TTS и image generation.
Обязанности:
Работа над AI-частью крупного web-продукта (образовательная платформа).
Основные задачи:
1. Разработка AI-функционала
построение RAG-системы: ingestion, OCR, chunking, embeddings, vector store, retrieval;
генерация текстов при помощи LLM (TOC, главы, параграфы, переработки, QA);
построение citation-движка (привязка chunkId к абзацам, coverage%, distance rules);
реализация AI QA (проверка фактов, ссылок, структуры, стиля, автоматические исправления).
2. Оркестрация и пайплайны
разработка AI Orchestrator: очереди, ретраи, idempotency, fallback, SLA;
построение многошаговых процессов: генерация → цитирование → QA → упаковка.
3. Аудио и изображения
генерация аудиоконтента (TTS + SSML), сегментация, склейка, нормализация;
проверка аудио на ACX-совместимость, LUFS, Peak;
генерация изображений (обложки, иллюстрации) через DALL·E 3 / аналогичные сервисы.
4. Интеграции
работа с OpenAI API, ElevenLabs (или аналогами), DALL·E 3;
взаимодействие с backend через REST API;
работа с S3-хранилищами и векторными БД (Pinecone / Qdrant).
5. Аналитика, качество и стабильность
логирование, трассировка, мониторинг AI-метрик;
контроль стоимости (token budget), производительности, корректности генераций;
участие в планировании задач, оценке и улучшении архитектуры AI-модулей.
Требования
Python (обязательно)
Уверенный Senior-уровень:
Python 3.10+
FastAPI
Pydantic
Asyncio
Работа с очередями (Celery / RQ / Dramatiq / async pipeline)
Работа с Postgres (SQL, JSONB)
RAG (обязательно)
Опыт разработки полноценных RAG-систем:
chunking (token-based, semantic-based, overlap)
embeddings (OpenAI, Cohere, Sentence Transformers)
vector DB: Qdrant / Pinecone / PGVector
retrieval настройки (Top-K, similarity threshold, recency bias, boosts)
защита от галлюцинаций и blending
построение pipeline: ingestion → embeddings → vector store → retrieval → generation
LLM-engineer навыки
генерация длинных текстов (2–10k tokens)
многошаговые пайплайны (TOC → Chapters → QA → Regen)
JSON schema output
обработка markdown
промтинг для QA, стилевой обработки, факт-чека, TTS, изображений
Citation / Fact-grounding
привязка chunkId к тексту
coverage%
dedup
distance rules
обработка устаревших источников (staleness)
AI QA
правила проверки фактов, ссылок, структуры
LLM-classification
Heuristics-линтеры
автоисправления (autofix pipelines)
Audio (обязательно)
опыт работы с TTS (ElevenLabs / Play.ht / OpenAI)
SSML
ffmpeg, pydub, librosa
LUFS / Peak / noise validation
Image generation (обязательно)
DALL·E 3 / Midjourney / Stability API
генерация изображений по структуре
вариации, апскейлы
авто-alt-text
MLOps & Observability
работа с Docker
логирование, трассировка (OpenTelemetry, Sentry)
контроль токенов, стоимости, производительности
Условия:
- работа удаленная, гибкий график
- первый месяц испытательный период
- если проявите свою производительность и ответственность перейдём на работу full-time
- работа в команде программистов. Используeм в работе методологию управления проектов Scrum
- возможности для повышения квалификации и профессионального роста