Senior ML Engineer (в Бильбао, Испания)

провинция Бискайя, Басаури, Бильбао

Описание вакансии

Локация: Бильбао, Испания

Формат: Офисный

Домены: AI, Computer Vision, NLP, Fintech

Команда: PhD, университетские преподаватели, победители олимпиад

Artificial Seed разрабатывает передовые решения на стыке искусственного интеллекта и прикладных технологий, делая фокус на практических задачах, а не только на теоретических исследованиях. Мы работаем в направлениях AI, компьютерного зрения, NLP и финтеха, создавая и внедряя системы, которые решают сложные реальные бизнес-задачи.

Наша международная команда насчитывает более 100 специалистов и работает в среде, где ценятся глубокая экспертиза, инновации и постоянное развитие. Участники команды получают возможность решать нетривиальные задачи, сотрудничать с сильными экспертами и расти в быстро развивающейся технологической индустрии.

Мы ищем:

Senior ML Engineer, который уже строил LLM-агентов и RAG-системы в проде и умеет не только “собрать пайплайн”, но и двигать качество через гипотезы и эксперименты.

Нам нужен человек с мышлением research-minded инженера: быстро проверять идеи, превращать их в работающий прототип, измерять результат, а затем доводить до стабильного production-решения. Важна самостоятельность и ответственность за итог: “нашли рычаг → доказали метриками → внедрили → мониторим”. На практике это значит, что тебе нужно будет делать вещи типа:

Как построить оценку качества работы агента: какие метрики нужны (task success, tool success, latency/cost, hallucination rate), как собрать датасет, как делать offline/online eval, как организовать регрессии и алерты.
Будет ли кодовый агент работать лучше, чем текущий агент на наборе тулов: сравнить подходы (tool-based vs code-execution / codegen), определить критерии “лучше”, сделать A/B или controlled rollout, посчитать качество/стоимость/риски.
Как повысить качество RAG на 30%: улучшить retrieval (чанкинг, query rewriting, hybrid search), reranking, контекст-композицию, dedup/anti-leak, grounding, а затем подтвердить прирост на бенчмарке и в прод-метриках.

Нам важно, что:
Ты не боишься “непонятных задач”, где нет готового решения и нужно самому сформулировать: что измеряем, как проверяем, что считаем успехом.
Ты умеешь балансировать скорость и качество: быстро экспериментировать, но при этом держать в голове надёжность, наблюдаемость и воспроизводимость.
Ты умеешь писать (и вайбкодить) код, от которого продуктовые разработчики не хватаются за наган.

Требования:
Общий опыт разработки: от 5 лет;
Опыт в продуктах вокруг LLM / агентов: от 2 лет;
Построил(а) хотя бы:
- Одну RAG/поисковую систему с пайплайнами retrieval → rerank → generation;
- Одного агента (tool-use / multi-step / workflows);
- У этих систем есть реальные пользователи;
Асинхронный Python: asyncio, threads;
Промптинг для LLM: system prompt / user prompt / few-shot, шаблоны, контекст, инструкции;
Как устроены современные LLM: трансформеры, обучение, инференс, сервинг;
Свежие модели и их отличия (качество / скорость / контекст / стоимость / мультимодальность и т.д.);
MCP (Model Context Protocol);
Методология ML: train/val/test, метрики, базовые принципы оценки;
Контроль качества ответов агентов:
- Мониторинг, метрики, guardrails, регрессии, алерты, человеческая разметка/feedback loops;
- Фреймворки/подходы для агентов: fastmcp, mcp-use, OpenAI Agents SDK и аналоги;
Токенизация:
- Как работает токенизация;
- Какие токенайзеры актуальны, влияние на контекст / стоимость/ лимиты;
RAG-пайплайны:
- Компоненты (ингест / чанкинг / эмбеддинги/ векторное хранилище / retrieval / rerank /композиция контекста / генерация);
- Типовые проблемы и решения (галлюцинации, бедный ретривал, деградации, cold start, дрейф данных, дубликаты, latency);
Cursor и аналоги (Claude Code, Codex, Aider и т.п.): как пользоваться кодовыми агентами в разработке.

Будет плюсом:
Опыт организации API: REST / gRPC / GraphQL;
Понимание протокола HTTP;
Работа с реляционными СУБД: PostgreSQL и аналогами;
Знание распределённых и векторных хранилищ: Weaviate, Cassandra и др;
Опыт с Python API-фреймворками: FastAPI, Flask и аналогами;
Работа с системами фоновых задач: Celery, Taskiq, Airflow и др;
Навыки контейнеризации: Docker, Kubernetes или Nomad;
Опыт работы с очередями и брокерами: Kafka, RabbitMQ, Redis и др.

Что предлагаем:
Гибкий график работы - вы самостоятельно определяете комфортное время начала дня;
Полную поддержку при релокации в Бильбао, для вас и вашей семьи - помощь с оформлением документов, адаптацией и переездом, включая питомцев;
Неограниченный отпуск - возможность брать отдых тогда, когда это действительно нужно;
Атмосферу доверия и уважения к экспертности без излишнего контроля;
Современный офис в комфортной локации, командные мероприятия и регулярные оффсайты;
Профессиональный рост, участие в архитектурных решениях, амбициозные задачи и работу в сильной команде, у которой можно перенимать опыт.