Мы в поисках опытного Data-Engineer на проект по разработке интеллектуального Assistant ЭДО и поддержке надежной data-платформы, автоматизирующей анализ юридических документов.
Твои задачи:
- Готовить «ML-готовые» датасеты: схемы, слои, форматы, версионирование
- Подключаться к источникам бизнеса (ERP/CRM/биллинги/лог-шины/API), консолидировать разрозненные данные.
- Строить и поддерживать надёжные конвейеры (батч/стриминг) с оркестрацией, мониторингом и алертингом.
- Проектировать DWH/даталейк/лейкхаус, индексацию, партиционирование, компрессию.
- Настраивать data quality/контракты данных (валидации, тесты, SLA)
- Интегрировать ML/LLM-пайплайны: оффлайн/онлайн фичи, фичастор, подготовка корпусов для RAG, векторные БД.
Мы ждем от тебя:
- опыт проектирования и эксплуатации конвейеров данных (батч/стриминг).
- Уверенный SQL (аналитический, оконные функции, оптимизация) и Python для пайплайнов/утилит.
- Опыт с Airflow (DAG, зависимости, сенсоры, SLA, retries)
- Понимание ML-пайплайнов на уровне подготовки признаков/датасетов для обучения и сервинга.
Что мы обеспечим:
- Команда профессионалов, где каждый увлечен своим делом и готов поделиться экспертизой, а также возможность нести новые знания и технологии
- Поездки на конференции и тренинги за счет компании, внутренние семинары, внутренние митапы, мы очень любим учиться новому
- Новая техника для комфортной работы
- Корпоративная культура с своими ценностями и традициями
- Сессия профессионального развития персонала дважды в год, результатом которой является план индивидуального развития каждого сотрудника и получение обратной связи