Москва, Рочдельская улица, 15с43
О компании:
Мы создаем единую систему цифровой маркировки и прослеживания товаров в России и странах ЕАЭС. Наша система позволяет снизить уровень контрафакта и гарантировать подлинность товаров, производимых в стране или ввозимых в нее.
Честный Знак - одна из самых высоконагруженных платформ, которой нет аналогов:
— микросервисная архитектура на Kubernetes с Istio в нашей собственной инфраструктуре;
— петабайты живых данных, с которыми круглосуточно работают наши сервисы и клиенты через API;
— миллиарды транзакций в день и десятки тысяч запросов в секунду;
— аналитика в реальном времени на потоках событий и масштабная батчевая аналитика по ночам;
— мобильное приложение с 27+ миллионов установок;
— десятки релизов в продакшн каждый день, feature flags, инфраструктура как код.
Под капотом — Kafka, Cassandra, Spark, Airflow, Iceberg, ClickHouse, GitLab CI/CD, Helm, Prometheus, Grafana.
Мы не боимся сложных задач и запускаем в продакшн смелые инженерные идеи!
О команде:
Центр мониторинга информационной безопасности (Security Operations Center, SOC) — структурное подразделение организации, отвечающее за оперативный мониторинг IT-среды и предотвращение киберинцидентов. Специалисты SOC собирают и анализируют данные с различных объектов инфраструктуры организации и при обнаружении подозрительной активности принимают меры для предотвращения атаки.
Чем предстоит заниматься:
Разрабатывать и внедрять ML-модели для скоринга, приоритизации и классификации событий, алертов и инцидентов в SOC.
Формировать ML-датасеты для обучения и валидации моделей: определять целевые переменные, признаки, источники данных и правила разметки.
Выполнять feature engineering для SOC-данных: поведенческие признаки по артефактам, частотность, редкость, временные паттерны и исторические данные.
Разрабатывать LLM/RAG-функции для SOC: поиск по playbook/runbook, базе прошлых кейсов и threat intelligence
Выполнять fine-tuning / instruction tuning LLM под внутренние SOC/IR-сценарии, включая использование PEFT-подходов: LoRA/QLoRA.
Обеспечивать оценку качества моделей: SHAP, feature importance, reason codes, PR-AUC, F1-macro, MCC, precision@topK, recall по critical/high incidents.
Интегрировать ML/LLM-сервисы с backend-платформой через REST API и участвовать в построении ETL/ELT/ML-пайплайнов.
Настраивать мониторинг качества моделей, регулярное переобучение, контроль data drift и улучшение моделей на основе feedback от SOC-аналитиков.
Документировать модели, признаки, датасеты, метрики, ограничения и участвовать в развитии roadmap ML-функций для SOC.
Уверенное владение Python и ML-стеком: pandas, numpy, scikit-learn, PyTorch; понимание ML lifecycle: обучение, валидация, деплой, мониторинг качества и переобучение.
Опыт решения задач классификации, ранжирования, скоринга или anomaly detection.
Опыт работы с несбалансированными выборками и соответствующими метриками качества: Precision/Recall, F1, PR-AUC, MCC, confusion matrix, threshold tuning, class weights, sampling techniques.
Умение интерпретировать модели и объяснять предсказания: SHAP, feature importance, local/global explanations.
Уверенное владение SQL и понимание ETL/ML-пайплайнов: подготовка датасетов, feature engineering, версионирование данных.
Опыт работы с Docker, Git и интеграцией ML-сервисов через REST API.
Желательно
Возможности для развития
Заботимся о сотрудниках
Удобство и комфорт
Жизнь в компании
Если ты хочешь расти профессионально, работать с классными людьми и при этом чувствовать заботу — ждем в нашей команде!