Санкт-Петербург, 8-я линия Васильевского острова
Метро: ВасилеостровскаяНаша компания занимается разработкой и развитием масштабной AI-системы, которая анализирует различные источники данных — внутренние архивы, архивы, веб, соцсети и многое другое — с целью выявления событий, акторов, геоданных и связей между ними.
Система формирует динамическую базу знаний и временные ряды для анализа корреляций, визуализации взаимосвязей и прогнозирования.
Вы будете работать с многоуровневой архитектурой данных (ETL, временные базы, векторные представления, графовые модели), участвовать в построении пайплайнов обработки и интеграции ML-моделей (NLP, NER, ASR, OCR, CV), а также создании инструментов для анализа, визуализации и поиска/
Мы решаем комплексные задачи: от построения data flow и feature store — до проектирования семантических графов и оркестрации пайплайнов моделей.
Ищем сотрудника на вакансию Data Scientist / Researcher, способного анализировать сложные данные и строить модели, которые влияют на развитие бизнеса.
Обязанности:
Проведение исследования данных, построение гипотез, выявление корреляций и связей между переменными
Построение графов связей и визуализация сложных структур данных
Разработка и внедрение статистических и ML моделей (классификация, кластеризация, прогнозирование)
Анализ и подготовка данных для обучения моделей и прототипирование новых методов
Построение и оптимизация пайплайнов на Python (Pandas, Scikit-learn, NLP toolkit)
Работа с графовыми базами данных (Neo4j), TimescaleDB, и моделями временных рядов (Prophet)
Использование NetworkX для анализа сетевых структур, а также библиотеки XGBoost для задач предсказания
Необходимый стек:
Python, Pandas, Scikit-learn, XGBoost, Prophet
NetworkX, Neo4j, TimescaleDB
NLP инструменты (управление моделями, обработка текста)
Работа с графами связей, временными рядами и ML-моделями
Требования:
Опыт проведения аналитических исследований и построения ML моделей
Навыки построения гипотез и тестирования статистических связей
Опыт работы с графовыми базами данных (Neo4j), TimescaleDB
Знание Python, навыки работы с Pandas, Scikit-learn, NetworkX
Навыки визуализации данных и генерации прототипов
Высшее образование в области математики, статистики, информатики или связанных областях
Возможность публикаций и участия в конференциях
Работа с крупными массивами данных и сложные аналитические задачи
Использование передовых инструментов и технологий
Участие в развитии компании, возможность влиять на продукт и процессы компании
Достойная, конкурентноспособная заработная плата
Удаленная работа, Гибкий график
Возможность профессионального развития
Санкт-Петербург
Не указана
Санкт-Петербург
Не указана
Санкт-Петербург
до 200000 RUR