Нижний Новгород, улица Тимирязева, 15к2
Метро: ГорьковскаяКомпания «Селдон» — российский разработчик IT-решений в сфере анализа закупок, поиска данных и автоматизации работы с тендерной информацией. Мы создаём продукты для обработки больших массивов закупочной документации, интеллектуального поиска, аналитики и автоматизации бизнес-процессов.
Сейчас мы расширяем команду и ищем ML-разработчика для развития NLP/ML-решений в области анализа закупок и документов.
Уверенное владение Python для анализа данных и разработки ML/NLP-пайплайнов.
Опыт работы с Pandas / Polars / NumPy.
Опыт применения Scikit-learn для классических ML-задач.
Опыт решения NLP-задач: классификация текстов, поиск похожих документов, кластеризация, дедупликация.
Практический опыт с TF-IDF, BM25, cosine similarity, embeddings.
Умение быстро строить baseline-решения и сравнивать простые подходы со сложными моделями.
Опыт работы с грязными данными: пропуски, дубли, шум, нестабильные форматы, OCR-ошибки, неоднородные источники.
Уверенное знание SQL.
Понимание метрик качества: precision, recall, F1, ROC-AUC, PR-AUC, confusion matrix.
Умение анализировать ошибки модели, находить причины ложных срабатываний и пропусков.
Умение готовить понятные отчёты по качеству моделей для разработки и бизнеса.
Понимание, что ML-модель должна решать бизнес-задачу, а не только показывать хорошую offline-метрику.
Опыт работы с русскоязычными текстами.
Опыт с BERT / RuBERT / Sentence Transformers / BGE / e5 / transformers.
Опыт с NER: GLiNER, spaCy, transformers.
Опыт использования LLM для разметки, анализа данных и поиска паттернов.
Опыт с OCR-текстами, PDF/Word/HTML-документами и табличными фрагментами.
Опыт с Elasticsearch / OpenSearch / Manticore / Sphinx / Lucene-подобными поисковыми системами.
Опыт с ranking/recommendation задачами.
Опыт с графовыми признаками: Node2Vec, metapath2vec, графы поставщик-заказчик-закупка-ОКПД2.
Понимание active learning и weak supervision.
Опыт организации или использования экспертной разметки.
Опыт внедрения ML-решений в реальные продукты или внутренние бизнес-процессы.
Работу над прикладными AI/ML-продуктами с реальной бизнес-нагрузкой.
Большие объёмы данных и сложные NLP-задачи.
Возможность влиять на архитектуру решений и развитие ML-направления.
Профессиональную команду разработки и аналитики.
Оформление по ТК РФ.
Конкурентную заработную плату.
Удаленный формат работы.
Возможности профессионального и карьерного роста.