Сейчас мы в поисках ML-разработчика в Getblogger — IT-компания (входит в МТС AdTech) одна из ведущих российских платформ автоматизированного размещения рекламы через блогеров и вебмастеров. Платформа позволяет рекламодателям размещать рекламу, а блогерам — выбирать подходящие предложения и размещать офферы рекламодателей у себя.
Чем предстоит заниматься:
- создать модель для автоматической классификации текстовых документов по тематическим доменам;
- разработать систему автоматической группировки текстов по смысловому содержанию;
- создать модель для автоматического извлечения именованных сущностей и их классификации.
Мы ждем от тебя:
- глубокие знания алгоритмов классификации и кластеризации;
- опыт работы с методами обработки естественного языка (NLP);
- профессиональное владение Python (middle/middle+);
- опыт работы с библиотеками: NLP: spaCy, NLTK, Hugging Face Transformers; ML: Scikit-learn, XGBoost, LightGBM; DL: PyTorch/TensorFlow; Обработка данных: Pandas, NumPy;
- опыт предобработки текстовых данных;
- навыки feature engineering для текстовых данных;
- опыт построения и оптимизации классификаторов;
- владение инструментами: Git; Docker; CI/CD; Jupyter Notebook.
Мы предлагаем:
- все официально: оформление в штат, оклад + бонусы;
- просторный светлый офис в БЦ "Новоспасский Двор" (15 мин. от м. Павелецкая / Пролетарская / Крестьянская Застава);
- ДМС после года работы;
- гибридный формат работы;
- пятидневная рабочая неделя с понедельника по пятницу, а удобное время начала и окончания рабочего дня можно согласовать с руководителем;
-
в нашей компании регулярно проходят корпоративные мероприятия, тимбилдинги и совместные активности как в офисе, так и за его пределами. Мы любим устраивать тематические дни и участвовать в спортивных событиях.