Привет!
Мы команда, которая создаёт алгоритм поиска для всех продуктов 2ГИС. Помогаем миллионам наших пользователей быстро и точно находить фирмы, адреса, достопримечательности по всей России и многим странам зарубежья. Наш код работает и на мобильных устройствах
и на серверах. Чтобы поиск находил точнее, мы создаём системы анализа данных. Они помогают проверять и поддерживать качество работы поиска.
Задачи, которыми тебе предстоит заниматься
Данные задачи предполагается решать с помощью методов машинного обучения и nlp-подходов в частности.
-
Оценка качества работы поиска в рамках различных проектов, типов запросов, типов пользователей и т.п.
-
Исследования пользовательской активности в приложении при использовании функционала поиска:
-
Поиск аномалий в поисковой выдаче и определение их причин.
-
Оценивать эффективность и полезность выпущенных фич.
Для выполнения данных задач потребуется:
-
находить статистически обоснованные взаимосвязи, генерировать и проверять гипотезы в данных;
-
организовывать проведение AB тестов и анализировать их результаты;
-
придумывать метрики для оценки качества поиска и обосновывать их необходимость;
-
контролировать метрики и исследовать причины их роста или падения;
-
разрабатывать дашборды в Grafana и Power BI;
-
использовать в качестве инструментов разметки данных различные платформы: толока, tagme.
Навыки, необходимые для вакансии:
- умение писать сложные и быстрые SQL-запросы;
- хорошее знание Python, например, вы знаете чем отличается многопоточность от многопроцессорности и как обстоят с этим дела в питоне, знаете как улучшить производительности кода;
- опыт написания юнит-тестов;
- опыт работы с библиотеками типа numba будет плюсом;
- опыт обработки данных в Python (работа с библиотеками pandas, numpy, sklearn, работа с инструментами визуализации данных — matplotlib, seaborn, plotly);
- знаете основы машинного обучения: какие бывают задачи, метрики, что такое переобучение и как с ним бороться в моделях различного типа и т.п;
- знаете основы NLP (знакомы с различными методами сравнения текстов, с различными методами / моделями векторизации текстов;
- у вас есть опыт какой-либо задачи, связанный с обработкой естественного языка (классификация новостных текстов, поиск аномалий в большом массиве текстов и тп);
- можете написать код для обучения логистической регрессии на простых табличных данных;
- умеете работать с разметкой и проводить контроль качества данных (знакомы с методами агрегации ответов в разметке (MACE, Majority Vote и т.п.));
- знания теории вероятностей и статистики;
- умение работать в команде, а также самостоятельно искать и использовать всю необходимую информацию.
Почему у нас хорошо:
- мы аккредитованная IT –компания;
- само собой, полностью белая зарплата, размер которой обсуждаем на собеседовании;
- есть ДМС и все классические IT-плюшки;
- еще у нас можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, у нас есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске;
- для комфортной работы доставим всё, что нужно и организуем встречи с командой онлайн и офлайн.