Санкт-Петербург, проспект Энергетиков, 8к2
О нас — кто мы и зачем нам эта роль
Мы развиваем платформы ad.media и dooh.ru — одни из крупнейших каталогов рекламных площадок в Рунете. Рекламодатели приходят к нам, чтобы быстро найти нужную площадку: билборды, ситиборды, digital-экраны, медиафасады, транзит. Собственники конструкций — чтобы получить поток клиентов.
Наша сила — в данных. Чем полнее и точнее наш каталог, тем быстрее клиент находит то, что ищет. Именно поэтому нам нужен человек, который умеет добывать данные из интернета — системно, автоматически и аккуратно.
Это не разовая задача. Мы строим живой, постоянно обновляемый каталог, и вы станете частью этого процесса.
Чем будете заниматься
Парсинг и автоматизация — основа работы
Писать и поддерживать Python-скрипты для сбора данных о рекламных конструкциях с сайтов собственников, открытых реестров и каталогов
Обходить типичные защиты: динамический контент (Selenium, Playwright), ротация прокси, заголовки, куки, пагинация
Настраивать расписание запуска, обработку ошибок и логирование — чтобы скрипты работали без вашего участия
Интегрировать результаты парсинга в таблицы и основную базу данных
Качество и актуальность данных
Приводить собранные данные к единому формату: тип конструкции, город, адрес, собственник, формат, контакты
Следить за актуальностью базы, запускать обновления при изменениях на источниках
Использовать ИИ-инструменты (ChatGPT, Claude) для ускорения ручной обработки и помощи коллегам
Главный критерий результата: не просто собрать данные, а отдать чистый, готовый к использованию файл, который сразу идёт в работу.
Что важно
Обязательно
Реальный опыт написания парсеров на Python: BeautifulSoup, Scrapy, Selenium — хотя бы 2–3 рабочих проекта
Уверенное понимание HTML/CSS: DevTools, правильный селектор — это ваша повседневность
Работа с Google Sheets и Excel: сводные таблицы, фильтры, формулы
Самостоятельность: получили задачу — разобрались со структурой сайта и сдали результат без надзора
Внимательность к деталям: пропущенный телефон или неверный адрес — это брак
Будет плюсом
Опыт работы с API (REST, JSON, Postman)
Playwright или Puppeteer (Node.js)
Работа с прокси и ротацией User-Agent
Опыт в рекламной отрасли или outdoor-рекламе
Условия
📍 Формат
Удалённо, полная свобода в расписании
⏰ Занятость
Частичная — договариваемся по задачам и результату
💬 Как работаем
Задача → самостоятельная реализация → сдача чистого результата
🚀 Инструменты
Python, Selenium / Playwright, Google Sheets, ИИ-инструменты
МАГНИТ, Розничная сеть
Санкт-Петербург
Не указана