Cbonds – международная IT-компания, специализирующаяся на финансовых рынках. Мы собираем и агрегируем информацию о рынке ценных бумаг по всему миру, предоставляя ее пользователям через информационный сайт Cbonds и в виде базы данных.
С 2020 года мы являемся резидентами технопарка Сколково, активно развиваем нашу ИТ-платформу, внедряем технологии искусственного интеллекта и машинного обучения.
Наши клиенты – финансовые институты: банки, управляющие компании, брокеры, страховые компании и частные инвесторы.
Мы ищем PHP-разработчика, который будет разрабатывать и поддерживать парсеры с активным использованием AI и LLM (ChatGPT, DeepSeek, Qwen и др.).
Вам предстоит работать с Puppeteer, Playwright, Hero browser, интегрировать LLM API для обработки текста и применять OCR-решения для извлечения данных из изображений и PDF.
Основные задачи:
- Разработка и поддержка парсеров на PHP 8+
- Интеграция LLM (OpenAI API, DeepSeek, Qwen и др.) для:
- - Обработки неструктурированных текстовых данных
- - Улучшения качества распознавания изображений (OCR)
- Работа с Puppeteer, Playwright, Hero browser (Headless Chrome/Chromium)
- Парсинг через DOM, XPath, RegExp
- Парсинг данных из API (REST/SOAP, GraphQL)
- Оптимизация производительности парсеров
Для нас важно:
- PHP 8+ (ООП, типизация)
- Практическое применение LLM API (OpenAI, DeepSeek и др.)
- Опыт работы с регулярными выражениями (сложные паттерны, PCRE)
- Понимание протоколов HTTP/FTP (headers, cookies, sessions, CORS, прокси)
- Опыт работы с библиотеками для парсинга данных (Guzzle, Symfony HttpClient)
- Опыт с Puppeteer/Playwright/Hero (или готовность быстро освоить)
- Опыт обхода CAPTCHA, antibot-систем
Будет преимуществом:
- Знание Node.js для эффективной работы с Puppeteer/Playwright/Hero
- Базовые знания Python
- Базовые знания SQL, опыт работы с MySQL
- Опыть работы с MongoDB
- Навыки работы с OCR (Tesseract или облачные API)
- Понимание Docker и CI/CD
Мы предлагаем:
- Фиксированный оклад + бонусная система по результатам спринта
- Оформление по ТК КР
- Ежегодная индексация зарплаты
- Бесплатные курсы иностранных языков
- ДМС
- Гибридный или удаленный формат работы
- Компенсация питания и спорта;
- Корпоративная финансовая библиотека и библиотека Mybook;
- Программа «Приведи друга»;
- Корпоративные мероприятия и поздравление с ДР сотрудника.