Генератор парсеров BrowserExt

О сервисе

C помощью данного сервиса вы можете сгенерировать программу-парсер для сбора данных с веб-страниц. Сгенерированная программа может собирать текст, изображения и файлы. Программа генерируется на основе скрипта, описывающего действия парсера (правила парсинга). Скрипт можно написать вручную или визуально задать правила парсинга с помощью "встроенного браузера".

С помощью правил парсинга и правил экспорта вы задаете алгоритм парсинга в общем упрощенном виде, не заботясь о рутинных операциях. Так как алгоритм парсинга задается пользователем, то вы можете создать парсер практически для любого сайта или интернет-магазина, т.е. можно реализовать, например парсер товаров или парсер статей. Сгенерированные программы можно устанавливать на сервер для постоянной работы, например для мониторинга цен поставщиков.

В зависимости от команд, использованных в скрипте, сгенерированный парсер имеет следующие возможности:

  • поддержка как однопоточной, так и многопоточной загрузки страниц, возможность выставить задержку при загрузке
  • поддержка cookies, возможность веб-авторизации на сайте
  • поддержка списка прокси серверов
  • возможность извлекать данные как при помощи xpath, так и при помощи регулярных выражений
  • возможность сохранения изображений и файлов
  • возможность заполнять формы и отправлять данные на сервер
  • возможность экспортировать собранные данные в CSV, XML, SQL или любой другой текстовый формат, также поддерживается экспорт в Excel
  • скрипт поддерживает команды фильтрации данных перед экспортом
  • возможность работать с mysql базой данных

Генерируемая программа распространяется по MIT лицензии, т.е. вы можете свободно изменять, дополнять и распространять ее.

Если сгенерированный парсер не удовлетворяет вашим требованиям, мы можем доработать его за дополнительную плату, величина которой зависит от сложности доработки. Возможно это будет бесплатно. По всем вопросам обращайтесь к Администрации сайта с помощью раздела "Сообщения", который доступен зарегистированным пользователям, или через раздел "Контакты".