Генератор парсеров BrowserExt

Встроенный браузер

С помошью "встроенного браузера" можно визуально создать скрипт парсера, если сайт разрешает загружать себя во фрейм. Как в обычном браузере вы указываете адрес страницы сайта и после загрузки мышкой отмечаете данные, которые нужно собрать со страницы. После установки необходимых параметров вы переходите в режим редактирования скрипта, и на основе объектов "встроенного браузера" генерируется скрипт парсера на языке ScraperLab Script. Можно переключаться между "встроенным браузером" и режимом редактирования скрипта.

С помощью "встроенного браузера" можно:

  • задавать правила парсинга текста, ссылок, ссылок на картинки, сразу получая xpath элементов
  • задавать параметры правил парсинга, например сохранение картинок и файлов по ссылкам, добавление ссылок в очередь загрузки
  • группировать правила парсинга
  • настраивать экспорт заданных правил парсинга
  • объединять несколько правил парсинга, чтобы парсить списки или таблицы
  • задавать загрузку для правил парсинга ссылок, т.е. загрузка и переход на другую страницу с возможностью задавать правила для нее. Этим реализуется вложенная загрузка страниц, когда парсится ссылка, загружается страница по этой ссылке и производится парсинг уже этой страницы по своим правилам
  • изменять xpath у правил
  • просматривать и выбирать элементы в html-дереве загруженной страницы
Внимание! "Встроенный браузер" не корректно работает в Internet Explorer, т.к. он не поддерживает выполнение xpath. Рекомендуем вам использовать Firefox, Chrome или Opera.
userint1-ru-small.jpg