Генератор парсеров BrowserExt

Редактор скрипта

Редактор скрипта используется для создания и редактирования скрипта будущего парсера. Скрипт можно запускать для тестирования прямо в вашем браузере, однако так он выполняется с некоторыми ограничениями. Поддерживается подсветка синтаксиса и автодополнение.

ScraperLab Script является предметно-ориентированным языком, предназначенным для парсинга веб-страниц. Он имеет специальные конструкции и функции для упрощения парсинга.

С помощью ScraperLab Script можно:

  • загружать html страницы сайта, как методом GET, так и методом POST. Поддерживается вложенная загрузка страниц
  • устанавливать заголовки при загрузке страниц, в том числе и cookies
  • получать данные при помощи xpath или регулярных выражений
  • добавлять ссылки в очередь загрузки, организуя тем самым обход нескольких страниц
  • сохранять изображения или файлы по ссылке
  • сохранять текстовые данные в одном из экспортируемых форматов: CSV, XML, Excel или SQL
  • фильтровать собранные данные
  • генерировать ссылки по шаблону для последующей загрузки
  • работать с mysql базой данных
userint2-ru-small.jpg