Генератор парсеров BrowserExt

Режим экспорта

В режим экспорта можно переключиться нажав вкладку "Экспорт" справа в Редакторе. Он предназначен для создания и редактирования профилей экспорта.

export-ru-small.jpg

Всего существует три типа профилей экспорта - csv (csv, excel), не csv (xml, sql) и RDB.

У профилей csv-типа задается только порядок следования данных в строке или в таблице. У профилей не csv-типа задается шаблон, который применяется для каждой группы экспортируемых данных.

В настройках правил экспорта есть галочка "Записывать в файл" или "Записывать в БД", которая по-умолчанию установлена. Это значит, что сформированные данные будут записываться в файл или базу данных. Если ее снять, сформированные данные не будут записываться в файл или базу данных, их возвращает функция store.

Экспорт на основе шаблонов - XML и SQL

В шаблоне задаются параметры, которые при экспорте будут заменены данными. Параметр начинается со знака $ и заключается в фигурные скобки { и }. Например, {$title}. К параметру может применяться функция, например, {notencode($title)}. Xml и sql правила отличаются лишь способом, которым эскейпятся специальные символы. Все данные всегда сохраняются в кодировке utf-8.

Функции, допустимые в шаблонах экспорта

notencode(param)
Отменяет эскейпирование специальных символов. Данные записываются как есть.

Пример шаблона экспорта

<item>
<var1>{$var1}</var1>
<var2>{$var2}</var2>
<var3>{$var3}</var3>
</item>
    

Экспорт в реляционную базу данных - RDB

Экспорт RDB предназначен для записи собранных данных в предопределенную базу данных на основе заранее описанной схемы БД, например в Opencart. Пользователю предлагаются шаблоны наборов данных, состоящих из определенных полей. Обычно названия полей соответствуют названиям полей в админке CMS или интернет-магазина.

export-rdb1.jpg

Например, набор данных Category состоит из полей Category Name, Category Description, Language и т.д. При создании профиля экспорта всегда задается один набор данных.

Допустим есть страницы товара с его атрибутами. Схематично изобразим их так:

export-rdb2.jpg

Тогда набор данных будет выглядеть так:

Product
Language Product Name Product Price Product Specification
English Product1 100 Product Specification
Attribute Group Name Group Attributes
Group1 Group Attributes
Attribute1 Value1
Attribute2 Value2
English Product2 150 Product Specification
Attribute Group Name Group Attributes
Group1 Group Attributes
Attribute1 Value1
Group2 Group Attributes
Attribute3 Value3

Создадим профили экспорта для БД Opencart с наборами данных Product, Product Specification и Group Attributes. Назовем профили oc-product, oc-productspec и oc-attr соответсвенно. Причем два последних профиля будут служить для формирования данных в памяти и добавления к данным из oc-product для получения вложенности. Далее необходимо поставить в соответствие полям набора данных необходимые правила парсинга, причем необязательно заполнять все поля. В скрипте экспорт с помощью функции store будет выглядеть так: