Генератор парсеров BrowserExt

gettext

Получает текстовое содержимое по заданному xpath. Допустимо только внутри loadpage.

var = gettext(xpath[, options = dict()]);
    

Параметры:

xpath Строка с xpath-выражением, определяющим адрес узла.
options Словарь параметров. Может содержать следующие элементы:
nodeonly Если этот параметр установлен в 'true', то gettext будет возвращать текстовые узлы, которые непосредственно принадлежат запрашиваемому узлу. В противном случае возвращается текст, состоящий из всех текстовых узлов всех вложенных элементов. Смотрите пример1.
next Если этот параметр установлен в 'true', то gettext будет возвращать текстовое содержимое узла, следующего за запрашиваемым узлом. Смотрите пример 1.
word Целое число, задающее номер слова, которое будет возвращено. Слова отсчитываются с единицы. Если надо вернуть несколько слов, то этот параметр используется совместно с wordend. Смотрите пример 1.
wordend Целое число, задающее номер последнего слова, которое будет возвращено. Таким образом будет возвращена строка, состоящая из слов, начиная с позиции word и заканчивая позицией wordend. Смотрите пример 1.
join Если задан этот параметр, то gettext соединит все элементы результирующего массива в одну строку, используя разделитель, заданный в качестве значения параметра. Результатом будет являться массив с одним элементом - строкой.
replace Если задан этот параметр, то будет производиться замена строки, заданной регулярным выражением на другую строку. В качестве значения параметра должен задаваться массив, состоящий из двух элементов: первый - регулярное выражение для поиска, второй - строка, на которую заменить. Пример: array('/\d*/', '') - находит все числа в строке и убирает их.
html С помощью этого параметра можно передать html код, тогда функция будет искать элементы по xpath в этом html коде, а не в загруженной странице.

Возвращаемое значение: массив строк.

Пример 1. Пусть есть html-страница c адресом http://test.com/test.html, содержащая следующий код:

<html>
<body>
<div id="123">
    text1
    <div>text2</div>
    <div>text3</div>
</div>
<div>345</div>
<div id="678">one two three four</div>
</body>
</html>

Посмотрим как действуют разные значения словаря options: