Генератор парсеров BrowserExt

getregexp

Получает текст со страницы в соответстии с регулярным выражением. Допустимо только внутри loadpage.

var = getregexp(pattern, [options = dict()]);
    

Параметры:

pattern Шаблон регулярного выражения.
options Словарь параметров. Может принимать следующие значения:
resultind Определяет массив значений какой группы возвращать. 0 - массив всех полных вхождений, 1 - массив всех вхождений первой подмаски и т.д. По-умолчанию равен 0.
html С помощью этого параметра можно передать html код, тогда функция будет искать регулярное выражение в этом html коде, а не в загруженной странице.

Возвращаемое значение: var является массивом.

Если необходимо получить текст из произвольной строки, то необходимо использовать функцию regexp.

Пример 1. Пусть есть html-страница c адресом http://test.com/test.html, содержащая следующий код:

<html>
<body>
<a href="http://test.com/1.html">one</a>
<a href="http://test.com/2.html">two</a>
<a href="http://test.com/3.html">three</a>
</body>
</html>

Получим все <a> с помощью регулярного выражения: