parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

Пособие по сборке Parser. V.0.1.

ALex_P 26.08.2007 03:18 / 26.08.2007 03:22

с вашего позволения я все-таки начну пособие по сборке парсера из исходных кодов.
Надеюсь сэкономить этим множество времени тех, кто делает это в первый-второй раз.
Не претендую на правильность описания и терминологии и прошу высказать замечания и дополнения.
Прошу также ответить на вопросы в тексте.

_________________________________
СБОРКА Parser из исходных кодов

страница о сборке Parsera в документации

Вам придется самим собирать Parser из файлов с исходным кодом в случае, если в разделе "скачать" не окажется готового parsera для вашей операционной системы (или скачанный parser не захочет работать на вашем сервере). Также вы можете пожелать собрать parser с особыми настройками (например, без запрета читать файлы, принадлежащие другим владельцам и др.).

Итак, сборка по шагам:

0. подготовка
Для сборки вам потребуется shell-доступ (и программа Putty или подобная). Кроме того, вы должны обладатать определенными правами на сервере (ВопросА: какими?)

Внимание: Если до этого вы уже делали сборку, то прежде, чем начать новую, не забудьте выполнить команду make clean в папке с исходными файлами, чтобы удалить прежние настройки.

1. Закачка
Скачайте к себе на сервер файлы с исходным кодом:
Создайте для удобства папку, где будете собирать parser, например, parser_compile и загрузите файлы с cvs с помощью следующих команд:
mkdir parser_compile
cd parser_compile
cvs -d :pserver:anonymous@cvs.parser.ru:/parser3project login

При подключении к cvs-серверу вы получите запрос "enter password". Пароль пустой, т.е. вам нужно просто нажать Enter.

cvs -d :pserver:anonymous@cvs.parser.ru:/parser3project get parser3
cd parser3

2. Конфигурация сборки.

Для конфигурации сборки выполните команду ./configure. В этом случае parser будет собран "по-умолчанию". Можно также указать специальные ключики:

a) сборка с разрешением читать файлы, принадлежащие другому владельцу
./configure ----disable-safe-mode

б) .... (ВопросБ: может кто-нибудь грамотно написать, какие еще возможны опции и зачем они нужны?)

Примечание: Для автоматизации сборки возможно также использование специальных скриптов.
Вместе с исходными кодами поставляются скрипты buildall-with-xml и buildall-without-xml. Запустите тот или другой, чтобы собрать parser соответственно с поддержкой xml или без поддержки xml.

(ВопросВ: если есть эти скрипты, то в каких случаях их не нужно использовать, а нужно запускать /configure и т.д.? кроме того, у меня лучше сработал скрипт от Sumo. МОжет, его включить в комплект?)

Если все прошло удачно при запуске ./configure (ВопросГ: а как определить, что все прошло удачно?), то вы можете перейти к п.4 Сборка

3. Проблемы конфигурации
Ниже перечислены варианты решений известных проблем при конфигурировании сборки:

а...
б...

(ВопросД: прошу указать конкретные закавыки и конкретные пути решений)

4. Сборка
Запустите сборку командами:
make
make install

Если сборка пройдет удачно, в папке parser3install/bin/ вы найдете файл parser3, auto.p.dist

5. Проблемы при сборке.
Ниже перечислены варианты решений известных проблем при сборке.

а....
б....

(ВопросЕ: прошу указать конкретные закавыки и конкретные пути решений)

6. Размещение файлов.
При сборке parser по умолчанию собирается с отладочной информацией (ВопросЖ: зачем по умолчанию отладочная информация?), поэтому размер файла получается в несколько раз больше. Чтобы его уменьшить, запустите команду:
strip parser3

Поместите файл parser3 в папку cgi-bin и для удобства переименуйте его в parser3.cgi
В эту же папку поместите копию файла auto.p.dist под именем auto.p (оставьте неизменным auto.p.dist на будущее, чтобы восстановить при необходимости настройки по умолчанию)

В эту же папку cgi-bin поместите папку с файлами кодировок charsets. (при сборке parsera эта папка создается в папке parser3install/etc)

В эту же папку cgi-bin поместите папку lib с файлами драйверов для подключения к базам данных. Файлы драйверов вы можете скачать в разделе "downloads" либо собрать у себя на сервере, получив их с помощью команды (для mysql):
cvs -d :pserver:anonymous@cvs.parser.ru:/parser3project get sql/mysql
и затем собрав:
./configure
make
make install

В папке cgi-bin поменяйте права на файл parser3.cgi на 755 и поменяйте владельца этих файлов на владельца файлов вашего сайта.

Для проверки работоспособности parsera скачайте тестовый пример из раздела "скачать", поместите в корень сайта файл _test.html и из этой папки запустите:
/папка/где/cgi-bin/parser3.cgi _test.html
_____________________________________
Дополнения и замечания приветствуются