parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

^match и разные кодировки

Aaron 22.04.2010 03:09

Предыдущая тема с загрузкой перлом первого кб странички решена.

Но теперь появилась другая - разные кодировки.
Парсер настроен на utf-8 в auto.p (и $response:charset и $request:charset)

Если скачиваемая страничка не utf-8, а windows-1251, вылетает ошибка
UTF-8 validation failed during pcre_exec (-10)
Логически, решение должно быть, т.к. поисковые пауки-то как-то определяют кодировку и работают с ней.