parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

Гуглю варианты на перле

Aaron 22.04.2010 04:12

Пока что-то не очень с результатами,
но сделал так, чтобы скрипт отдавал уже title - теперь нет необходимости матчить в парсере, но проблема с кодировками остаётся.
#!/usr/bin/perl

use LWP::UserAgent;
#use Encode;

my $max_size   = 2048;		# размер в байтах
my $field_name = $ARGV[0];	# URL
my $ua = LWP::UserAgent->new;
$ua->agent('Mozilla/5.0');
my $req = HTTP::Request->new('GET' => $field_name);
#$ua->max_size($max_size);
my $res = $ua->request($req, \&callback, 512);
my $size = 0;
my $res_content;

sub callback {
	my($data, $response, $protocol) = @_;
	$size = $size + length($data);
	$res_content .= $data;
	if($size >= $max_size) { die; }
}

$p = HTML::HeadParser->new;
$p->parse($res_content);

print $p->header('title');