HTML::TreeBuilderによるパース(解析結果をdump)
ここでは、取得したHTTPメッセージのbody部分に含まれるHTMLを解析して結果を全てdumpする方法を説明します。
HTTPクライアントサンプル
以下にHTTP::LiteとHTTP::TreeBuilderを利用したクライアントを示します。
dumpは非常に簡単です。 HTMLの解析(parse)を終了したHTML::TreeBuilderに対してdump()を実行したものをprintするだけです。 dump()を行うと、解析後のデータが持つ階層構造がわかるので、デバッグなどに重宝します。
#!/usr/bin/perl
use HTTP::Lite;
use HTML::TreeBuilder;
$http = new HTTP::Lite;
# URL部分を変更して下さい
$req = $http->request("http://www.hogehogeURL.com/") || die $!;
$body = $http->body();
$tree = HTML::TreeBuilder->new;
$tree->parse($body);
$tree->eof();
# 内容をdumpする
print $tree->dump();
exit;