HTML::Feature、木構造を利用したHTML文書からの本文抽出用Perlモジュール
http://search.cpan.org/~miki/HTML-Feature-2.0.2/
http://d.hatena.ne.jp/download_takeshi/20071026/1193410600
なるほどなるほど。すばらしいですね。
結局のところ、スコア付けする部分が難しいですよね。
関連記事
- HTML::Feature::Engine::TsubuanLike
http://search.cpan.org/~miki/HTML-Feature-2.0.2/
http://d.hatena.ne.jp/download_takeshi/20071026/1193410600
なるほどなるほど。すばらしいですね。
結局のところ、スコア付けする部分が難しいですよね。
関連記事