HTMLのドキュメントから繰り返し部分をみつける - bits and bytes

RSSを生成していないページからRSSを生成するなんでもRSS 0.1bは、公開されているJSAI2005: なんでもRSS - HTML文書からのRSS自動生成によると、日付情報を目印にしてそのHTMLドキュメントの構造を推測して、各エントリ(item要素)のタイトルと本文を単語の統計的に処理して決定し、フィードを生成していると書かれています。 ウェブ上にあるHTMLドキュメントは Ask.jp : "xml" Search re...

HTMLのドキュメントから繰り返し部分をみつける - bits and bytes
http://labs.gmo.jp/blog/ku/2007/11/html.html のスクリーンショット
URL:
http://labs.gmo.jp/blog/ku/2007/11/html.html
注目:
labs.gmo.jp の注目エントリー
カテゴリ:
コンピュータ
キーワード:
Ask.jp Bookmarklet cybozu MediaWiki Mozilla Developer Center MozillaZine XMLHTTPRequest XSLT なんでもRSS タグクラウド
タグ:
はてなスター:

はてなブックマークは無料のソーシャルブックマークサービスです。はてなにログインすると、このページにコメントしたりブックマークしたりすることができます。

このエントリーをブックマークしているユーザー (68 +17) RSS

はてなダイアリー このエントリーを含む日記 (4)