何故か (RSS でない) slashdot-jp が動かないので、slashdot-jp を sb-rss.el で動かそうとしてみたんですが、ちょっと変な動きをします (しば らく debug していたんですが、どうにも原因が分かりません)。 (1)"\n<!-- start template: ID [0-9]+,.*dispStory.* -->\n" と "\n<!-- end template: ID [0-9]+,.*dispStory.*-->\n" を始点、終点と して記事を切取ると euc-jp を utf-8 と誤判定してしまいます (これは Emacs のせい?)。切取らないと誤判定しませんが、余分なものが沢山見え ます。 (2)slashdot-jp-rss.story フォルダ (グループ) を再読み込みすると、同一 記事を新記事と認識して重複して記事を作ってしまいます。何故か重複す るのは 1 度だけで、後は何度読み直しても重複しません。 その他、RSS だけではコメントを追うことができないので、root 記事だけし か見ることができません。 sb-rss.el も少し直しました。url を shimbun-decode-entities-string で処 理するのと、message-id を早目に作って既存の記事の id と重なっていたら以 降の処理をしないようにしました。
Attachment:
sb-slashdot-jp-rss.el
Description: Binary data
Attachment:
sb-rss.el
Description: Binary data
-- 中島幹夫 <minakaji@namazu.org> home: http://www.asahi-net.or.jp/~gy2m-nkjm diary: http://slashdot.jp/journal.pl?op=display&uid=5767