[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: sb-rss.el



  何故か (RSS でない) slashdot-jp が動かないので、slashdot-jp を
sb-rss.el で動かそうとしてみたんですが、ちょっと変な動きをします (しば
らく debug していたんですが、どうにも原因が分かりません)。

(1)"\n<!-- start template: ID [0-9]+,.*dispStory.* -->\n" と
   "\n<!-- end template: ID [0-9]+,.*dispStory.*-->\n" を始点、終点と
   して記事を切取ると euc-jp を utf-8 と誤判定してしまいます (これは
   Emacs のせい?)。切取らないと誤判定しませんが、余分なものが沢山見え
   ます。

(2)slashdot-jp-rss.story フォルダ (グループ) を再読み込みすると、同一
   記事を新記事と認識して重複して記事を作ってしまいます。何故か重複す
   るのは 1 度だけで、後は何度読み直しても重複しません。

その他、RSS だけではコメントを追うことができないので、root 記事だけし
か見ることができません。

sb-rss.el も少し直しました。url を shimbun-decode-entities-string で処
理するのと、message-id を早目に作って既存の記事の id と重なっていたら以
降の処理をしないようにしました。

Attachment: sb-slashdot-jp-rss.el
Description: Binary data

Attachment: sb-rss.el
Description: Binary data

-- 
中島幹夫 <minakaji@namazu.org>
home: http://www.asahi-net.or.jp/~gy2m-nkjm
diary: http://slashdot.jp/journal.pl?op=display&uid=5767