[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shimbun] Can't read slashdot
>>>>> In [emacs-w3m : No.02225]
>>>>> Katsumi Yamaoka <yamaoka@jpl.org> wrote:
山岡> すごいコードだ! sb-slashdot-jp.el。
山岡> 寺西さんの十倍時間がかかると思うけれど、自分の今後のためにいじら
山岡> せてもらいます。
もう十倍なんてとっくに越えてしまったな。^^;;
やっと動き始めたところで大問題発生です。
(let ((buffer (get-buffer-create "*followups*"))
(case-fold-search t))
(pop-to-buffer buffer)
(erase-buffer)
(insert-buffer (shimbun-retrieve-url-buffer
"http://slashdot.jp/search.pl?op=comments&start=1"
t))
(re-search-forward "<A HREF=\".*/comments.pl.*/article.pl\\?sid="
nil t)
(beginning-of-line))
この式を eval すると、フォロー記事と元記事のリストが現れます。
こんな感じです。↓
フォロー記事
元記事
フォロー記事
元記事
さてここで、同じ元記事へのフォローが複数あった場合に、それぞれの
HREF= の値が同じなので、uniqueness を確保する手立てがありません。
というか、複数のフォロー記事が一つのページにまとめられているので、
そのページを取り寄せなければ個々の記事の ID がわからないのですね。
どうしましょ?
;; 現在 T-gnus の nnshimbun では一通だけフォロー記事が読めます。
取り寄せてしまう手もあるとは思いますが、すでに読んでしまったもの
も含まれるので無駄なトラフィックが発生するし、時間もばかにならな
いでしょう。
他に、slashdot.jp が付けたフォロー記事の時刻がおかしい、フォロー
記事の作者を知るにはやはり全部取り寄せないとわからない、という問
題もあります。
いちおう、改造した sb-slashdot-jp.el を、CVS commit する代わりに
ftp://ftp.jpl.org/pub/tmp/ に置いておきますね。
;; たぶん業界でおふれが出回っているんですよ。
;; 「近ごろ広告を見ずに記事だけ持って行くやからがいますので注意
;; して下さい。対策方法として以下に示すやり方を推奨します...」
--
Katsumi Yamaoka <yamaoka@jpl.org>