[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: [shimbun] Can't read slashdot



>>>>> In [emacs-w3m : No.02225]
>>>>>	Katsumi Yamaoka <yamaoka@jpl.org> wrote:

山岡> すごいコードだ! sb-slashdot-jp.el。
山岡> 寺西さんの十倍時間がかかると思うけれど、自分の今後のためにいじら
山岡> せてもらいます。

もう十倍なんてとっくに越えてしまったな。^^;;
やっと動き始めたところで大問題発生です。

(let ((buffer (get-buffer-create "*followups*"))
      (case-fold-search t))
  (pop-to-buffer buffer)
  (erase-buffer)
  (insert-buffer (shimbun-retrieve-url-buffer
		  "http://slashdot.jp/search.pl?op=comments&start=1"
		  t))
  (re-search-forward "<A HREF=\".*/comments.pl.*/article.pl\\?sid="
		     nil t)
  (beginning-of-line))

この式を eval すると、フォロー記事と元記事のリストが現れます。
こんな感じです。↓

	フォロー記事
	元記事

	フォロー記事
	元記事

さてここで、同じ元記事へのフォローが複数あった場合に、それぞれの
HREF= の値が同じなので、uniqueness を確保する手立てがありません。
というか、複数のフォロー記事が一つのページにまとめられているので、
そのページを取り寄せなければ個々の記事の ID がわからないのですね。
どうしましょ?

;; 現在 T-gnus の nnshimbun では一通だけフォロー記事が読めます。

取り寄せてしまう手もあるとは思いますが、すでに読んでしまったもの
も含まれるので無駄なトラフィックが発生するし、時間もばかにならな
いでしょう。

他に、slashdot.jp が付けたフォロー記事の時刻がおかしい、フォロー
記事の作者を知るにはやはり全部取り寄せないとわからない、という問
題もあります。

いちおう、改造した sb-slashdot-jp.el を、CVS commit する代わりに
ftp://ftp.jpl.org/pub/tmp/ に置いておきますね。

;; たぶん業界でおふれが出回っているんですよ。
;; 「近ごろ広告を見ずに記事だけ持って行くやからがいますので注意
;;   して下さい。対策方法として以下に示すやり方を推奨します...」
-- 
Katsumi Yamaoka <yamaoka@jpl.org>