[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: [shimbun] Can't read slashdot



>> On Fri, 16 Nov 2001 11:18:26 +0900
>> 「山」== yamaoka@namazu.org (Katsumi Yamaoka) said as follows:

>>>>> In [emacs-w3m : No.02248]
>>>>>	Katsumi Yamaoka <yamaoka@jpl.org> wrote:

山岡> やっと動き始めたところで大問題発生です。

山> この件ですが、html ソースを見るとフォロー記事の cid と author が入
山> るべき場所が空欄になっているので、しばらく様子を見ようと思うんです
山> が、いかがでしょう?

どうやら改善されたようですよ。slashdot の構造はまったく把握していない
ので、あてずっぽうですが、

(with-temp-buffer
  (w3m-retrieve "http://slashdot.jp/article.pl?sid=01/11/19/1026230&mode=thread")
  (let (list from date url)
    (while (re-search-forward
	    "<A HREF=\"\\(http://slashdot\\.jp/comments\\.pl\\?sid=[0-9]+&cid=[0-9]+\\)\">"
	    nil t)
      (let ((url (match-string 1)) (pos (point)) from date)
	(forward-line 0)
	(when (looking-at " *\\([A-Za-z]+ [A-Za-z]+ [0-9]+, \\@[0-9][0-9]:[0-9][0-9]\\(AM\\|PM\\)\\)")
	  (setq date (match-string 1)))
	(forward-line -2)
	(when (looking-at "<A HREF=\"mailto:\\([^\"]*\\)\">")
	  (setq from (match-string 1)))
	(goto-char pos)
	(push (list url from date) list)))
    (nreverse list)))

みたいのでいけそうです。

山> v1.3 は BUGS.ja に言い訳を書いて、取りあえず出してしまう、と。

この辺はお任せします。

-- 
土屋 雅稔  ( TSUCHIYA Masatoshi )