[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shimbun] Can't read slashdot
>> On Fri, 16 Nov 2001 11:18:26 +0900
>> 「山」== yamaoka@namazu.org (Katsumi Yamaoka) said as follows:
>>>>> In [emacs-w3m : No.02248]
>>>>> Katsumi Yamaoka <yamaoka@jpl.org> wrote:
山岡> やっと動き始めたところで大問題発生です。
山> この件ですが、html ソースを見るとフォロー記事の cid と author が入
山> るべき場所が空欄になっているので、しばらく様子を見ようと思うんです
山> が、いかがでしょう?
どうやら改善されたようですよ。slashdot の構造はまったく把握していない
ので、あてずっぽうですが、
(with-temp-buffer
(w3m-retrieve "http://slashdot.jp/article.pl?sid=01/11/19/1026230&mode=thread")
(let (list from date url)
(while (re-search-forward
"<A HREF=\"\\(http://slashdot\\.jp/comments\\.pl\\?sid=[0-9]+&cid=[0-9]+\\)\">"
nil t)
(let ((url (match-string 1)) (pos (point)) from date)
(forward-line 0)
(when (looking-at " *\\([A-Za-z]+ [A-Za-z]+ [0-9]+, \\@[0-9][0-9]:[0-9][0-9]\\(AM\\|PM\\)\\)")
(setq date (match-string 1)))
(forward-line -2)
(when (looking-at "<A HREF=\"mailto:\\([^\"]*\\)\">")
(setq from (match-string 1)))
(goto-char pos)
(push (list url from date) list)))
(nreverse list)))
みたいのでいけそうです。
山> v1.3 は BUGS.ja に言い訳を書いて、取りあえず出してしまう、と。
この辺はお任せします。
--
土屋 雅稔 ( TSUCHIYA Masatoshi )