[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: sb-yahoo.el
- From: "SHIBUYA Hirohisa" <debagame29@xxxxxxxxxxx>
- Date: Fri, 20 May 2005 20:15:00 +0900
- X-ml-name: emacs-w3m
- X-mail-count: 08090
>山岡> 残念ながら sb-yahoo.el はテキストだけを扱うように設計されている
>山岡> ようです。そのうち時間を作って、作り直してみようと思いますが。
>
> > あ、日本語が足らなかったようで、こちらのほうは問題としておりません。
> > テキストのみのものと理解しています。
>
>ぼくの誤解だったわけですが、sb-yahoo はもともと html で記事を生
>成していたので問題無いだろうと思いまして、sb-text の継承をやめま
>した。ところが思わぬ伏兵がいて、yahoo は画像の content type を
>text/plain だという場合がままあるようなので、shimbun.el にも手を
>入れて、それらを正しく取り込めるように対策しました。
あ、実はsb-yahoo.elの
(luna-define-class shimbun-yahoo (shimbun shimbun-text) ()) を
(luna-define-class shimbun-yahoo (shimbun-japanese-newspaper shimbun-text)
())
と書き換えて(なぜそうなるのかは知りませんが)text/plainとして記事を取ってい
たので
ちょっとショックかも…(^ ^; 贅沢は言いませんが
>;; 次は yomiuri...
少し自分で書いてみました。大して役に立たないかもしれませんが
付け加えておきます。
--- sb-yomiuri.el.~3~ 2005-05-17 22:56:58.000000000 +0900
+++ sb-yomiuri.el 2005-05-19 07:50:26.000000000 +0900
@@ -57,81 +57,27 @@
"\\(%s/news/"
;; 2,3. serial number
"\\(20[0-9][0-9][01][0-9][0-3][0-9]\\)\\([0-9a-z]+\\)"
- "\\.htm\\)"
- "\">" s0
- ;; 4. subject
- "\\(" no-nl "\\)"
- s0 "("
- ;; 5. month
- "\\([01]?[0-9]\\)"
- "/"
+ "\\.htm\\)\"" s1
+ "class=\"h\">" s0
+ ;; 4. subject
+ "\\(" no-nl "\\)"
+ s0
+ "</a>"
+ " " s0
+ ;; 5. month
+ "(\\([01]?[0-9]\\)"
+ "月"
;; 6. day
- "\\([0-3]?[0-9]\\)"
- s1
- ;; 7. hour:minute
- "\\([012][0-9]:[0-5][0-9]\\)"
- ")" s0 "</a>")
+ "\\([0-3]?[0-9]\\)日"
+ s1
+ ;; 7. hour:minute
+ "\\([012][0-9]:[0-5][0-9]\\)"
+ ")" s0 "")
1 2 3 4 5 6 7)))
- `(("business" "経済" "index.htm" ,@default)
- ("culture" "芸能・文化" "index.htm" ,@default)
- ("editorial" "社説・コラム" "index.htm"
- ,(concat "<a" s1 "href=\"/"
- ;; 1. url
- "\\(%s/news/"
- ;; 2,3. serial number
- "\\(20[0-9][0-9][01][0-9][0-3][0-9]\\)\\([0-9a-z]+\\)"
- "\\.htm\\)"
- "\">" s0
- ;; 4. month(ja)
- "\\([01]?[0-9]\\)"
- "月"
- ;; 5. day(ja)
- "\\([0-3]?[0-9]\\)"
- "日付・"
- ;; 6. subject
- "\\(" no-nl "\\)"
- s0 "</a>")
- 1 2 3 6 4 5)
- ("kyoiku" "教育メール" "index.htm"
- ,(concat "<a" s1 "href=\"/"
- ;; 1. url
- "\\(%s/\\(?:[^\"/]+/\\)+"
- ;; 2,3. serial number
- "\\(20[0-9][0-9][01][0-9][0-3][0-9]\\)\\([0-9a-z]+\\)"
- "\\.htm\\)"
- "\"[^>]+>" s0
- ;; 4. subject
- "\\([^<]+\\)"
- "\\(?:" s0 "<[^>]+>\\)+" s0
- ;; 5. month
- "\\([01]?[0-9]\\)"
- "月\\(?:" s0 "<[^>]+>\\)+" s0
- ;; 6 day
- "\\([0-3]?[0-9]\\)"
- "日")
- 1 2 3 4 5 6)
+ `(("atmoney" "経済" "index.htm" ,@default)
("national" "社会" "index.htm" ,@default)
- ("obit" "おくやみ" "index.htm"
- ,(concat "<a" s1 "href=\"/"
- ;; 1. url
- "\\(%s/news/"
- ;; 2,3. serial number
- "\\(20[0-9][0-9][01][0-9][0-3][0-9]\\)\\([0-9a-z]+\\)"
- "\\.htm\\)"
- "\">" s0
- ;; 4. subject
- "\\(" no-nl "\\)"
- s0 "("
- ;; 5. month
- "\\([01]?[0-9]\\)"
- "/"
- ;; 6. day
- "\\([0-3]?[0-9]\\)"
- ")" s0 "</a>")
- 1 2 3 4 5 6)
("politics" "政治" "index.htm" ,@default)
("science" "科学" "index.htm" ,@default)
- ("sports" "スポーツ" "index.htm" ,@default)
("world" "国際" "index.htm" ,@default)))
"Alist of group names, their Japanese translations, index pages,
regexps and numbers.
_________________________________________________________________
MSN Hotmailで開運メルアド占い実施中
http://promotion.msn.co.jp/hotmail/fortune/input_un.asp