[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: sb-yahoo.el




>山岡> 残念ながら sb-yahoo.el はテキストだけを扱うように設計されている
>山岡> ようです。そのうち時間を作って、作り直してみようと思いますが。
>
> > あ、日本語が足らなかったようで、こちらのほうは問題としておりません。
> > テキストのみのものと理解しています。
>
>ぼくの誤解だったわけですが、sb-yahoo はもともと html で記事を生
>成していたので問題無いだろうと思いまして、sb-text の継承をやめま
>した。ところが思わぬ伏兵がいて、yahoo は画像の content type を
>text/plain だという場合がままあるようなので、shimbun.el にも手を
>入れて、それらを正しく取り込めるように対策しました。

あ、実はsb-yahoo.elの
(luna-define-class shimbun-yahoo (shimbun shimbun-text) ()) を
(luna-define-class shimbun-yahoo (shimbun-japanese-newspaper shimbun-text) 
())
と書き換えて(なぜそうなるのかは知りませんが)text/plainとして記事を取ってい
たので
ちょっとショックかも…(^ ^; 贅沢は言いませんが

>;; 次は yomiuri...

少し自分で書いてみました。大して役に立たないかもしれませんが
付け加えておきます。

--- sb-yomiuri.el.~3~	2005-05-17 22:56:58.000000000 +0900
+++ sb-yomiuri.el	2005-05-19 07:50:26.000000000 +0900
@@ -57,81 +57,27 @@
 	     "\\(%s/news/"
 	     ;; 2,3. serial number
 	     "\\(20[0-9][0-9][01][0-9][0-3][0-9]\\)\\([0-9a-z]+\\)"
-	     "\\.htm\\)"
-	     "\">" s0
-	     ;; 4. subject
-	     "\\(" no-nl "\\)"
-	     s0 "("
-	     ;; 5. month
-	     "\\([01]?[0-9]\\)"
-	     "/"
+	     "\\.htm\\)\"" s1
+ 	     "class=\"h\">" s0
+ 	     ;; 4. subject
+ 	     "\\(" no-nl "\\)"
+ 	     s0 
+	     "</a>"
+             "&nbsp;" s0
+ 	     ;; 5. month
+ 	     "(\\([01]?[0-9]\\)"
+	     "月"
 	     ;; 6. day
-	     "\\([0-3]?[0-9]\\)"
-	     s1
-	     ;; 7. hour:minute
-	     "\\([012][0-9]:[0-5][0-9]\\)"
-	     ")" s0 "</a>")
+	     "\\([0-3]?[0-9]\\)日"
+ 	     s1
+ 	     ;; 7. hour:minute
+ 	     "\\([012][0-9]:[0-5][0-9]\\)"
+ 	     ")" s0 "")
 	    1 2 3 4 5 6 7)))
-    `(("business" "経済" "index.htm" ,@default)
-      ("culture" "芸能・文化" "index.htm" ,@default)
-      ("editorial" "社説・コラム" "index.htm"
-       ,(concat "<a" s1 "href=\"/"
-		;; 1. url
-		"\\(%s/news/"
-		;; 2,3. serial number
-		"\\(20[0-9][0-9][01][0-9][0-3][0-9]\\)\\([0-9a-z]+\\)"
-		"\\.htm\\)"
-		"\">" s0
-		;; 4. month(ja)
-		"\\([01]?[0-9]\\)"
-		"月"
-		;; 5. day(ja)
-		"\\([0-3]?[0-9]\\)"
-		"日付・"
-		;; 6. subject
-		"\\(" no-nl "\\)"
-		s0 "</a>")
-       1 2 3 6 4 5)
-      ("kyoiku" "教育メール" "index.htm"
-       ,(concat "<a" s1 "href=\"/"
-		;; 1. url
-		"\\(%s/\\(?:[^\"/]+/\\)+"
-		;; 2,3. serial number
-		"\\(20[0-9][0-9][01][0-9][0-3][0-9]\\)\\([0-9a-z]+\\)"
-		"\\.htm\\)"
-		"\"[^>]+>" s0
-		;; 4. subject
-		"\\([^<]+\\)"
-		"\\(?:" s0 "<[^>]+>\\)+" s0
-		;; 5. month
-		"\\([01]?[0-9]\\)"
-		"月\\(?:" s0 "<[^>]+>\\)+" s0
-		;; 6 day
-		"\\([0-3]?[0-9]\\)"
-		"日")
-       1 2 3 4 5 6)
+    `(("atmoney" "経済" "index.htm" ,@default)
       ("national" "社会" "index.htm" ,@default)
-      ("obit" "おくやみ" "index.htm"
-       ,(concat "<a" s1 "href=\"/"
-		;; 1. url
-		"\\(%s/news/"
-		;; 2,3. serial number
-		"\\(20[0-9][0-9][01][0-9][0-3][0-9]\\)\\([0-9a-z]+\\)"
-		"\\.htm\\)"
-		"\">" s0
-		;; 4. subject
-		"\\(" no-nl "\\)"
-		s0 "("
-		;; 5. month
-		"\\([01]?[0-9]\\)"
-		"/"
-		;; 6. day
-		"\\([0-3]?[0-9]\\)"
-		")" s0 "</a>")
-       1 2 3 4 5 6)
       ("politics" "政治" "index.htm" ,@default)
       ("science" "科学" "index.htm" ,@default)
-      ("sports" "スポーツ" "index.htm" ,@default)
       ("world" "国際" "index.htm" ,@default)))
   "Alist of group names, their Japanese translations, index pages,
 regexps and numbers.

_________________________________________________________________
MSN Hotmailで開運メルアド占い実施中 
http://promotion.msn.co.jp/hotmail/fortune/input_un.asp