[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: Does sb-yahoo.el work?



野宮です.

>>>>> In the Message: [emacs-w3m ML: No.10866]
>>>>>   with the date of Wed, 29 Apr 2009 12:29:19 +0900
>>>>> lightcyan.area51@xxxxxxxxx has written:

>> あと海外、政治、経済ニュースしか見ていませんが、読める記事の数が少
>> ないと思います。

> 以下のような関数を作って確認してみました。

> (defun my-test ()
>   (interactive)
>   (let* ((s0 "[\t\n\r ]*")
> 	 (s1 "[\t\n\r ]+")
> 	 (default (concat
> 		   "<a" s1 "href=\""
> 		   ;; 1. url
> 		   "\\(http://headlines\\.yahoo\\.co\\.jp/hl\\?a="
>  		   ;; 2. serial number
> 		   "\\("
> 		   ;; 3. year
> 		   "\\(20[0-9][0-9]\\)"
> 		   ;; 4. month
> 		   "\\([01][0-9]\\)"
> 		   ;; 5. day
> 		   "\\([0-3][0-9]\\)"
> 		   "[^\"]*\\)"
> 		   "\\)"
>  		   "\"" s0 ">" s0 ;"\\(?:<strong>" s0 "\\)?"
>  		   ;; 6. subject
>  		   "\\([^<]+\\)"
>  		   "\\(?:" s0 "</strong>\\)?"
>   		   s0 "</a>\\(?:" s0 "<[^>]+>\\)+" s0
>  		   "\\(?:(" s0 "\\(?:<a" s1 "[^>]+>" s0 "\\)?"
>  		   ;; 7. source
>  		   "\\([^<)]+\\)"
>   		   s0 "\\(?:</a>" s0 "\\)?"
>   		   s0 ")"
>  		   "\\(?:" s0 "\\|" s0 "-" s0 "\\(?:[^<]+\)" s0 "\\)?\\)"
>  		   "\\|[01]?[0-9]月[0-3]?[0-9]日([日月火水木金土])\\)"
>  		   ;; 8. hour
>  		   "\\([012]?[0-9]\\)"
>  		   s0 "時" s0
>  		   ;; 9. minute
>  		   "\\([0-5]?[0-9]\\)"
>  		   s0 "分"
>  		   "\\(?:[^<]+<a" s1 "href=\"[^\">]+\">" s0
>  		   ;; 10. source
>  		   "\\([^<)]+\\)"
>  		   s0 "</a>\\)?"
> 		   )))
>     (re-search-forward default)))

> 次のようなリンクを取りこぼしているようです。

山岡さんが手を入れられる迄の応急措置として,

>   		   s0 "</a>\\(?:" s0 "<[^>]+>\\)+" s0

の部分を

		    s0 "</a>" "\\(?:" s0 "<[^>]+>[^<]+</span>\\)?"
		    "\\(?:" s0 "<[^>]+>\\)+" s0

としてみて下さい.

---
  野宮