[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Does sb-yahoo.el work?
野宮です.
>>>>> In the Message: [emacs-w3m ML: No.10866]
>>>>> with the date of Wed, 29 Apr 2009 12:29:19 +0900
>>>>> lightcyan.area51@xxxxxxxxx has written:
>> あと海外、政治、経済ニュースしか見ていませんが、読める記事の数が少
>> ないと思います。
> 以下のような関数を作って確認してみました。
> (defun my-test ()
> (interactive)
> (let* ((s0 "[\t\n\r ]*")
> (s1 "[\t\n\r ]+")
> (default (concat
> "<a" s1 "href=\""
> ;; 1. url
> "\\(http://headlines\\.yahoo\\.co\\.jp/hl\\?a="
> ;; 2. serial number
> "\\("
> ;; 3. year
> "\\(20[0-9][0-9]\\)"
> ;; 4. month
> "\\([01][0-9]\\)"
> ;; 5. day
> "\\([0-3][0-9]\\)"
> "[^\"]*\\)"
> "\\)"
> "\"" s0 ">" s0 ;"\\(?:<strong>" s0 "\\)?"
> ;; 6. subject
> "\\([^<]+\\)"
> "\\(?:" s0 "</strong>\\)?"
> s0 "</a>\\(?:" s0 "<[^>]+>\\)+" s0
> "\\(?:(" s0 "\\(?:<a" s1 "[^>]+>" s0 "\\)?"
> ;; 7. source
> "\\([^<)]+\\)"
> s0 "\\(?:</a>" s0 "\\)?"
> s0 ")"
> "\\(?:" s0 "\\|" s0 "-" s0 "\\(?:[^<]+\)" s0 "\\)?\\)"
> "\\|[01]?[0-9]月[0-3]?[0-9]日([日月火水木金土])\\)"
> ;; 8. hour
> "\\([012]?[0-9]\\)"
> s0 "時" s0
> ;; 9. minute
> "\\([0-5]?[0-9]\\)"
> s0 "分"
> "\\(?:[^<]+<a" s1 "href=\"[^\">]+\">" s0
> ;; 10. source
> "\\([^<)]+\\)"
> s0 "</a>\\)?"
> )))
> (re-search-forward default)))
> 次のようなリンクを取りこぼしているようです。
山岡さんが手を入れられる迄の応急措置として,
> s0 "</a>\\(?:" s0 "<[^>]+>\\)+" s0
の部分を
s0 "</a>" "\\(?:" s0 "<[^>]+>[^<]+</span>\\)?"
"\\(?:" s0 "<[^>]+>\\)+" s0
としてみて下さい.
---
野宮