[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
毎日新聞の記
事の日付
(was Re:sb-sankei.el)
>>>>> In [emacs-w3m : No.06845] 野宮さん wrote:
> 毎日新聞ですが、記事の日付に狂いが生じていませんか?
> Summaryでみますと、
> 5/21(金)....
> となっているのですが、
この段階では、例えば shakai の記事だったら
http://www.mainichi-msn.co.jp/shakai/
のページからヘッダ情報を取得する際に、
* 小泉首相訪朝:「先送り」「見返り」を否定 首 21:23
相会見
のようなものから 21:23 という時分の情報を、そしてこの記事の本文
が置かれている
20040523k0000m010076000c.html
という url から年月日の情報、すなわち 2004年5月23日 を得ます。
(このメッセージは 2004年5月22日に書いています。→未来の読者へ)
その本文を見れば、最後の方に 2004年5月22日 21時09分 と書かれてい
るのですが、summary を作成する段階ではそこまではわかりません。
> 取り込みますと、
> 5/19(水)....
> に変わり、
この段階で、本文を見てヘッダ情報を修正しているのです。
> 確かに、前に読んだのと同じ記事ということが頻発していますが。
> どうも、夜になるとこの現象が発生するようです....
毎日新聞の場合、日をまたいだり、ヴァリューのある記事に対して、記
事の内容は同じままで、url 名の年月日に相当する部分を変えて残して
おく傾向があります。そういうわけで、次の日の夜にも、もしかしたら
* 小泉首相訪朝:「先送り」「見返り」を否定 首 21:23
相会見
という記事が 20040524k0000m010076000c.html という url で存在して
いるかもしれません。
ということで、ご理解いただけますでしょうか。あるいは、これらを改
善する案があればお願いします。
--
Katsumi Yamaoka <yamaoka@jpl.org>