[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

毎日新聞の記 事の日付 (was Re:sb-sankei.el)



>>>>> In [emacs-w3m : No.06845] 野宮さん wrote:

> 毎日新聞ですが、記事の日付に狂いが生じていませんか?
> Summaryでみますと、

>    5/21(金)....

> となっているのですが、

この段階では、例えば shakai の記事だったら

http://www.mainichi-msn.co.jp/shakai/

のページからヘッダ情報を取得する際に、

  * 小泉首相訪朝:「先送り」「見返り」を否定 首  21:23
    相会見

のようなものから 21:23 という時分の情報を、そしてこの記事の本文
が置かれている

  20040523k0000m010076000c.html

という url から年月日の情報、すなわち 2004年5月23日 を得ます。

(このメッセージは 2004年5月22日に書いています。→未来の読者へ)

その本文を見れば、最後の方に 2004年5月22日 21時09分 と書かれてい
るのですが、summary を作成する段階ではそこまではわかりません。

> 取り込みますと、

>   5/19(水)....

> に変わり、

この段階で、本文を見てヘッダ情報を修正しているのです。

> 確かに、前に読んだのと同じ記事ということが頻発していますが。
> どうも、夜になるとこの現象が発生するようです....

毎日新聞の場合、日をまたいだり、ヴァリューのある記事に対して、記
事の内容は同じままで、url 名の年月日に相当する部分を変えて残して
おく傾向があります。そういうわけで、次の日の夜にも、もしかしたら

  * 小泉首相訪朝:「先送り」「見返り」を否定 首  21:23
    相会見

という記事が 20040524k0000m010076000c.html という url で存在して
いるかもしれません。

ということで、ご理解いただけますでしょうか。あるいは、これらを改
善する案があればお願いします。
-- 
Katsumi Yamaoka <yamaoka@jpl.org>