[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: asahi



単なる思いつきですが.

>> On Thu, 03 Jul 2003 14:04:21 +0900
>> 「山」== yamaoka@jpl.org (Katsumi Yamaoka) said as follows:

山> 昨日まで気が付かなかったんですが、朝日新聞の記事の内容が url は同
山> じままでコロコロ変わります。Message-ID は url 文字列をもとにしてい
山> るので内容が変化しても新着記事として現れず、今のところ気になる記事
山> はもう一度見直すしか対処のしようがありません。

つまり,既に取得済みの記事が有効であるか否かを検査する枠組みが必要 
[emacs-w3m:01823] ということですよね.

shimbun で取得済みの記事が最新であるかどうかを検査することは,proxy
server に保管されている cache の有効性を検査することと同じだと思います.
したがって,RFC2616 の第13章「Caching in HTTP」で議論されている cache 
制御についての考え方が応用できるのではないでしょうか.

具体的には,サーバーによって送信される Last-Modified へッダとか ETag 
へッダの情報を Message-ID に組み込んでおけば同一性(= 有効性)の検証がで
きるのではないかと思います.

;; 朝日新聞の HTTP server が正しい last-modified: や必要な情報を返すこ
;; とは確認してません.

-- 
土屋 雅稔 ( TSUCHIYA Masatoshi )