[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: asahi
- From: TSUCHIYA Masatoshi <tsuchiya@xxxxxxxxxxxxxxxxxxxxxxx>
- Date: Sun, 20 Jul 2003 15:21:15 +0900
- X-ml-name: emacs-w3m
- X-mail-count: 05552
- References: <b9yof0cmca2.fsf@jpl.org>
単なる思いつきですが.
>> On Thu, 03 Jul 2003 14:04:21 +0900
>> 「山」== yamaoka@jpl.org (Katsumi Yamaoka) said as follows:
山> 昨日まで気が付かなかったんですが、朝日新聞の記事の内容が url は同
山> じままでコロコロ変わります。Message-ID は url 文字列をもとにしてい
山> るので内容が変化しても新着記事として現れず、今のところ気になる記事
山> はもう一度見直すしか対処のしようがありません。
つまり,既に取得済みの記事が有効であるか否かを検査する枠組みが必要
[emacs-w3m:01823] ということですよね.
shimbun で取得済みの記事が最新であるかどうかを検査することは,proxy
server に保管されている cache の有効性を検査することと同じだと思います.
したがって,RFC2616 の第13章「Caching in HTTP」で議論されている cache
制御についての考え方が応用できるのではないでしょうか.
具体的には,サーバーによって送信される Last-Modified へッダとか ETag
へッダの情報を Message-ID に組み込んでおけば同一性(= 有効性)の検証がで
きるのではないかと思います.
;; 朝日新聞の HTTP server が正しい last-modified: や必要な情報を返すこ
;; とは確認してません.
--
土屋 雅稔 ( TSUCHIYA Masatoshi )