[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: shimbun-rss-build-message-id



ども、長です。

御無沙汰してます、最近なんも活動できてなくてすみません。

sb-rss/sb-atom関係なのででしゃばってみます。

このメールは----------------------------------------------
山岡 克美 <yamaoka@xxxxxxx> さん( 山岡 と引用)の
MsgID   : [emacs-w3m : No.10062]
Subject : [emacs-w3m:10062] Re: shimbun-rss-build-message-id
Date    : [Wed, 26 Mar 2008 18:48:35 +0900]
-------------------------------------------への返信です-〆
 《件名・引用文は改行・削除・変更してあるかもしれません》
山岡> >>>>> In [emacs-w3m : No.10061] 土屋さん wrote:
山岡> >>> On Wed, 26 Mar 2008 18:14:33 +0900
山岡> >>> yamaoka@xxxxxxx (Katsumi Yamaoka) said as follows:

山岡> >>RSS 記事の Message-ID を生成する `shimbun-rss-build-message-id' 関数は、
山岡> >>記事の url の md5 を計算するときに url 文字列の "?" または "#" 以降の文
山岡> >>字をはぎとります。

山岡> > # 以後は,明らかに削除できます.

山岡> はい。

ほとんどの場合はそうだと思われますが、一部のRSSは#も込みで内容が違うということが
あります。
特にsb-rss-hashなどでの処理は1つのページから複数のshimbunが生成されるということ
があります。
# セキュリティmemoとかが代表的かなぁ

ただ原則不要だと思います。

山岡> > 問題は,? 以後の扱いです.ご存じの通り,? 以後は CGI の query 部分である

[...]

山岡> >>ところが毎日新聞の次の二つのグループでは当てはまりません。

山岡> > 上記の通り,これには一般解はないと思います.サイト毎に処理が異なりますの
山岡> > で.

山岡> その通りですね。これが新規の関数だったら、個人的には url を加工
山岡> しないものをデフォルトにして [?#] 以降をはぎとる必要がある場合だ
山岡> け対処する方に票を入れたいですが、今となっては sb-rss.el を使う
山岡> すべての shimbun モジュールを走査する元気はありません。;-)
山岡> 了解しました。

[...]

で、こちらですが、本来RSSの主旨からするとパーマリンクたりうるURIが通知されてくる
のが筋なので、こちらも含んだ方がいいことも多いようです。

ただ、feedbunerなどの広告フィードを挟むことがあったりすると、意味のないクエリーが
あったり、?rssなどのトラックキング用としか思えないものが付いたりすることもけっこ
うあります。

えー、結論としてはやっぱりケースバイケースで、原則論としても[?#]以降な無し、
でとりあえずは大丈夫じゃないでしょうか。

# 必要なモジュールでそれぞれ対応するということで。

以上です。
--
Tsuyoshi CHO
  mailto:tsuyoshi_cho@xxxxxxxxx
# 少人数でもリーダーになんてなるもんではないですなw