[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: sb-rss.el



At Sat, 14 Jun 2003 16:30:02 +0900,
Yuuichi Teranishi <teranisi@gohome.org> wrote:
 
> デフォルトネームスペースが RSS の名前空間になるとは限らなくて、
> 例えば RSS の prefix に hoge: を割り振った場合、hoge:item というタグが
> RSS の item になったりします。
> このあたりいろいろややこしいのと、拡張のしやすさとかを考えると、
> ぼくも XML パーサを使ったほうがいいと思います。


At Sat, 14 Jun 2003 16:29:53 +0900,
Koichiro Ohba <koichiro@meadowy.org> wrote:

> 名前空間を使っていなかった RSS 0.91 との後方互換性のために、トリッキー
> なことをしているサイトはあまりないようですね。
> 
> 言えるのは RSS 1.0 のように複数の名前空間を組み合わせるような言語では、
> 簡単に RSS1.0 的に正しいが、文字列検索 parser を混乱させる XML 文書を
> 作成できるということです。

  なるほど。そういうことですか。何となく理解しました。その name space
を利用する必然性がまだ良く分かっていませんが...。


> (xml.el がうごかないのはうごくようにするとして)

  そうですねー、こいつが動かないとどうしようもありません。Emacs の
version 間差異を考えると portable な xml.el (拡張あり?) を emacs-w3m に
添付することになるかもしれませんね。


At Sat, 14 Jun 2003 16:29:53 +0900,
Koichiro Ohba <koichiro@meadowy.org> wrote:
 
> あとパフォーマンスも気にされているようでしたが、w3m を使って XML ツリー
> 全体を一度バッファに読み込んでいますし、どちらも気になるほどの違いがで
> るとは思えないのですが、どうでしょう。

  XML として真面目に parse すべき理由が分かったので、もはや自分のアプ
ローチに固執しませんが、xml ファイルを parse する場合、Emacs のバッファ
に読み込んで、そのまま正規表現で加工できるなら、一般論としてその方が速
いです。Emacs の list に加工するなら、Emacs へのバッファ読み込み、list
加工、と二段階の step を踏まねばならないので、overhead が単純に二倍以
上になります (所詮 xml.el の中でも正規表現での検索をしていますからね)。

ただ、shimbun-get-headers でどの程度の差が出るのかというと、RSS ファイ
ルの大きさにもよりますが、それ程体感速度は変わらないかもしれません。


> で中島さんの sb-rss.el へ xml.el を使った XML parse する対応をいれてみ
> ました。sb-cnet-rss.el がそのまま動くのを確認しています。

  おっ、素早い ;-)。流石ですね。

# どっかから動く xml.el を仕入れてくるか...。
--
中島幹夫 <minakaji@namazu.org>
home: http://www.asahi-net.or.jp/~gy2m-nkjm
diary: http://slashdot.jp/journal.pl?op=display&uid=5767