[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: shimbun for ITmedia +D
ども、長です。
このメールは----------------------------------------------
山岡 克美 <yamaoka@xxxxxxx> さん( 山岡 と引用)の
MsgID : [emacs-w3m : No.08564]
Subject : [emacs-w3m:08564] Re: shimbun for ITmedia +D
Date : [Wed, 22 Mar 2006 21:05:46 +0900]
-------------------------------------------への返信です-〆
《件名・引用文は改行・削除・変更してあるかもしれません》
山岡> >>>>> In [emacs-w3m : No.08563] 長さん wrote:
[...]
山岡> > ただ、問題もあって、
山岡> > 1. dateのパースができない
山岡> > -> 要素から日付情報は取得しているのですが、
山岡> > shimbun-rss-process-dateで処理できないようです。(同じフォーマットだ
山岡> > し手動で関数にかける分には成功するんですが)
山岡> shimbun-rss-process-date の本体が使われていない気がしますね。ちょっ
山岡> と追いかけてみただけなので、確信がありませんが。
いえ、ご指摘ありがとうございます。
おかげで修正できました。
原因は「sb-rssを継承して〜」といいつつ、宣言の位置を間違えて継承してなかったた
めでした。
# この後コミットします。
## しかし、よく動いていたなぁ。
山岡> > 2. contentの中身の処理
山岡> > -> atomはcontentの種別に text/html/xhtmlとあるんですが、自動で判別
山岡> > -> して対応する
山岡> > という風にはできませんでした。
山岡> それは xml.el の改造を意味しますか? それとも自前で parser を持つ?
山岡> ともあれ、リンクやテキスト整形のためのタグが消えてしまうのは寂し
山岡> いですね。
xml.elの改造や自前のparserではなく、現状のsb-hashがshimbunコンテンツ(本文)以外を
格納できないことが原因です。
atom:content要素にはtype属性があり、その値はtext/html/xhtmlを取りまして、
それによってatom:contentのnode-textがどのようなものか判断できます。
が、そのタイミングは、atom feedからコンテンツを取得しているタイミングしかないので、
shimbun-make-contentsを行う時に再利用する方法がないと、alistに登録してある
html/text指示で決定するしかないことを指していました。
なお、問題は把握できていまして、現在子ノード以下を生データで取得(するつもり)で
shimbun-rss-node-textを利用していることに起因しています。
# 当初はxml.elの仕様を理解していなくて、node-textは生のxmlを返すと思っていました。
## 現在、修正方法検討中……
以上です。
--
Tsuyoshi CHO
mailto:tsuyoshi_cho@xxxxxxxxx