[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: shimbun for ITmedia +D



ども、長です。

このメールは----------------------------------------------
山岡 克美 <yamaoka@xxxxxxx> さん( 山岡 と引用)の
MsgID   : [emacs-w3m : No.08564]
Subject : [emacs-w3m:08564] Re: shimbun for ITmedia +D
Date    : [Wed, 22 Mar 2006 21:05:46 +0900]
-------------------------------------------への返信です-〆
 《件名・引用文は改行・削除・変更してあるかもしれません》
山岡> >>>>> In [emacs-w3m : No.08563] 長さん wrote:

[...]

山岡> > ただ、問題もあって、
山岡> >  1. dateのパースができない
山岡> >   -> 要素から日付情報は取得しているのですが、
山岡> >   shimbun-rss-process-dateで処理できないようです。(同じフォーマットだ
山岡> >   し手動で関数にかける分には成功するんですが)

山岡> shimbun-rss-process-date の本体が使われていない気がしますね。ちょっ
山岡> と追いかけてみただけなので、確信がありませんが。

いえ、ご指摘ありがとうございます。
おかげで修正できました。

原因は「sb-rssを継承して〜」といいつつ、宣言の位置を間違えて継承してなかったた
めでした。

# この後コミットします。
## しかし、よく動いていたなぁ。

山岡> >  2. contentの中身の処理
山岡> >   -> atomはcontentの種別に text/html/xhtmlとあるんですが、自動で判別
山岡> >   -> して対応する
山岡> >      という風にはできませんでした。

山岡> それは xml.el の改造を意味しますか?  それとも自前で parser を持つ?
山岡> ともあれ、リンクやテキスト整形のためのタグが消えてしまうのは寂し
山岡> いですね。

xml.elの改造や自前のparserではなく、現状のsb-hashがshimbunコンテンツ(本文)以外を
格納できないことが原因です。

atom:content要素にはtype属性があり、その値はtext/html/xhtmlを取りまして、
それによってatom:contentのnode-textがどのようなものか判断できます。

が、そのタイミングは、atom feedからコンテンツを取得しているタイミングしかないので、
shimbun-make-contentsを行う時に再利用する方法がないと、alistに登録してある
html/text指示で決定するしかないことを指していました。

なお、問題は把握できていまして、現在子ノード以下を生データで取得(するつもり)で
shimbun-rss-node-textを利用していることに起因しています。

# 当初はxml.elの仕様を理解していなくて、node-textは生のxmlを返すと思っていました。
## 現在、修正方法検討中……

以上です。

--
Tsuyoshi CHO
  mailto:tsuyoshi_cho@xxxxxxxxx