[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: sb-rssの 修正 (old was Re:sb-cnet-jp)



>>>>> In [emacs-w3m : No.08027] 長さん wrote:

> さっそく、ZDNetのshimbun backendを作成してみました。
[...]
> で、その確認で気が付いたのですが、sb-rssの修正
[...]
> で、以前あった
>     (intern-soft (concat encoding "-dos"))
> に該当する処理が無く、CRLFなRDF、具体的にはZDNetやCNet(のnews)のRDFが
>  "XML: Invalid attribute list"となって処理できなくなっていました。

(decode-coding-string "foo\r\n" 'utf-8) => "fooCRLF"

になるのは XEmacs だけだと思っていたんですが、cnet-jp の場合は

<?xml version="1.0" encoding="UTF-8" ?>
<rdf:RDF^M
	xmlns="http://purl.org/rss/1.0/"^M

と、一行目だけ LF で改行しているので、Emacs でも単なる utf-8 で
は CR を消してくれないんですね。nnrss.el と同様に、デコードする
前に自前で CR を消すようにしました。