[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: wrong html bpart coding



>>>>> In [emacs-w3m : No.06969] 有沢さん wrote:

> ;; 体調をくずしてあまり計算機に向かえず、ちゃんと検証できていません。

お大事に。

> ;; 眉に唾を付けて読んでください(^^;

むしろこの元記事には、今後のために巨大な ! マークを付けておきた
いです。:)

> CVS head の Emacs では windows-1251 を mule-unicode の文字を使って
> 表現するようになったようです。ここで、w3m-input-coding-system が
> iso-2022-7bit-ss2 の場合に、mule-unicode の文字は Emacs 独自の(?)
> FINAL-CHAR を使って encode されるため、w3m が理解できずに
> 化けると思われます。

そうか (decode (encode ...)) で試しても意味が無かったんですね。

> w3m-input-coding-system を utf-8 にすれば問題ないと思うのですが、
> w3m-language が Japanese 以外で Emacs-21 を使うと utf-8 となるように
> 先日変更したところでした。
> ということで、キリル語を使う人々の元では問題が発生しないのではないかと
> 思われます:-)

大当たりです。とりあえず w3m-input-coding-system を utf-8 にして
みたら、問題は解消しました。

> なお、Emacs-21.3 でも (copepage-setup 1251) を評価すると cp1251 が
> 利用可能となりますが、ISO-8859-5 の文字を使って表現されるため、
> iso-2022-7bit-ss2 を介しても問題ないはずです。

おそらくそうなんだと思います。しかし Gnus でメールなどの記事に含
まれる windows-1251 の html を読む場合には、はじめに Gnus がデコー
ドしてから emacs-w3m に渡す構成になっているので、windows-1251 を
サポートしていない Emacs ではまったくだめでした。しかし、それな
ら emacs-w3m のせいにされることはないですね。:)

ともあれ、どうもありがとうございます。
-- 
Katsumi Yamaoka <yamaoka@jpl.org>