[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: wrong html bpart coding
>>>>> In [emacs-w3m : No.06969] 有沢さん wrote:
> ;; 体調をくずしてあまり計算機に向かえず、ちゃんと検証できていません。
お大事に。
> ;; 眉に唾を付けて読んでください(^^;
むしろこの元記事には、今後のために巨大な ! マークを付けておきた
いです。:)
> CVS head の Emacs では windows-1251 を mule-unicode の文字を使って
> 表現するようになったようです。ここで、w3m-input-coding-system が
> iso-2022-7bit-ss2 の場合に、mule-unicode の文字は Emacs 独自の(?)
> FINAL-CHAR を使って encode されるため、w3m が理解できずに
> 化けると思われます。
そうか (decode (encode ...)) で試しても意味が無かったんですね。
> w3m-input-coding-system を utf-8 にすれば問題ないと思うのですが、
> w3m-language が Japanese 以外で Emacs-21 を使うと utf-8 となるように
> 先日変更したところでした。
> ということで、キリル語を使う人々の元では問題が発生しないのではないかと
> 思われます:-)
大当たりです。とりあえず w3m-input-coding-system を utf-8 にして
みたら、問題は解消しました。
> なお、Emacs-21.3 でも (copepage-setup 1251) を評価すると cp1251 が
> 利用可能となりますが、ISO-8859-5 の文字を使って表現されるため、
> iso-2022-7bit-ss2 を介しても問題ないはずです。
おそらくそうなんだと思います。しかし Gnus でメールなどの記事に含
まれる windows-1251 の html を読む場合には、はじめに Gnus がデコー
ドしてから emacs-w3m に渡す構成になっているので、windows-1251 を
サポートしていない Emacs ではまったくだめでした。しかし、それな
ら emacs-w3m のせいにされることはないですね。:)
ともあれ、どうもありがとうございます。
--
Katsumi Yamaoka <yamaoka@jpl.org>