[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: wrong html bpart coding



;; 体調をくずしてあまり計算機に向かえず、ちゃんと検証できていません。
;; 眉に唾を付けて読んでください(^^;

At Mon, 28 Jun 2004 18:51:47 +0900,
Katsumi Yamaoka wrote:

> charset=windows-1251 なる text/html パートを含むメールが読めない
> という記事を読んで、ほんの少し相手をしたんですが、
> 実はぼくも CVS head の Emacs (+Gnus +emacs-w3m) で読むと、キリル
> 文字が全部
> 
> ^?_?o?b?l ?c?a?_?U?h?]?k?e ?[?U?b ?]?P ?`?k?]?Z?U!
> 
> のように化けてしまいます。

CVS head の Emacs では windows-1251 を mule-unicode の文字を使って
表現するようになったようです。ここで、w3m-input-coding-system が
iso-2022-7bit-ss2 の場合に、mule-unicode の文字は Emacs 独自の(?)
FINAL-CHAR を使って encode されるため、w3m が理解できずに
化けると思われます。

w3m-input-coding-system を utf-8 にすれば問題ないと思うのですが、
w3m-language が Japanese 以外で Emacs-21 を使うと utf-8 となるように
先日変更したところでした。
ということで、キリル語を使う人々の元では問題が発生しないのではないかと
思われます:-)

なお、Emacs-21.3 でも (copepage-setup 1251) を評価すると cp1251 が
利用可能となりますが、ISO-8859-5 の文字を使って表現されるため、
iso-2022-7bit-ss2 を介しても問題ないはずです。

-- 
有沢 明宏