[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: wrong html bpart coding
- From: ari@xxxxxxxxxxxxx (ARISAWA Akihiro)
- Date: Tue, 29 Jun 2004 20:52:49 +0900
- X-ml-name: emacs-w3m
- X-mail-count: 06969
- References: <ufn02oc278.fsf@d-fens.example.com><b9ylli83u10.fsf@jpl.org><b9ywu1svwlo.fsf@jpl.org>
;; 体調をくずしてあまり計算機に向かえず、ちゃんと検証できていません。
;; 眉に唾を付けて読んでください(^^;
At Mon, 28 Jun 2004 18:51:47 +0900,
Katsumi Yamaoka wrote:
> charset=windows-1251 なる text/html パートを含むメールが読めない
> という記事を読んで、ほんの少し相手をしたんですが、
> 実はぼくも CVS head の Emacs (+Gnus +emacs-w3m) で読むと、キリル
> 文字が全部
>
> ^?_?o?b?l ?c?a?_?U?h?]?k?e ?[?U?b ?]?P ?`?k?]?Z?U!
>
> のように化けてしまいます。
CVS head の Emacs では windows-1251 を mule-unicode の文字を使って
表現するようになったようです。ここで、w3m-input-coding-system が
iso-2022-7bit-ss2 の場合に、mule-unicode の文字は Emacs 独自の(?)
FINAL-CHAR を使って encode されるため、w3m が理解できずに
化けると思われます。
w3m-input-coding-system を utf-8 にすれば問題ないと思うのですが、
w3m-language が Japanese 以外で Emacs-21 を使うと utf-8 となるように
先日変更したところでした。
ということで、キリル語を使う人々の元では問題が発生しないのではないかと
思われます:-)
なお、Emacs-21.3 でも (copepage-setup 1251) を評価すると cp1251 が
利用可能となりますが、ISO-8859-5 の文字を使って表現されるため、
iso-2022-7bit-ss2 を介しても問題ないはずです。
--
有沢 明宏