[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
utf-translate-cjk-mode
- From: ari@xxxxxxxxxxxxx (ARISAWA Akihiro)
- Date: Sun, 03 Oct 2004 21:15:21 +0900
- X-ml-name: emacs-w3m
- X-mail-count: 07120
Emacs-21.3.50 の utf-translate-cjk モードを用いて UTF-8 でエンコードされた
ページの閲覧に関する問題点と対策についておしらせします。
(mew-dist で書いたことのまとめです。)
○問題点
Emacs-21.3.50 では utf-translate-cjk モードがあるので、Mule-UCS なしでも
日本語を含む UTF-8 でエンコードされたページを emacs-w3m で閲覧できることが
期待されます。しかし、デフォルトの状態では多くの記号が化けてしまいます。
○原因
utf-translate-cjk モードで UTF-8 をデコードすると、U+0100 - U+2E7F は
mule-unicode-* の文字セットを使って表現されます。その文字セットを
iso-2022-7bit-ss2 (w3m-input-coding-system のデフォルト値) で
エンコードして w3m に渡すと、w3m が解せないために文字化けします。
(参考 [emacs-w3m:06969])
○対策
1. Mule-UCS を使う。
- 個人的には最もおすすめな手です:-)
2. w3m-input-coding-system / w3m-output-coding-system を utf-8 にする。
- mule-unicode-* を表示できる必要があります。
- テーブルがずれる場合などは w3m-use-symbol を nil にしてみてください。
3. UTF-8 のデコード時に、記号が japanese-jisx0208 となるようにする。
- あまりおすすめしません。参考までに私の設定です。
http://www.nijino.com/ari/emacs/utf-cjk.html#subst-ari
なお、[emacs-w3m:06674] に書かれているように、 w3m-input-coding-system /
w3m-output-coding-system がページの文字コードと連動すると、この問題は
解消されるはずです。(対策2に相当)
--
有沢 明宏