[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

utf-translate-cjk-mode



Emacs-21.3.50 の utf-translate-cjk モードを用いて UTF-8 でエンコードされた
ページの閲覧に関する問題点と対策についておしらせします。
(mew-dist で書いたことのまとめです。)

○問題点

Emacs-21.3.50 では utf-translate-cjk モードがあるので、Mule-UCS なしでも
日本語を含む UTF-8 でエンコードされたページを emacs-w3m で閲覧できることが
期待されます。しかし、デフォルトの状態では多くの記号が化けてしまいます。

○原因

utf-translate-cjk モードで UTF-8 をデコードすると、U+0100 - U+2E7F は
mule-unicode-* の文字セットを使って表現されます。その文字セットを
iso-2022-7bit-ss2 (w3m-input-coding-system のデフォルト値) で
エンコードして w3m に渡すと、w3m が解せないために文字化けします。
(参考 [emacs-w3m:06969])

○対策

1. Mule-UCS を使う。
   - 個人的には最もおすすめな手です:-)

2. w3m-input-coding-system / w3m-output-coding-system を utf-8 にする。
   - mule-unicode-* を表示できる必要があります。
   - テーブルがずれる場合などは w3m-use-symbol を nil にしてみてください。

3. UTF-8 のデコード時に、記号が japanese-jisx0208 となるようにする。
   - あまりおすすめしません。参考までに私の設定です。
     http://www.nijino.com/ari/emacs/utf-cjk.html#subst-ari


なお、[emacs-w3m:06674] に書かれているように、 w3m-input-coding-system / 
w3m-output-coding-system がページの文字コードと連動すると、この問題は
解消されるはずです。(対策2に相当)

-- 
有沢 明宏