[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: 矢印(『←』とか)が文字化けする



Masaaki HIROSE writes:

> のスレッドに関連すると思うのですが、nxml-mode を使いたいがために
> Mule-UCS を使わないようにしたところ、emacs-w3m で『←』や『→』の表示
> と FORM の submit で問題が出てきました。よい回避方法があればご教授いた
> だければと思います。

回避方法としては、以下の2つが考えられます。
(A) w3m-output-coding-system と w3m-input-coding-system を
    'iso-2022-7bit-ss2 にする。
(B) utf-translate-cjk-unicode-range に『←』や『→』を含める。
    cf. http://www.nijino.com/ari/emacs/utf-cjk.html#utf-translate-cjk-unicode-range


form への submit がおかしくなる原因は以下のような感じと思います。
1) w3m-output-coding-system が utf-8 だと、w3m で UTF-8 に変換して 
   Emacs に送る。
2) Emacs で受けとったデータをデコードするが、Emacs-22 w/o Mule-UCS では
   多くの記号が mule-unicode-XXXX-XXXX になる。
3) form に submit するデータは、対象のページの文字コードでエンコードする。
   ここで対象のページが EUC-JP の場合に、mule-unicode-XXXX-XXXX は
   EUC-JP で表現できないために、ムリヤリなエンコードを行う。

回避方法(A)は w3m とのやりとりに UTF-8 を使わないというものです。
ただし、これは UTF-8 のページが良く化けるそうです。
cf. http://emacs-w3m.namazu.org/ml/07166

回避方法(B)は Emacs のデコーダの動きを変えて、japanese-jisx0208 に
デコードするというものです。

-- 
有沢 明宏