[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: 矢印(『←』とか)が文字化けする



ひろせといいます

in "[emacs-w3m:08558] Re: 矢印(『←』とか)が文字化けする"
   <87r754v0f2.fsf@xxxxxxxxxxxxxxx>
at Wed, 15 Mar 2006 12:42:25 +0900,
   ari@xxxxxxxxxxxxx wrote:

> > のスレッドに関連すると思うのですが、nxml-mode を使いたいがために
> > Mule-UCS を使わないようにしたところ、emacs-w3m で『←』や『→』の表示
> > と FORM の submit で問題が出てきました。よい回避方法があればご教授いた
> > だければと思います。
> 
> 回避方法としては、以下の2つが考えられます。
> (A) w3m-output-coding-system と w3m-input-coding-system を
>     'iso-2022-7bit-ss2 にする。
> (B) utf-translate-cjk-unicode-range に『←』や『→』を含める。
>     cf. http://www.nijino.com/ari/emacs/utf-cjk.html#utf-translate-cjk-unicode-range

取り急ぎ、(A) で問題ないことを確認できました。m(_ _)m

> form への submit がおかしくなる原因は以下のような感じと思います。
> 1) w3m-output-coding-system が utf-8 だと、w3m で UTF-8 に変換して 
>    Emacs に送る。
> 2) Emacs で受けとったデータをデコードするが、Emacs-22 w/o Mule-UCS では
>    多くの記号が mule-unicode-XXXX-XXXX になる。
> 3) form に submit するデータは、対象のページの文字コードでエンコードする。
>    ここで対象のページが EUC-JP の場合に、mule-unicode-XXXX-XXXX は
>    EUC-JP で表現できないために、ムリヤリなエンコードを行う。
> 
> 回避方法(A)は w3m とのやりとりに UTF-8 を使わないというものです。
> ただし、これは UTF-8 のページが良く化けるそうです。
> cf. http://emacs-w3m.namazu.org/ml/07166
> 
> 回避方法(B)は Emacs のデコーダの動きを変えて、japanese-jisx0208 に
> デコードするというものです。

なるほど。(A) で様子をみて場合によっては (B) も試してみたいと思います。

ではでは

-- 
ひろせ
http://www.irori.org/