[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: wrong html bpart coding



>>>>> In [emacs-w3m : No.06993] 木下さん wrote:

>> w3m-charset-coding-system-alist の右項が無いのが問題だとすれば、

> いえ、そうではなくて、w3m-charset-to-coding-system()が使われる前に
> w3m-correct-charset()でwindows-125xがcp125xに強制的に変換されてし
> まうことが問題なのだと思います。

あ、よくわかりました。すみません。
有沢さん、ご対応ありがとうございます。

ところで、この thread の原点に戻って。
旧ソ連方面からの spam が完全に化けてしまうのが気になりだして、

(setq w3m-input-coding-system 'utf-8
      w3m-output-coding-system 'iso-2022-7bit-ss2)

という生活をはじめました。これでだいたいは化けることも無く、文字
幅も正しく扱われるように見えます。

ちょっと気になるのは utf-8 がある日本語以外の環境で w3m 0.5x を
使うユーザの場合です。この場合 w3m への入出力が utf-8 になって、
table を多用しているページを表示すると、けっこう乱れますね。

;; よくわからないのは http://kr.yahoo.com/ の表示。上記の設定で
;; 若干の文字化けがあるのは許すとして、input と output の両方を
;; utf-8 にすると、同じ場所に違う文字が表示されます (文字数も違
;; う)。欧米の人たちがソフトウェアの CJK 対応をするときは、こん
;; な感じで首をかしげているんだろな。:-p
-- 
Katsumi Yamaoka <yamaoka@jpl.org>