[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: wrong html bpart coding
>>>>> In [emacs-w3m : No.06993] 木下さん wrote:
>> w3m-charset-coding-system-alist の右項が無いのが問題だとすれば、
> いえ、そうではなくて、w3m-charset-to-coding-system()が使われる前に
> w3m-correct-charset()でwindows-125xがcp125xに強制的に変換されてし
> まうことが問題なのだと思います。
あ、よくわかりました。すみません。
有沢さん、ご対応ありがとうございます。
ところで、この thread の原点に戻って。
旧ソ連方面からの spam が完全に化けてしまうのが気になりだして、
(setq w3m-input-coding-system 'utf-8
w3m-output-coding-system 'iso-2022-7bit-ss2)
という生活をはじめました。これでだいたいは化けることも無く、文字
幅も正しく扱われるように見えます。
ちょっと気になるのは utf-8 がある日本語以外の環境で w3m 0.5x を
使うユーザの場合です。この場合 w3m への入出力が utf-8 になって、
table を多用しているページを表示すると、けっこう乱れますね。
;; よくわからないのは http://kr.yahoo.com/ の表示。上記の設定で
;; 若干の文字化けがあるのは許すとして、input と output の両方を
;; utf-8 にすると、同じ場所に違う文字が表示されます (文字数も違
;; う)。欧米の人たちがソフトウェアの CJK 対応をするときは、こん
;; な感じで首をかしげているんだろな。:-p
--
Katsumi Yamaoka <yamaoka@jpl.org>