[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 改善案とか問題点
有沢です。
あけましておめでとうございます。今年もよろしくお願いします。
Tsuyoshi CHO writes:
> UTF-8なページでなにかの文字の直後に半角句点(、)があると文字化けします。
確認したところ、以下の条件では化けました。
w3m-use-mule-ucs => t
w3m-input-coding-system => iso-2022-7bit-ss2
w3m-output-coding-system => iso-2022-7bit-ss2
Mule-UCS を利用していても、w3m-(input|output)-coding-system が
utf-8 の場合は化けません。
化ける原因はおそらく以下の通りです。
(1) 半角の句点(U+FF64)へのマッピングは chinese-big5-1 にも含まれている。
Mule-UCS のデフォルトは、katakana-jisx0201 より chinese-big5-1 の方が
プライオリティが高いため、chinese-big5-1 にデコードされる。
(2) w3m-input-coding-system (iso-2022-7bit-ss2) にエンコードするが、
BIG5 は iso-2022 で表現できないため、Emacs 独自のエンコードを行う。
(3) w3m は Emacs 独自のエンコードを解釈できないため化ける。
回避方法としては、w3m-(input|output)-coding-system を変えるか、
un-define-change-charset-order で文字セットのプライオリティを
変えるかといったとこでしょうか。
--
有沢 明宏