[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: 改善案とか問題点



有沢です。
あけましておめでとうございます。今年もよろしくお願いします。

Tsuyoshi CHO writes:

> UTF-8なページでなにかの文字の直後に半角句点(、)があると文字化けします。

確認したところ、以下の条件では化けました。
 w3m-use-mule-ucs => t
 w3m-input-coding-system => iso-2022-7bit-ss2
 w3m-output-coding-system => iso-2022-7bit-ss2

Mule-UCS を利用していても、w3m-(input|output)-coding-system が
utf-8 の場合は化けません。

化ける原因はおそらく以下の通りです。
(1) 半角の句点(U+FF64)へのマッピングは chinese-big5-1 にも含まれている。
    Mule-UCS のデフォルトは、katakana-jisx0201 より chinese-big5-1 の方が
    プライオリティが高いため、chinese-big5-1 にデコードされる。
(2) w3m-input-coding-system (iso-2022-7bit-ss2) にエンコードするが、
    BIG5 は iso-2022 で表現できないため、Emacs 独自のエンコードを行う。
(3) w3m は Emacs 独自のエンコードを解釈できないため化ける。

回避方法としては、w3m-(input|output)-coding-system を変えるか、
un-define-change-charset-order で文字セットのプライオリティを
変えるかといったとこでしょうか。

-- 
有沢 明宏