白井です。 最近の Emacs CVS-HEAD で ・Mule-UCS は使っていない (Zaurus だから load するとメモリが...) ・w3m-m17n (w3m-0.5.1) を使っている という組み合わせだと、日本語な UTF-8 なページが良く化けます。 # 例えば、 http://moepanda.exblog.jp/ とか、添付のファイルとか。 調べてみると、 with Mule-UCS だと (find-charset-string (decode-coding-string (encode-coding-string "○" 'utf-8) 'utf-8)) => (japanese-jisx0208) without Mule-UCS だと (find-charset-string (decode-coding-string (encode-coding-string "○" 'utf-8) 'utf-8)) => (mule-unicode-2500-33ff) といった感じで、mule-unicode-xxxx-yyyy の大盤振る舞いになってい まして、こいつを w3m-input-coding-system => 'iso-2022-7bit-ss2 で w3m に渡すと、(原因の特定はしていませんが)化けまくってしまう ようです。 ので、こういった組合わせでは (setq w3m-input-coding-system 'utf-8) となるようにしました。 また、 w3m-output-coding-system も 'utf-8 にしちゃっても良いので すが、そうすると、フォントをそろえるのが大変とか、フォントをそろ えてもどうしても違和感があるとか、文字幅が狂ってへろへろとか、 いろいろと気に入らない点があるので、w3m-output-coding-system は iso-2022-7bit-ss2 のままです。 きわどい変更のような気がするので、とりあえず CVS Head のみにしま した。 # Mule-UCS 使っていても mule-unicode-xxxx-yyyy が出るときもある # と思うのだけど、そういうページのとき、大丈夫かなぁ。。。 -- 白井秀行 (mailto:shirai@meadowy.org)
Attachment:
utf8.html.gz
Description: Binary data