[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

文字化け on Emacs CVSHead + withoutMule-UCS + w3m-m17n



白井です。

最近の Emacs CVS-HEAD で

・Mule-UCS は使っていない (Zaurus だから load するとメモリが...)
・w3m-m17n (w3m-0.5.1) を使っている

という組み合わせだと、日本語な UTF-8 なページが良く化けます。

# 例えば、 http://moepanda.exblog.jp/ とか、添付のファイルとか。

調べてみると、

with Mule-UCS だと
(find-charset-string
 (decode-coding-string
  (encode-coding-string "○" 'utf-8)
  'utf-8))
=> (japanese-jisx0208)

without Mule-UCS だと
(find-charset-string
 (decode-coding-string
  (encode-coding-string "○" 'utf-8)
  'utf-8))
=> (mule-unicode-2500-33ff)

といった感じで、mule-unicode-xxxx-yyyy の大盤振る舞いになってい
まして、こいつを w3m-input-coding-system => 'iso-2022-7bit-ss2
で w3m に渡すと、(原因の特定はしていませんが)化けまくってしまう
ようです。

ので、こういった組合わせでは

(setq w3m-input-coding-system 'utf-8)

となるようにしました。

また、 w3m-output-coding-system も 'utf-8 にしちゃっても良いので
すが、そうすると、フォントをそろえるのが大変とか、フォントをそろ
えてもどうしても違和感があるとか、文字幅が狂ってへろへろとか、
いろいろと気に入らない点があるので、w3m-output-coding-system は
iso-2022-7bit-ss2 のままです。

きわどい変更のような気がするので、とりあえず CVS Head のみにしま
した。

# Mule-UCS 使っていても mule-unicode-xxxx-yyyy が出るときもある
# と思うのだけど、そういうページのとき、大丈夫かなぁ。。。

-- 
白井秀行 (mailto:shirai@meadowy.org)

Attachment: utf8.html.gz
Description: Binary data