[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: question about sjis charset



こんにちは、安藤@長崎と申します。

私も似た様な経験が有りますが、岩井さんの場合とは逆で、
emacs-w3m+mule-ucs な環境では文字化けせず、kterm+w3m な環境で google
が文字化けして長い事悩んだ事が有りました。

# なんで、このメイルは外している可能性大です。こんな事もあるよ、と言う
# 程度でご覧下さい。

ちなみに Debian/woody で使用しておりますが、w3m は 0.3.1、emacs-w3m は
1.3.1 です。

From: Hidetaka Iwai <tyuyu@mb6.seikyou.ne.jp>
Subject: [emacs-w3m:03751] question about sjis charset
Date: Wed, 14 Aug 2002 08:54:55 +0900 (JST)
Message-ID: <20020814.085455.05863881.tyuyu@sings.jp>

>  Debian GNU/Linux(sid) 上で emacs-w3m を利用しているのですが、
>  shift-jis なページを見ると文字化けしてしまいます。それで、=
> (Display header of this current buffer)してみると、
> W3m-document-charset: US_ASCII となっているのですが、まずどこから疑う
>  べきでしょうか。
> 
> #普段 shift-jis なページを見ないとはいえ、google が化けるのはちょっと
> #困る^^;

w3m の option setting panel で、User-Agent に "Mozilla5.0 …" 等と書い
ていると、google では UTF-8 で送られてきておりました。これを
Mozilla4.0 にすると、今度は Shift_JIS で送られてくる様になり、kterm 上
ではめでたく文字化けは無くなりました。

Emacs + mule-ucs の場合は UTF-8 を理解できるので、文字化けしなかったの
だと思います。一度 mule-ucs をアンインストールしたところ、Emacs(21.2、
21.1、20.7) でも文字化けが復活しました。

……と、ここまで書いて何気に emacs-w3m から w3m-search 経由で google
で「ほげほげ」を検索すると、文字化けは起きませんが

Header Information

W3m-current-url: http://www.google.com/search?q=%82%d9%82%b0%82%d9%82%b0&hl=ja
W3m-document-charset: US_ASCII

となりますね。う〜ん、US_ASCII でも文字化けが起きないなぁ。やはり、
mule-ucs のおかげなのでしょうか?

とりあえずは以上、参考になれば。
-- 
 あんどう つとむ@長崎県長崎市 <ando-tom@ff.iij4u.or.jp>