[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: XEmacs+mew-shim bunで文字化け



白井です。

From: Satoshi TAOKA <taoka@infonets.hiroshima-u.ac.jp> さん曰く
Subject: [emacs-w3m:04257] XEmacs+mew-shimbunで文字化け
Message-ID: <20021111.111744.90124607.taoka@infonets.hiroshima-u.ac.jp>
Date: Mon, 11 Nov 2002 11:17:44 +0900 (JST)


田岡> XEmacs+mew-shimbunで文字化けが起きてしまいます。獲得した記事の日本語が
田岡> 「~~」になってしまいます。環境は

田岡> FreeBSD 4.7-RELEASE
田岡> XEmacs 21.1.14
田岡> emacs-w3m 1.3.2またはemacs-w3m 1.3.X系の少し前の最新版
田岡> w3m-m17n-0.3.1+20020717

今、

Solaris7
XEmacs 21.4.8
emacs-w3m cvs の先頭
Mew cvs の先頭
w3m/0.3.1-m17n-20020717
Mule-UCS ははずす

で試してみたのですが、

(setq mew-shimbun-folder-groups
      '(("yomiuri"
	 ("yomiuri-html.shakai" . 2)
	 ("yomiuri-html.sports". 2)
	 ("yomiuri-html.seiji" . 2)
	 ("yomiuri-html.keizai" . 2)
	 ("yomiuri-html.kokusai". 2))))

という設定で、問題なく yomiuri のここ二日分の記事を取得できまし
た。田岡さんの shinbum 記事本体 (~/Mail/shimbun/yomiuri/10 など)
はどうなっていますか?

もし、記事自体が田岡さんのおっしゃる状態だとすると、

田岡> です。ただし、全部ではなく、読売新聞だとやく30%の記事でおこり、1つの記
田岡> 事全体がそうなります。気になるところは、

田岡> Content-Type: text/html; charset=X-UNKNOWN

田岡> となってたところです。正しく蓄えたものでは、X-UNKNOWNがISO-2022-JPとなっ
田岡> ています。
田岡> subjectが「**UNKNOWN CHARSET****UNKNOWN CHARSET**」となるものもありま
田岡> した。

shimbun で記事を持ってくるときは、少々 mew-shimbun.el で 手を加
えてはいますが、基本的には SEMI(というか FLIM?)のものそのままな
ので、そちらになにか問題があるのかもしれないです。上記の
X-UNKNOWN は記事の取得をしたときに FLIM がつけていると思われます。

# この "少々" がまずいかも?

ちなみに、ぼくのそちら方面の環境は
SEMI/1.14.4 (Hosorogi) FLIM/1.14.5 (Demachiyanagi) APEL/10.4
のようです。

## たまに cvs up するので、正確なバージョンはわからんです。
## これも WL でメールを書かないと出てこない ^^;;;

田岡> なお、上の環境で、Emacs 20や21で獲得して記事では、このような現象にはな
田岡> りません。

しかし、XEmacs でも Emacs 20/21 でも Mule-UCS を組み込んで

『w3m-m17n を UTF-8 で動かしていると、表示で化ける』

という大問題を発見してしまいました。こちらはあとで(ちょっと時間
がかかると思いますが)しらべます。

-- 
白井秀行 (mailto:shirai@rdmg.mgcs.mei.co.jp)