[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: w3mmee vs emacs-w3m problems
こんにちは、白井です。
# 確認が遅くなって申し訳ないです。(_ _)
From: Kiyokazu SUTO <suto@ks-and-ks.ne.jp> さん曰く
Subject: [emacs-w3m:00738] Re: w3mmee vs emacs-w3m problems (was: ...)
Message-ID: <20010510-224048-013e3.suto@ks-and-ks.ne.jp>
Date: 10 May 2001 22:40:48 +0900
(1)、(2) は動作を確認しました。ありがとうございます。
suto> > (3) deflate/inflate
suto>
suto> w3mmee自身に「Content-Encoding: deflate」を処理させるためには、
申し訳ないです。Manual 類の読みが足りませんでした。
suto> > ## この前、inflate.c にも Win32 BINARY 問題があるのに気付いてし
suto> > ## まったけど ^^;;;
suto>
suto> w3m-devでの議論をちゃんと追っていないんですけど、環境変数を適当に設定
suto> することで逃げられるような話じゃなかったでしょうか。
実は私も結論が良くわかっていません。^^;;;
emacs-w3m として使うときは elisp から local に環境変数
'CYGWIN=binmode tty' を bind すれば良いと思います。だけど、
Windows 全体で上記の環境変数を縛るのは、他のアプリで弊害が出そう
なので、私はやっていません。inflate の改造だけなら簡単だし。:-)
# w3m/0.2.1+mee-p19-pre59 で BINARY の設定をしてくださるようになっ
# たのですね。ありがとうございます。
suto> > この coding-system の矛盾は実際に decode して表示するときは
suto> > w3m-decode-all-to-this-charset 変数があるので、問題が無いのです
suto> > が、emacs-w3m が内部で cache するときには
suto> >
suto> > Content-Type: text/html; charset=iso-2022-jp
suto> >
suto> > の iso-2022-jp を使うため cache 内で矛盾が生じてしまいます。
suto>
suto> 私の投稿したw3m.el用のパッチでcoding-systemの処理を一切しなくなる
suto> (w3mmee側の端末出力用encodingに対応するcoding-systemに固定される)ので、
suto> 問題は無い筈と思いますが、何か実際に問題が起きたのでしょうか。
えっと、マニアックな使い方ですが、
(1) -dump=extra,head,decode で w3m-decode-all-to-this-charset を
拘束して、web を読んでいる。
(2) 手動で -dump=extra,head,source や "w3m" の設定に変えて、さっ
きみた page に戻る。
と、なにか矛盾が生じるのではないか?と思ったのでした。だけど、
-dump=extra... は cache を読むときはやらないから問題ないですね。
## という気がする、というだけで確かめていないのですが。
suto> > W3M-Document-Charset: euc-jp
suto>
suto> これは簡単だし、わざわざ矛盾する情報を出力する必要も無いでしょうから、
suto> このように変更します。
ありがとうございます。emacs-w3m での charset の解析で
W3M-Document-Charset を優先するようにすれば、こういう杞憂も無く
なると思います。[2]
あと、w3mmee を使う上での問題は、さっき気付いてしまったのですが、
w3mmee を libmoe 付きで make し、-dump=extra,head,source で使うと、
W3M-Document-Charset: x-moe-internal
になることがあるので、emacs 側でこれをどうやって扱うか、だと思い
ます。
日本語混じりの frame だと、index.html は ASCII な時がほとんどで
すが、そいつから読んでいる <frame src="xxx"> が日本語などを含ん
でいると x-moe-internal になるようです。
# さっき、この問題に気付いたばかりなので解決策等は全然わかってい
# ません。ぱっと考えると、w3m-halfdump-expand-options での "-I"
# の値と w3m-input-coding-system をダイナミックに変えるようにし
# て、x-moe-internal は raw-text で扱えば大丈夫なような気がしま
# す。だけど、source の保存で x-moe-internal のままだと、ちょっ
# と困るな。どうしよう ^^;;; [1]
と、ここまで書いて送信しようと思っていたら、土屋さんの
[emacs-w3m:00756] が届きました ^^;
From: TSUCHIYA Masatoshi <tsuchiya@pine.kuee.kyoto-u.ac.jp> さん曰く
Subject: [emacs-w3m:00756] Re: w3mmee vs emacs-w3m problems (was: ...)
Message-ID: <20010514110112U.1000@pine.kuee.kyoto-u.ac.jp>
Date: 14 May 2001 11:01:10 +0900
土屋さんが書いている (1)〜(5) の処理は、まさに ↑[1] と同等の処
理になると思います。
[2] は結論が出るまで pending しておきます。
土> また、w3mmee 側で具体的に必要になる変更は、
土>
土> ・-I オプションの拡張
土> e/s ばかりでなく、汎用の MIME charset 指定文字列を取れるようにする
これは、w3mmee を moe 付き(many language)で make すると、
-I e|s document code
から
-I <charset> document charset
に変わるので、w3mmee 側は問題ないのですよね。
あとは、x-moe-internal をどうするかの様な気がします。
--
白井秀行 (mailto:shirai@rdmg.mgcs.mei.co.jp)