[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: w3mmee vs emacs-w3m problems



こんにちは、白井です。

# 確認が遅くなって申し訳ないです。(_ _)

From: Kiyokazu SUTO <suto@ks-and-ks.ne.jp> さん曰く
Subject: [emacs-w3m:00738] Re: w3mmee vs emacs-w3m problems (was: ...)
Message-ID: <20010510-224048-013e3.suto@ks-and-ks.ne.jp>
Date: 10 May 2001 22:40:48 +0900

(1)、(2) は動作を確認しました。ありがとうございます。

suto> > (3) deflate/inflate
suto> 
suto> w3mmee自身に「Content-Encoding: deflate」を処理させるためには、

申し訳ないです。Manual 類の読みが足りませんでした。

suto> > ## この前、inflate.c にも Win32 BINARY 問題があるのに気付いてし
suto> > ## まったけど ^^;;;
suto> 
suto> w3m-devでの議論をちゃんと追っていないんですけど、環境変数を適当に設定
suto> することで逃げられるような話じゃなかったでしょうか。

実は私も結論が良くわかっていません。^^;;;

emacs-w3m として使うときは elisp から local に環境変数
'CYGWIN=binmode tty' を bind すれば良いと思います。だけど、
Windows 全体で上記の環境変数を縛るのは、他のアプリで弊害が出そう
なので、私はやっていません。inflate の改造だけなら簡単だし。:-)

# w3m/0.2.1+mee-p19-pre59 で BINARY の設定をしてくださるようになっ
# たのですね。ありがとうございます。

suto> > この coding-system の矛盾は実際に decode して表示するときは
suto> > w3m-decode-all-to-this-charset 変数があるので、問題が無いのです
suto> > が、emacs-w3m が内部で cache するときには
suto> >
suto> > Content-Type: text/html; charset=iso-2022-jp
suto> >
suto> > の iso-2022-jp を使うため cache 内で矛盾が生じてしまいます。
suto> 
suto> 私の投稿したw3m.el用のパッチでcoding-systemの処理を一切しなくなる
suto> (w3mmee側の端末出力用encodingに対応するcoding-systemに固定される)ので、
suto> 問題は無い筈と思いますが、何か実際に問題が起きたのでしょうか。

えっと、マニアックな使い方ですが、

(1) -dump=extra,head,decode で w3m-decode-all-to-this-charset を
 拘束して、web を読んでいる。

(2) 手動で -dump=extra,head,source や "w3m" の設定に変えて、さっ
 きみた page に戻る。

と、なにか矛盾が生じるのではないか?と思ったのでした。だけど、
-dump=extra... は cache を読むときはやらないから問題ないですね。

## という気がする、というだけで確かめていないのですが。

suto> > W3M-Document-Charset: euc-jp
suto> 
suto> これは簡単だし、わざわざ矛盾する情報を出力する必要も無いでしょうから、
suto> このように変更します。

ありがとうございます。emacs-w3m での charset の解析で
W3M-Document-Charset を優先するようにすれば、こういう杞憂も無く
なると思います。[2]

あと、w3mmee を使う上での問題は、さっき気付いてしまったのですが、
w3mmee を libmoe 付きで make し、-dump=extra,head,source で使うと、

W3M-Document-Charset: x-moe-internal

になることがあるので、emacs 側でこれをどうやって扱うか、だと思い
ます。
日本語混じりの frame だと、index.html は ASCII な時がほとんどで
すが、そいつから読んでいる <frame src="xxx"> が日本語などを含ん
でいると x-moe-internal になるようです。

# さっき、この問題に気付いたばかりなので解決策等は全然わかってい
# ません。ぱっと考えると、w3m-halfdump-expand-options での "-I"
# の値と w3m-input-coding-system をダイナミックに変えるようにし
# て、x-moe-internal は raw-text で扱えば大丈夫なような気がしま
# す。だけど、source の保存で x-moe-internal のままだと、ちょっ
# と困るな。どうしよう ^^;;; [1]

と、ここまで書いて送信しようと思っていたら、土屋さんの
[emacs-w3m:00756] が届きました ^^;

From: TSUCHIYA Masatoshi <tsuchiya@pine.kuee.kyoto-u.ac.jp> さん曰く
Subject: [emacs-w3m:00756] Re: w3mmee vs emacs-w3m problems (was: ...)
Message-ID: <20010514110112U.1000@pine.kuee.kyoto-u.ac.jp>
Date: 14 May 2001 11:01:10 +0900

土屋さんが書いている (1)〜(5) の処理は、まさに ↑[1] と同等の処
理になると思います。
[2] は結論が出るまで pending しておきます。

土> また、w3mmee 側で具体的に必要になる変更は、
土> 
土>   ・-I オプションの拡張
土>     e/s ばかりでなく、汎用の MIME charset 指定文字列を取れるようにする

これは、w3mmee を moe 付き(many language)で make すると、

    -I e|s           document code
から
    -I <charset>     document charset

に変わるので、w3mmee 側は問題ないのですよね。
あとは、x-moe-internal をどうするかの様な気がします。

-- 
白井秀行 (mailto:shirai@rdmg.mgcs.mei.co.jp)