[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: w3mmee vs emacs-w3m problems (was: ...)



Citation (with leading "> " of each line) from article:
  <20010510.193736.68554901.shirai@rdmg.mgcs.mei.co.jp>
    by Hideyuki SHIRAI (白井秀行) <shirai@rdmg.mgcs.mei.co.jp> :
> #0  0xfef8a89c in fileno () from /usr/lib/libc.so.1
> (gdb) where
> #0  0xfef8a89c in fileno () from /usr/lib/libc.so.1
> #1  0xff13484c in mb_find_info () from /usr/local/lib/libmoe.so
> #2  0xff135580 in mb_fflush () from /usr/local/lib/libmoe.so
> #3  0x80568 in refresh ()
> #4  0x5de88 in displayBuffer ()
> #5  0x479a8 in rFrame ()
> #6  0x40cf0 in main ()

あぅ、w3mmeeのバグです^^;。

# うちのlibcはfileno()にNULLチェックがあるらしく、何事もなく終わってし
# まう。

> (2) -dump=extra,head,decode で binary data をとってくると、
>  source 部分にも変換がかかってしまうようです。
>
> % w3mmee -dump=extra,head,source http://namazu.org/~tsuchiya/emacs-w3m/w3m-el.png > z1.txt
> % w3mmee -dump=extra,head,decode http://namazu.org/~tsuchiya/emacs-w3m/w3m-el.png > z2.txt
> % ls -la
> -rw-r--r--   1 shirai   rd3          5250 May 10 18:47 z1.txt
> -rw-r--r--   1 shirai   rd3          6065 May 10 18:48 z2.txt
>
> z1.txt から extra,head 部分を消すと正常な画像になりますが、
> z2.txt からは × です。

うーん、修正した筈だったけどまだ不十分だったとは。今晩直すように努力し
ます。

> (3) deflate/inflate
>  http://cvs.m17n.org/~akr/diary にアクセルすると、
>
> % w3mmee -dump=extra,head,source http://cvs.m17n.org/~akr/diary/
> W3M-Current-URL: http://cvs.m17n.org/~akr/diary/
> W3M-Document-Charset: iso-8859-1
> HTTP/1.1 406 Not Acceptable
> DeleGate-Ver: 5.9.12 (delay=0)
> Date: Thu, 10 May 2001 09:55:50 GMT
> Server: Apache/1.3.9 (Unix) Debian/GNU
> Alternates: {"index.html" 1 {type text/plain} {charset iso-2022-jp} {encoding deflate} {length 3537}}
> Vary: negotiate
> TCN: list
> Content-Type: text/html; charset=iso-8859-1
> Via: 1.0 - (DeleGate/5.9.12)
>
> 406

w3mmee自身に「Content-Encoding: deflate」を処理させるためには、
~/.w3mmee/configに

  accept_encoding deflate application/x-deflate inflate inflate

~/.mime.typesに

  application/x-deflate	deflate

が必要で、あればHTTPリクエストに適切な「Accept-Encoding:」ヘッダを追加
してくれる筈です。

…が、ドキュメントのどこにもそういう記述がありませんね^^;。
doc{,-jp}/README.mee.config{,.html}のaccept_encodingオプションの説明に
記述を追加しておきます。

> ## この前、inflate.c にも Win32 BINARY 問題があるのに気付いてし
> ## まったけど ^^;;;

w3m-devでの議論をちゃんと追っていないんですけど、環境変数を適当に設定
することで逃げられるような話じゃなかったでしょうか。

> この coding-system の矛盾は実際に decode して表示するときは
> w3m-decode-all-to-this-charset 変数があるので、問題が無いのです
> が、emacs-w3m が内部で cache するときには
>
> Content-Type: text/html; charset=iso-2022-jp
>
> の iso-2022-jp を使うため cache 内で矛盾が生じてしまいます。

私の投稿したw3m.el用のパッチでcoding-systemの処理を一切しなくなる
(w3mmee側の端末出力用encodingに対応するcoding-systemに固定される)ので、
問題は無い筈と思いますが、何か実際に問題が起きたのでしょうか。

いずれにしても

> W3M-Document-Charset: euc-jp
>
> とできないでしょうか?

これは簡単だし、わざわざ矛盾する情報を出力する必要も無いでしょうから、
このように変更します。

-- 
須藤 清一 <suto@ks-and-ks.ne.jp>
http://pub.ks-and-ks.ne.jp/pgp-public-key.html