[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: w3m-filter and w3mmee/w3m-m17n



tis620 にこだわっています ^^;;;

From: TSUCHIYA Masatoshi <tsuchiya@pine.kuee.kyoto-u.ac.jp> さん曰く
Subject: [emacs-w3m:05502] Re: w3m-filter and w3mmee/w3m-m17n
Message-ID: <20030717103057A.1000@pine.kuee.kyoto-u.ac.jp>
Date: Thu, 17 Jul 2003 10:30:56 +0900

>> On Wed, 16 Jul 2003 18:51:26 +0900 (JST)
>> 「白井」== shirai@rdmg.mgcs.mei.co.jp (Hideyuki SHIRAI (白井秀行)) said as follows:

白井> 最近の変更がさっぱりわかっていないのですが、w3m-decode-buffer() 
白井> で取得している w3m-current-content-charset を使っているところが
白井> ないのですが、そのせいかしらん?

土> 以前とは異なり,w3m-rendering-half-dump() の charset 引数が optional 
土> から necessary になっていて,それできちんと受け渡しをするようになっ
土> て‥‥ませんね.

土> 添付の変更が必要かも知れないです.

土>  					(or charset
土> -					    (w3m-arrived-content-charset url))
土> +					    (w3m-arrived-content-charset url)
土> +					    (w3m-content-charset url))

w3m-content-charset() は header 領域しか見ないから、body の META
tag に charset が書いてあってもだめですよね。現状だと、
w3m-decode-buffer() しないと、それはみつからないわけです。

だから、w3m-create-page() 内部で w3m-safe-decode-buffer =>
w3m-decode-buffer しないと charset が確定しない page があって、
tis620 のような扱いにくい charset の page がへんなふうになっちゃ
う。(というか大体そうみたい)

# で、ついでに、現状では w3m-decode-buffer で検出した charset が
# 使われていない。

そこで、質問

(1) w3m-safe-decode-buffer() が w3m-create-page() 内部と、そこか
    ら呼ばれる w3m-create-text-page() とで 2回実行されているのだ
    けど、なにか意味はありますか? w3m-create-page() の方だけで
    よいですか?

(2) w3m-create-page() で w3m-safe-decode-buffer() する前に、
    w3m-prepare-content() を呼んでいるけど、この順番を逆にしちゃ
    だめ? w3mmee 使っていて buffer が x-moe-internal になってい
    たらどうするの?

(3) (2) に関連して、w3m-content-type-alist の function な filter
    ってなにをするんですか? 現在の w3m-filter() を廃止するのか
    しら?

このへんがクリアになれば、w3m-decode-buffer() で設定する
w3m-current-content-charset を w3m-create-page() で charset に入
れてやれば問題なくなります。

# w3m-m17n の威力を再確認しました。

まだ、w3m-region() は考えていないけど、こちらも考えると、META
Tag から charset を抜き出す関数を別に設けた方が良いかもしれない
です。

-- 
白井秀行 (mailto:shirai@rdmg.mgcs.mei.co.jp)

# 全然読み書き出来ないのに、なぜか昔から tis620 の話があると燃える