[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: User specified content type / w3mmeesupport



From: TSUCHIYA Masatoshi <tsuchiya@pine.kuee.kyoto-u.ac.jp> さん曰く
Subject: [emacs-w3m:00847] Re: User specified content type / w3mmee support
Message-ID: <mpaheyem9ad.fsf@azalea.kuee.kyoto-u.ac.jp>
Date: 22 May 2001 11:01:30 +0900

>> On Tue, 22 May 2001 10:49:04 +0900 (JST)
>> 「白井」== shirai@rdmg.mgcs.mei.co.jp (Hideyuki SHIRAI (白井秀行)) said as follows:

土>    (2) 上記、Content-type との関連するが、w3mmee に対応するために、
土>        coding-system の扱いが複雑化してしまっている。これをうまく切り
土>        分けられるように界面を整理したい。

白井> w3mmee は libmoe 付きと libmoe なしと二種類使っているのですが、
白井> emacs-w3m から使ったときに微妙に挙動が違って、化けるページもそれ
白井> ぞれ違ってくるので、その辺を追求しないとダメですね。

なんかどこかの単純 miss の様な気がしてきました。euc-jp じゃなきゃ
いけないのに x-unknow になっているときがある。

# しかし、追求している時間/余裕がない ;_;

土> まだ x-moe-internal の仕様が良く理解できていないので、CCL が書けていま
土> せん。そのため、現実装では w3mmee の出力は、標準 w3m と同じ拡張された
土> 日本語EUC であると決め打ちで処理されています。したがって、EUC-JP で出
土> 力されるページは化けないでしょうし、EUC-JP 以外で出るページは化けるで
土> しょう

土> ですから、

土>   (1) x-moe-internal をきちんと理解して、これに対応する CCL を書く
土>   (2) w3mmee にオプションを渡して、-halfdump の出力には x-moe-internal 
土>       を使って貰うようにする

x-moe-internal はあくまで w3mmee の内部コードなので、出力である
-dump=half が x-moe-internal を吐き出す、ということはないと思い
ます。

(1) w3mmee -dump=extra,head,source => この出力が x-moe-internal
 になる。(frame など)
 
(2) 上記の x-moe-internal をそのまま w3mmee に渡し、w3mmee
 -dump=half すると、(設定に依存するが) euc-jp で出力される。

という感じなので、Emacs で x-moe-internal を直接扱うことはないで
す。だけど、about://source/ したときに、x-moe-internal を decode
できないと表示が化けまくると思いますが。


Decode なら、以下、まったく自身はありませんけど。。。

http://pub.ks-and-ks.ne.jp/prog/libmoe/ より

Internal multiple octet encoding
UCP less than 0x80:
    0xxxxxxx,
UCP greater than or equal to 0x80:
    111111xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx.

から 'x' を抜き出して ucs-4 にして、rfc2279 より


   UCS-4 range (hex.)           UTF-8 octet sequence (binary)
   0000 0000-0000 007F   0xxxxxxx
   0000 0080-0000 07FF   110xxxxx 10xxxxxx
   0000 0800-0000 FFFF   1110xxxx 10xxxxxx 10xxxxxx

   0001 0000-001F FFFF   11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
   0020 0000-03FF FFFF   111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
   0400 0000-7FFF FFFF   1111110x 10xxxxxx ... 10xxxxxx

で utf-8 に変換すれば Emacs + Mule-UCS で表示できるのかな?
ccl の実装は全くできませんけど。:-)

白井> P.S.
白井> 最近、w3m-m17n も使うようになりました。-dump だと大丈夫なのです
白井> が、-halfdump 時に x0213 が化けるのがちょっとだけ悲しいです。

土> w3m-m17n だとまた違うコード系で出力されるのでしょうか?

う〜ん、良くわかっていないのですが、halfdump で、

From: Hideyuki SHIRAI (白井秀行) <shirai@rdmg.mgcs.mei.co.jp> 曰く
Subject: [emacs-w3m:00695] Re: Menu
Message-ID: <20010507.112829.01446498.shirai@pepper.rdmg.mgcs.mei.co.jp>
Date: Mon, 07 May 2001 11:28:29 +0900 (JST)

白井> もう一点、(我が:-)東京讀賣巨人軍が『試合中』に
白井> 
白井> http://yakyu-score.cplaza.ne.jp/regular/giants/game/index.html
白井> 
白井> にアクセスするとわかるのですが、
白井> 
白井> <a href="javascript:showWin(&#39;http://giants.yomiuri.co.jp/game_2001/detail_12a.html&#39;)"></a>
白井> 
白井> な感じで <a ..></a> となっていると、\220 が出てしまうので、
白井> w3m-extended-characters-table に \x90 を追加しました。

は違うコードだった記憶があります。

-- 
白井秀行 (mailto:shirai@rdmg.mgcs.mei.co.jp)