[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: w3m-euc-japan
>>>>> In [emacs-w3m : No.00873]
>>>>> TSUCHIYA Masatoshi <tsuchiya@pine.kuee.kyoto-u.ac.jp> wrote:
山> 哀れな XEmacs ユーザに w3m-euc-japan と euc-japan の違いを教えて
山> 下さい。
土屋さん> わずかに3文字ほど余分な文字があるだけです。
土屋さん> 1バイトコード部分
土屋さん> 0x00 〜 0x7F は、通常の ASCII。0x80, 0x90〜0x9F は通常利
土屋さん> 用されていないので、この部分が w3m の内部制御文字として
土屋さん> 利用されている。現在(w3m-0.2.1)は 0x80, 0x90, 0x91 を使っ
土屋さん> ている。
土屋さん> 2バイトコード部分
土屋さん> 通常の euc-japan と同じ。1バイト目は 0x8E または 0xA1 〜
土屋さん> 0xFE、2バイト目は 0xA1 〜 0xFE。
土屋さん> 3バイトコード部分
土屋さん> 通常の euc-japan と同じ。1バイト目は 0x8F、2バイト目およ
土屋さん> び3バイト目は 0xA1 〜 0xFE。
どうもありがとうございます。情報として必要十分です。
;; 問題はこれを XEmacs でどう料理するかだなあ。FSFmacs みたいに
;; unibyte という状態が存在しないわけで...。
土屋さん> # euc-japan が実は iso-2022 に準拠した文字コードだということ
土屋さん> # を、今回初めて知りました。
(decode-coding-string (encode-coding-string "あ" 'iso-2022-7bit) 'euc-japan)
=> "あ"
;; XEmacs の実装です。:-p
山> ;; GIF anime にうつつを抜かしている間に、日本語のページがまった
山> ;; く読めなくなっていることに気がつきました。
土屋さん> あれま。おっかしいなあ、[emacs-w3m:00786] を出したときには
土屋さん> XEmacs でも試したのですが、問題なく読めていたんですけど…。
うーむうーむ、苦し紛れにちょっと大きなものを付けます。すみません。