[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: w3m-euc-japan



>>>>> In [emacs-w3m : No.00873] 
>>>>>	TSUCHIYA Masatoshi <tsuchiya@pine.kuee.kyoto-u.ac.jp> wrote:

山> 哀れな XEmacs ユーザに w3m-euc-japan と euc-japan の違いを教えて
山> 下さい。

土屋さん> わずかに3文字ほど余分な文字があるだけです。

土屋さん> 1バイトコード部分
土屋さん>     0x00 〜 0x7F は、通常の ASCII。0x80, 0x90〜0x9F は通常利
土屋さん>     用されていないので、この部分が w3m の内部制御文字として
土屋さん>     利用されている。現在(w3m-0.2.1)は 0x80, 0x90, 0x91 を使っ
土屋さん>     ている。

土屋さん> 2バイトコード部分
土屋さん>     通常の euc-japan と同じ。1バイト目は 0x8E または 0xA1 〜 
土屋さん>     0xFE、2バイト目は 0xA1 〜 0xFE。

土屋さん> 3バイトコード部分
土屋さん>     通常の euc-japan と同じ。1バイト目は 0x8F、2バイト目およ
土屋さん>     び3バイト目は 0xA1 〜 0xFE。

どうもありがとうございます。情報として必要十分です。

;; 問題はこれを XEmacs でどう料理するかだなあ。FSFmacs みたいに
;; unibyte という状態が存在しないわけで...。

土屋さん> # euc-japan が実は iso-2022 に準拠した文字コードだということ
土屋さん> # を、今回初めて知りました。

(decode-coding-string (encode-coding-string "あ" 'iso-2022-7bit) 'euc-japan)
 => "あ"
;; XEmacs の実装です。:-p

山> ;; GIF anime にうつつを抜かしている間に、日本語のページがまった
山> ;; く読めなくなっていることに気がつきました。

土屋さん> あれま。おっかしいなあ、[emacs-w3m:00786] を出したときには 
土屋さん> XEmacs でも試したのですが、問題なく読めていたんですけど…。

うーむうーむ、苦し紛れにちょっと大きなものを付けます。すみません。

PNG image