[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: カナ (jisx0201) vs XEmacs



>>>>> In [emacs-w3m : No.01021] 
>>>>>	Hironori Sakamoto <h-saka@lsi.nec.co.jp> wrote:

>>> iso-2022-7bit-ss2 のとき、外の w3m に渡される文字列は
>>> (encode-coding-string (japanese-hankaku "カナ") 'iso-2022-7bit-ss2)
>>>  => "^[*I^[N6^[NE"

坂本さん> "^[*I" で G2 に JIS X 0201カナ を指示して "^[N" (Single Shift 2)
坂本さん> で一文字だけ G2 から GL に呼び出す ISO 2022 の 7bit 表現です。
坂本さん> w3m では扱えません。
坂本さん> # w3m-m17n は(サービス/お節介で)扱えます。w3mmee もおそらく。

どうも、ご解説ありがとうございます。
そのように XEmacs が encode したものを

>>>  => "^[(I6E^[(B"

の表現に変えてから binary で w3m に渡すなんてことはあまりにアホ
らしい (それにそう簡単ではない) ので、ここは素直に iso-2022-7bit
をデフォルトにしてしまうか、あらかじめ (X)Emacs 側で全角に変えて
しまう (*) のはどうでしょう。

(*) 残念ながら現在普通に世の中にある (X)Emacs は、pretest 版や
    beta 版も含めて半角の "ー" を全角に変換するルールにバグがあ
    るので、これだけ別枠の処理が必要です。

    (eq (japanese-zenkaku (make-char 'katakana-jisx0201 48))
	(make-char 'katakana-jisx0201 48))
     => t

    FSF Emacs はたぶん次の 21.0.104 か 21.1 で、XEmacs はきのう
    xemacs-patches@xemacs.org に出したパッチを apply してもらえ
    た段階で直りますが、すぐに世の中に浸透するはずもなし...。

坂本さん> ISO-2022-JP(-[123]) の規格外ですが、*お行儀の悪い*アプリが
坂本さん> ISO-2022-JP として出力してしまうことが多いので w3m も扱います。

坂本さん> # 共に外部との通信で使うのは良くないことだと思います。

なるほど。
-- 
Katsumi Yamaoka <yamaoka@jpl.org>