[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re:
カナ
(jisx0201) vs XEmacs
>>>>> In [emacs-w3m : No.01021]
>>>>> Hironori Sakamoto <h-saka@lsi.nec.co.jp> wrote:
>>> iso-2022-7bit-ss2 のとき、外の w3m に渡される文字列は
>>> (encode-coding-string (japanese-hankaku "カナ") 'iso-2022-7bit-ss2)
>>> => "^[*I^[N6^[NE"
坂本さん> "^[*I" で G2 に JIS X 0201カナ を指示して "^[N" (Single Shift 2)
坂本さん> で一文字だけ G2 から GL に呼び出す ISO 2022 の 7bit 表現です。
坂本さん> w3m では扱えません。
坂本さん> # w3m-m17n は(サービス/お節介で)扱えます。w3mmee もおそらく。
どうも、ご解説ありがとうございます。
そのように XEmacs が encode したものを
>>> => "^[(I6E^[(B"
の表現に変えてから binary で w3m に渡すなんてことはあまりにアホ
らしい (それにそう簡単ではない) ので、ここは素直に iso-2022-7bit
をデフォルトにしてしまうか、あらかじめ (X)Emacs 側で全角に変えて
しまう (*) のはどうでしょう。
(*) 残念ながら現在普通に世の中にある (X)Emacs は、pretest 版や
beta 版も含めて半角の "ー" を全角に変換するルールにバグがあ
るので、これだけ別枠の処理が必要です。
(eq (japanese-zenkaku (make-char 'katakana-jisx0201 48))
(make-char 'katakana-jisx0201 48))
=> t
FSF Emacs はたぶん次の 21.0.104 か 21.1 で、XEmacs はきのう
xemacs-patches@xemacs.org に出したパッチを apply してもらえ
た段階で直りますが、すぐに世の中に浸透するはずもなし...。
坂本さん> ISO-2022-JP(-[123]) の規格外ですが、*お行儀の悪い*アプリが
坂本さん> ISO-2022-JP として出力してしまうことが多いので w3m も扱います。
坂本さん> # 共に外部との通信で使うのは良くないことだと思います。
なるほど。
--
Katsumi Yamaoka <yamaoka@jpl.org>