[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: 多文字セット化 emacs-w3m



>> On Fri, 07 Sep 2001 23:57:16 +0900
>> 「土」== tsuchiya@pine.kuee.kyoto-u.ac.jp (TSUCHIYA Masatoshi) said as follows:

土> ただ、この実装のテストをしていて気が付いたのですが、キリンの「リン」の
土> 字が、私の手元では、きちんと1対1対応していないのですが、これを直すには
土> どのように設定したら良いでしょうか。

と、1対1対応しない例を記述したつもりだったのですが、UTF-8 にエンコード
された瞬間、実例ではなくなってしまいましたね。

つまり、以下の2つの式の値が等しくなるようにするには、どうしたら良いで
しょうか? という質問です。

    (make-char 'japanese-jisx0212 ?\151 ?\121)
    -> 95441

    (ucs-to-char
     (char-to-ucs
      (make-char 'japanese-jisx0212 ?\151 ?\121)))
    -> 147251


この件と関係して、CCL についての資料を色々と調べたのですが、某所で偉い
人が「文字列の書き込み/読み込み時には (write|read)-multibyte-character 
を利用するべきだ」と発言されていらっしゃったので、
w3m-euc-japan-decoder をそういうように変更しました。

それから、universal-coding-system-argument() によって指定されたコード
を w3m-find-file() が参照するようになりました。したがって、C-x RET c
euc-japan RET M-x w3m-find-file filename RET という使い方ができます。

-- 
土屋 雅稔  ( TSUCHIYA Masatoshi )
    http://www-nagao.kuee.kyoto-u.ac.jp/member/tsuchiya/