[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: "•" → 半角中黒
- From: ARISAWA Akihiro <ari@xxxxxxxxxxxxx>
- Date: Wed, 18 Aug 2010 20:02:17 +0900
- X-ml-name: emacs-w3m
- X-mail-count: 11316
- References: <87aaolb7gg.fsf@xxxxxxxxx> <b4mlj844vrf.fsf@xxxxxxx> <b4md3tg4uy9.fsf_-_@xxxxxxx>
Katsumi Yamaoka writes:
> [emacs-w3m:11310] に書いたように "•" のようなものを可視文字
> (この場合は半角の "・") に変換するテーブルが必要だと思います。
>
> その記事に添付したパッチでは、`w3m-entity-table' に記号と文字コー
> ドの対応表を追加して、`w3m-entity-value' で優先的に取扱います。
> もっとスマートなやり方があるでしょうか?
数値文字参照は ISO 10646 の文字を指定するものです。
cf. http://www.asahi-net.or.jp/~sd5a-ucd/rec-html401j/charset.html#h-5.3.1
でもって、本来 U+80〜U+9F の間は <control> です。
cf. http://www.unicode.org/charts/PDF/U0080.pdf
;; ISO 10646 の方を眺めたら何も割りあたってなかったけど気にしない(^^;
しかし、多くの(Windowsの?)ブラウザは CP1252 の文字として扱っていると
思われます。ということで、対応するなら • だけでなく、#x128; 〜 #x159; や
#x80; 〜 #x9F; も対応しないと中途半端に思えます。
;; 週末以降でよければ、考えてみます。
--
有沢 明宏