[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: "•" → 半角中黒



Katsumi Yamaoka writes:

> [emacs-w3m:11310] に書いたように "•" のようなものを可視文字
> (この場合は半角の "・") に変換するテーブルが必要だと思います。
>
> その記事に添付したパッチでは、`w3m-entity-table' に記号と文字コー
> ドの対応表を追加して、`w3m-entity-value' で優先的に取扱います。
> もっとスマートなやり方があるでしょうか?

数値文字参照は ISO 10646 の文字を指定するものです。
cf. http://www.asahi-net.or.jp/~sd5a-ucd/rec-html401j/charset.html#h-5.3.1

でもって、本来 U+80〜U+9F の間は <control> です。
cf. http://www.unicode.org/charts/PDF/U0080.pdf
;; ISO 10646 の方を眺めたら何も割りあたってなかったけど気にしない(^^;

しかし、多くの(Windowsの?)ブラウザは CP1252 の文字として扱っていると
思われます。ということで、対応するなら &#149; だけでなく、#x128; 〜 #x159; や
#x80; 〜 #x9F; も対応しないと中途半端に思えます。

;; 週末以降でよければ、考えてみます。

-- 
有沢 明宏