[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: Correct? Display Horizontal Ellipsis on UTF-8 env



白井です。

From: Shinichiro HIDA <shinichiro@xxxxxxxxxxxxx> さん曰く
Subject: [emacs-w3m:09335] Correct? Display Horizontal Ellipsis on UTF-8 env
Message-ID: <873b3g2009.wl%shinichiro@xxxxxxxxxxxxx>
Date: Wed, 04 Apr 2007 14:15:34 +0900

> いわゆる "てんてん"、 EUC-JP の A1C4、UTF-8 の U+2026 (Horizontal
> Ellipsis - Three Dot Leader)、"…" を EUC-JP な html に書いて、Linux な
> UTF-8 環境の emacs-w3m で表示すると、本来期待しているのと事なる文字
> (EUC の A1C4 ではない)で表示されるようです。

> http://www.stained-g.net/shinichiro/EUC-JP-Horizontal-Ellipsis.html 

  character: 下に点が三つ (342438, #o1234646, #x539a6, U+2026)
  charset: mule-unicode-0100-24ff (Unicode characters of the range U+0100..U+24FF.)

になるのは正常な状態でしょう。だけど、

    display: by this font (glyph code)
     -Efont-Biwidth-Medium-R-Normal--14-140-75-75-P-70-ISO10646-1 (#x2026)

とあるので、半角(?)で下のほうに点が三つ出ていませんか?

これを jisx0208 などの CJK で出したいなら、
utf-translate-cjk-set-unicode-range() を使います。この辺の文字は
↓で日本語環境なら jisx0208 になると思います。

(utf-translate-cjk-set-unicode-range '((?\x2000 . ?\x206F)))

素の Emacs だと、cjk 以外で表示出来る文字は cjk 以外で表示するよ
うになっているので、いろいろ調べて
utf-translate-cjk-set-unicode-range() を設定すると良いと思います。

ただし、それでも

> http://www.stained-g.net/shinichiro/EUC-JP-Horizontal-Ellipsis.html 
> 4. by XHTML 1.1 Entity (by word &hellip;)

は現状のまま mule-unicode-0100-24ff で表示します(これは、
emacs-w3m が w3m.el で設定しています)。

また、

> 3. by HTML 4.0 Entity (not standard - &#133;)

は 文字化け(フォント次第だと思うけど)します。

# Mule-UCS だと ~ になるのだけどなんで?

> ;; http://lists.debian.or.jp/debian-devel/200703/msg00038.html で指摘さ
> ;; れている問題のような気もしますが良く分かってません。

ここで問題になっているところを Emacs22 は柔軟にユーザが設定でき
る、ということだと思います。

-- 
白井秀行 (mailto:shirai@xxxxxxxxxxx)