[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: Correct? Display Horizontal Ellipsis on UTF-8 env



飛田です。

;; ありがとうございます。_o_

>>>>> In [emacs-w3m : No.09337] 
>>>>>	Hideyuki SHIRAI (白井秀行) <shirai@xxxxxxxxxxx> wrote:
> 白井です。

> From: Shinichiro HIDA <shinichiro@xxxxxxxxxxxxx> さん曰く
> Subject: [emacs-w3m:09335] Correct? Display Horizontal Ellipsis on UTF-8 env
> Message-ID: <873b3g2009.wl%shinichiro@xxxxxxxxxxxxx>
> Date: Wed, 04 Apr 2007 14:15:34 +0900

> > いわゆる "てんてん"、 EUC-JP の A1C4、UTF-8 の U+2026 (Horizontal
> > Ellipsis - Three Dot Leader)、"…" を EUC-JP な html に書いて、Linux な
> > UTF-8 環境の emacs-w3m で表示すると、本来期待しているのと事なる文字
> > (EUC の A1C4 ではない)で表示されるようです。

> > http://www.stained-g.net/shinichiro/EUC-JP-Horizontal-Ellipsis.html 

>   character: 下に点が三つ (342438, #o1234646, #x539a6, U+2026)
>   charset: mule-unicode-0100-24ff (Unicode characters of the range U+0100..U+24FF.)

> になるのは正常な状態でしょう。だけど、

>     display: by this font (glyph code)
>      -Efont-Biwidth-Medium-R-Normal--14-140-75-75-P-70-ISO10646-1 (#x2026)

> とあるので、半角(?)で下のほうに点が三つ出ていませんか?

そうなんです。で、それを mixi-wl.el で投げたらど派手に文字化けしてしま
ったのでした。^^;;

> これを jisx0208 などの CJK で出したいなら、
> utf-translate-cjk-set-unicode-range() を使います。この辺の文字は
> ↓で日本語環境なら jisx0208 になると思います。

> (utf-translate-cjk-set-unicode-range '((?\x2000 . ?\x206F)))

> 素の Emacs だと、cjk 以外で表示出来る文字は cjk 以外で表示するよ
> うになっているので、いろいろ調べて
> utf-translate-cjk-set-unicode-range() を設定すると良いと思います。

やってみました。で、(?\x2000 . ?\x206F) の範囲だけを指定した状態だと、
今度は漢字が " ̄" に化けてしまい読めなくなったので、ちと手抜きをして、
CarbonEmacs の設定ファイル(1)から該当部分を頂いてきてそのまま設定してみ
ました。^^;;

(1) http://cvs.sourceforge.jp/cgi-bin/viewcvs.cgi/macemacsjp/CarbonEmacsPackage/GPL/site-start.d/carbon-emacs-japanese-init.el?rev=1.12

その状態で mixi-wl.el でもテストしてみたところ、"…" の入った文書に返信
しても化けずにコメントできました。

;; http://mixi.jp/view_diary.pl?id=392610004&owner_id=267980

> ただし、それでも

> > http://www.stained-g.net/shinichiro/EUC-JP-Horizontal-Ellipsis.html 
> > 4. by XHTML 1.1 Entity (by word &hellip;)

> は現状のまま mule-unicode-0100-24ff で表示します(これは、
> emacs-w3m が w3m.el で設定しています)。

> また、

> > 3. by HTML 4.0 Entity (not standard - &#133;)

> は 文字化け(フォント次第だと思うけど)します。

これ、HTML 4 においても非標準なので... 表示できないのが正しい動きのよう
な気がします。

> # Mule-UCS だと ~ になるのだけどなんで?

> > ;; http://lists.debian.or.jp/debian-devel/200703/msg00038.html で指摘さ
> > ;; れている問題のような気もしますが良く分かってません。

> ここで問題になっているところを Emacs22 は柔軟にユーザが設定でき
> る、ということだと思います。

なるほど。と言う事は、逆に言えば、素の w3m ではターミナル環境依存であり、
逃げようがない、という事なのでしょうか?

-- 
  Shinichiro HIDA  shinichiro@xxxxxxxxxxxxx
  GPG fingerprint = 5F2D 1656 FFF6 F691 A51C  5E61 E416 D398 470C 1CE9