[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Correct? Display Horizontal Ellipsis on UTF-8 env
飛田です。
;; ありがとうございます。_o_
>>>>> In [emacs-w3m : No.09337]
>>>>> Hideyuki SHIRAI (白井秀行) <shirai@xxxxxxxxxxx> wrote:
> 白井です。
> From: Shinichiro HIDA <shinichiro@xxxxxxxxxxxxx> さん曰く
> Subject: [emacs-w3m:09335] Correct? Display Horizontal Ellipsis on UTF-8 env
> Message-ID: <873b3g2009.wl%shinichiro@xxxxxxxxxxxxx>
> Date: Wed, 04 Apr 2007 14:15:34 +0900
> > いわゆる "てんてん"、 EUC-JP の A1C4、UTF-8 の U+2026 (Horizontal
> > Ellipsis - Three Dot Leader)、"…" を EUC-JP な html に書いて、Linux な
> > UTF-8 環境の emacs-w3m で表示すると、本来期待しているのと事なる文字
> > (EUC の A1C4 ではない)で表示されるようです。
> > http://www.stained-g.net/shinichiro/EUC-JP-Horizontal-Ellipsis.html
> character: 下に点が三つ (342438, #o1234646, #x539a6, U+2026)
> charset: mule-unicode-0100-24ff (Unicode characters of the range U+0100..U+24FF.)
> になるのは正常な状態でしょう。だけど、
> display: by this font (glyph code)
> -Efont-Biwidth-Medium-R-Normal--14-140-75-75-P-70-ISO10646-1 (#x2026)
> とあるので、半角(?)で下のほうに点が三つ出ていませんか?
そうなんです。で、それを mixi-wl.el で投げたらど派手に文字化けしてしま
ったのでした。^^;;
> これを jisx0208 などの CJK で出したいなら、
> utf-translate-cjk-set-unicode-range() を使います。この辺の文字は
> ↓で日本語環境なら jisx0208 になると思います。
> (utf-translate-cjk-set-unicode-range '((?\x2000 . ?\x206F)))
> 素の Emacs だと、cjk 以外で表示出来る文字は cjk 以外で表示するよ
> うになっているので、いろいろ調べて
> utf-translate-cjk-set-unicode-range() を設定すると良いと思います。
やってみました。で、(?\x2000 . ?\x206F) の範囲だけを指定した状態だと、
今度は漢字が " ̄" に化けてしまい読めなくなったので、ちと手抜きをして、
CarbonEmacs の設定ファイル(1)から該当部分を頂いてきてそのまま設定してみ
ました。^^;;
(1) http://cvs.sourceforge.jp/cgi-bin/viewcvs.cgi/macemacsjp/CarbonEmacsPackage/GPL/site-start.d/carbon-emacs-japanese-init.el?rev=1.12
その状態で mixi-wl.el でもテストしてみたところ、"…" の入った文書に返信
しても化けずにコメントできました。
;; http://mixi.jp/view_diary.pl?id=392610004&owner_id=267980
> ただし、それでも
> > http://www.stained-g.net/shinichiro/EUC-JP-Horizontal-Ellipsis.html
> > 4. by XHTML 1.1 Entity (by word …)
> は現状のまま mule-unicode-0100-24ff で表示します(これは、
> emacs-w3m が w3m.el で設定しています)。
> また、
> > 3. by HTML 4.0 Entity (not standard - …)
> は 文字化け(フォント次第だと思うけど)します。
これ、HTML 4 においても非標準なので... 表示できないのが正しい動きのよう
な気がします。
> # Mule-UCS だと ~ になるのだけどなんで?
> > ;; http://lists.debian.or.jp/debian-devel/200703/msg00038.html で指摘さ
> > ;; れている問題のような気もしますが良く分かってません。
> ここで問題になっているところを Emacs22 は柔軟にユーザが設定でき
> る、ということだと思います。
なるほど。と言う事は、逆に言えば、素の w3m ではターミナル環境依存であり、
逃げようがない、という事なのでしょうか?
--
Shinichiro HIDA shinichiro@xxxxxxxxxxxxx
GPG fingerprint = 5F2D 1656 FFF6 F691 A51C 5E61 E416 D398 470C 1CE9