[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: w3mmee with utf-8
From: Kiyokazu SUTO <suto@ks-and-ks.ne.jp> さん曰く
Subject: [emacs-w3m:01202] Re: w3mmee with utf-8
Message-ID: <20010614-125144-29635.suto@ks-and-ks.ne.jp>
Date: 14 Jun 2001 12:51:44 +0900
suto> > > ## http://yakyu-score.cplaza.ne.jp/regular/giants/game/index.html
suto> > > ## は若干ずれます ^^;;; jisx0201 なんか表の中に使うんじゃないぞぉ、
suto> >
suto> > ずれるのは「安打」の間にある「IDEOGRAPHIC SPACE」のせいだと思います。
あれ?おそらく違うところだと思います。
┌─────────────────────────────────────────────┐
│ 復活高橋尚、好投も降雨引き分け │
│ │
│ 巨人の先発・高橋尚が、今季一番のピッチングで、広島打線を5回 │
│1安打、無失点の好投を見せたが、試合前から降り始めていた雨が強 │
│くなり、巨人の6回の攻撃前に続行不能となり、惜しくも引き分けと │
│なった。 │
の部分の『・、。』がすべて、jisx0201 になっていて、便宜上 '*' を
使って書くと、
┌─────────────────────────────────────────────┐
│ 復活高橋尚*好投も降雨引き分け │
│ │
│ 巨人の先発*高橋尚が*今季一番のピッチングで*広島打線を5回 │
│1安打*無失点の好投を見せたが*試合前から降り始めていた雨が強 │
│くなり*巨人の6回の攻撃前に続行不能となり*惜しくも引き分けと │
│なった* │
となって見えます。jisx0201 の数だけ左に罫線がずれています。
また、これは、Mule-UCS の設定で、jisx0201 > chinese-big5 という
優先順にしたときの挙動です。default の chinese-big5 > jisx0201
では、"、" が big5 の *全角* で表示されるため、"、" に関してはず
れません。
# どっちにしろ、正解はない、ということだと思うのですけど。
# しかも、この人、ディアスの "ィ" も半角だし。:-<
suto> あぅ失礼、「-o tty_fallback_converters=f2h,h2f」じゃ(多分)駄目で
これはだめでした。
suto> 「-o tty_output_converters=f2h,h2f」です。あるいは
はい、こうすれば OK です。
# けど、やっぱり、ちょっと副作用が大きいですよね :-)
# ちなみに、Mule-UCS でも同等の事ができますが、やっぱり同等の副
# 作用が発生します。
suto> 「-o 'tty_reject_character=U+3000 " "'」のほうが副作用が少くてよいかも。
ということは、とりあえず
"0xFF61" HALFWIDTH IDEOGRAPHIC FULL STOP
"0xFF64" HALFWIDTH IDEOGRAPHIC COMMA
"0xFF65" HALFWIDTH KATAKANA MIDDLE DOTx
ぐらいを変換すればいいと思うのですが、なぜかうまく効いてくれませ
ん。なにか設定方法を間違っているのかもしれないです。ごめんなさい。
'("-o" "tty_reject_character=U+FF61 \"。\"") と書いたのですが。。。
## というわけで、(悩んだ結果)手元では、
## (japanese-zenkaku-region (point-min) (point-max) 'katakana-only)
## してしまうことにしました。^^;;;
From: hsaka@mth.biglobe.ne.jp (Hironori Sakamoto) さん曰く
Subject: [emacs-w3m:01199] Re: w3mmee with utf-8
Message-ID: <20010614020426.CABWC0A8263B.6134A893@mth.biglobe.ne.jp>
Date: Thu, 14 Jun 2001 02:04:25 +0900 (JST)
坂本> xterm-150 だと、Markus Kuhn 氏作の
坂本> ((ucs >= 0x1100 && ucs <= 0x115f) || /* Hangul Jamo */
坂本> (ucs >= 0x2e80 && ucs <= 0xa4cf && (ucs & ~0x0011) != 0x300a &&
坂本> ucs != 0x303f) || /* CJK ... Yi */
ふと xterm+utf-8 の font を efont に変えて気付いたのですが、
"0x2460" CIRCLED DIGIT ONE も halfwidth なのですね。xterm って。
--
白井秀行 (mailto:shirai@rdmg.mgcs.mei.co.jp)