[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: w3mmee with utf-8



From: Kiyokazu SUTO <suto@ks-and-ks.ne.jp> さん曰く
Subject: [emacs-w3m:01202] Re: w3mmee with utf-8
Message-ID: <20010614-125144-29635.suto@ks-and-ks.ne.jp>
Date: 14 Jun 2001 12:51:44 +0900

suto> > > ## http://yakyu-score.cplaza.ne.jp/regular/giants/game/index.html
suto> > > ## は若干ずれます ^^;;; jisx0201 なんか表の中に使うんじゃないぞぉ、
suto> >
suto> > ずれるのは「安打」の間にある「IDEOGRAPHIC SPACE」のせいだと思います。

あれ?おそらく違うところだと思います。

┌─────────────────────────────────────────────┐
│ 復活高橋尚、好投も降雨引き分け                                                           │
│                                                                                          │
│ 巨人の先発・高橋尚が、今季一番のピッチングで、広島打線を5回                            │
│1安打、無失点の好投を見せたが、試合前から降り始めていた雨が強                            │
│くなり、巨人の6回の攻撃前に続行不能となり、惜しくも引き分けと                            │
│なった。                                                                                  │

の部分の『・、。』がすべて、jisx0201 になっていて、便宜上 '*' を
使って書くと、

┌─────────────────────────────────────────────┐
│ 復活高橋尚*好投も降雨引き分け                                                           │
│                                                                                          │
│ 巨人の先発*高橋尚が*今季一番のピッチングで*広島打線を5回                            │
│1安打*無失点の好投を見せたが*試合前から降り始めていた雨が強                            │
│くなり*巨人の6回の攻撃前に続行不能となり*惜しくも引き分けと                            │
│なった*                                                                                  │

となって見えます。jisx0201 の数だけ左に罫線がずれています。

また、これは、Mule-UCS の設定で、jisx0201 > chinese-big5 という
優先順にしたときの挙動です。default の chinese-big5 > jisx0201
では、"、" が big5 の *全角* で表示されるため、"、" に関してはず
れません。

# どっちにしろ、正解はない、ということだと思うのですけど。
# しかも、この人、ディアスの "ィ" も半角だし。:-<

suto> あぅ失礼、「-o tty_fallback_converters=f2h,h2f」じゃ(多分)駄目で

これはだめでした。

suto> 「-o tty_output_converters=f2h,h2f」です。あるいは

はい、こうすれば OK です。

# けど、やっぱり、ちょっと副作用が大きいですよね :-)
# ちなみに、Mule-UCS でも同等の事ができますが、やっぱり同等の副
# 作用が発生します。

suto> 「-o 'tty_reject_character=U+3000 " "'」のほうが副作用が少くてよいかも。

ということは、とりあえず

"0xFF61" HALFWIDTH IDEOGRAPHIC FULL STOP
"0xFF64" HALFWIDTH IDEOGRAPHIC COMMA
"0xFF65" HALFWIDTH KATAKANA MIDDLE DOTx

ぐらいを変換すればいいと思うのですが、なぜかうまく効いてくれませ
ん。なにか設定方法を間違っているのかもしれないです。ごめんなさい。

'("-o" "tty_reject_character=U+FF61 \"。\"") と書いたのですが。。。

## というわけで、(悩んだ結果)手元では、
## (japanese-zenkaku-region (point-min) (point-max) 'katakana-only)
## してしまうことにしました。^^;;;

From: hsaka@mth.biglobe.ne.jp (Hironori Sakamoto) さん曰く
Subject: [emacs-w3m:01199] Re: w3mmee with utf-8
Message-ID: <20010614020426.CABWC0A8263B.6134A893@mth.biglobe.ne.jp>
Date: Thu, 14 Jun 2001 02:04:25 +0900 (JST)

坂本> xterm-150 だと、Markus Kuhn 氏作の
坂本>     ((ucs >= 0x1100 && ucs <= 0x115f) || /* Hangul Jamo */
坂本>      (ucs >= 0x2e80 && ucs <= 0xa4cf && (ucs & ~0x0011) != 0x300a &&
坂本>       ucs != 0x303f) ||                  /* CJK ... Yi */

ふと xterm+utf-8 の font を efont に変えて気付いたのですが、
"0x2460" CIRCLED DIGIT ONE も halfwidth なのですね。xterm って。

-- 
白井秀行 (mailto:shirai@rdmg.mgcs.mei.co.jp)