[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: history mojibake
Citation (with leading "> " of each line) from article:
<20020408.230959.31271411.shirai@netlaputa.ne.jp>
by Hideyuki SHIRAI (白井秀行) <shirai@rdmg.mgcs.mei.co.jp> :
> 添付した z1.html(iso-2022-7bit で保存した)を上記の引数で変換する
> と同様に化けると思います。
>
> # とここまでやって、w3m-find-file() でも、もとのファイルが
> # iso-2022-7bit だと化けて、iso-2022-7bit-ss2 だと化けないことに
> # 気付いてしまいました。同じ原因だと思います ^^;;;
いただいたz1.html.gzをhex dumpしてわかりましたが、iso-2022-7bitという
のはMuleの独自指示列である
0x1B 0x2C 96セットの終端バイト
を使うんですね。libmoeはこれを解釈しない(昔は解釈していたけれども、あ
るページで盛大に化ける原因になったので、それ以降止めた)ので、Latin-1の
右半分をG0に指示する
0x1B 0x2C 0x41
の0x1Bを読み飛ばし(実際はもう少し複雑)
0x2C 0x41
だけがレンダリング結果に現れて、それが化けているように見えるのでした。
Citation (with leading "| " of each line) from article:
<20020408.192204.10648522.shirai@rdmg.mgcs.mei.co.jp>
by Hideyuki SHIRAI (白井秀行) <shirai@rdmg.mgcs.mei.co.jp> :
| $ -- iso-2022-7bit-ss2
| ISO 2022 based 7-bit encoding using SS2 for 96-charset
これの「-7bit-」というところを8bitと思い込んで、それ以降を読み飛ばして
しまったために、余分なお手間を取らせてしまいました。ごめんなさい。
--
須藤 清一 <suto@ks-and-ks.ne.jp>
http://pub.ks-and-ks.ne.jp/pgp-public-key.html