[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: history mojibake



Citation (with leading "> " of each line) from article:
  <20020408.230959.31271411.shirai@netlaputa.ne.jp>
    by Hideyuki SHIRAI (白井秀行) <shirai@rdmg.mgcs.mei.co.jp> :
> 添付した z1.html(iso-2022-7bit で保存した)を上記の引数で変換する
> と同様に化けると思います。
>
> # とここまでやって、w3m-find-file() でも、もとのファイルが
> # iso-2022-7bit だと化けて、iso-2022-7bit-ss2 だと化けないことに
> # 気付いてしまいました。同じ原因だと思います ^^;;;

いただいたz1.html.gzをhex dumpしてわかりましたが、iso-2022-7bitという
のはMuleの独自指示列である

 0x1B 0x2C 96セットの終端バイト

を使うんですね。libmoeはこれを解釈しない(昔は解釈していたけれども、あ
るページで盛大に化ける原因になったので、それ以降止めた)ので、Latin-1の
右半分をG0に指示する

 0x1B 0x2C 0x41

の0x1Bを読み飛ばし(実際はもう少し複雑)

 0x2C 0x41

だけがレンダリング結果に現れて、それが化けているように見えるのでした。

Citation (with leading "| " of each line) from article:
  <20020408.192204.10648522.shirai@rdmg.mgcs.mei.co.jp>
    by Hideyuki SHIRAI (白井秀行) <shirai@rdmg.mgcs.mei.co.jp> :
| $ -- iso-2022-7bit-ss2
|   ISO 2022 based 7-bit encoding using SS2 for 96-charset

これの「-7bit-」というところを8bitと思い込んで、それ以降を読み飛ばして
しまったために、余分なお手間を取らせてしまいました。ごめんなさい。

-- 
須藤 清一 <suto@ks-and-ks.ne.jp>
http://pub.ks-and-ks.ne.jp/pgp-public-key.html