[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: history mojibake



From: Kiyokazu SUTO <suto@ks-and-ks.ne.jp> さん曰く
Subject: [emacs-w3m:03168] Re: history mojibake
Message-ID: <20020408-220725-17280.suto@ks-and-ks.ne.jp>
Date: 08 Apr 2002 22:07:25 +0900

> > # w3mmee の 挙動としては、iso8859-1 に ESC されて後、ASCII に復帰せずに、
> > # 再度 jisx0208 で ESC されるまで文字化けします。
> 
> # 「^[.A^[N4</a>」の「</a>」がLatin-1の右半分として解釈される、という
> # ことですね?

正確に理解していませんが、そういうことだと思います。(文字化けの
説明は画像が一番ということで、つけちゃいます (_ _))

> 蒸しかえすようで申し訳ありませんが、この時w3mmeeがどういう風に呼び出さ
> れているのか教えていただけないでしょうか。これの解析に失敗しているとし
> たら、多分(libmoeの)バグなんで。

はい、この場合は、W3MLANG=ja_JP.kterm の配下で、iso-2022-7bit に
encode したバッファに対して、call-process-region で

w3mmee "-dump=half-buffer" "-o" "concurrent=0" "-T" "text/html" "-t" "8" "-cols" "95"

を動かして出力を得ています。それを iso-2022-7bit-ss2 で encode
したら化けませんでした。

添付した z1.html(iso-2022-7bit で保存した)を上記の引数で変換する
と同様に化けると思います。

# とここまでやって、w3m-find-file() でも、もとのファイルが
# iso-2022-7bit だと化けて、iso-2022-7bit-ss2 だと化けないことに
# 気付いてしまいました。同じ原因だと思います ^^;;;

-- 
白井秀行 (mailto:shirai@rdmg.mgcs.mei.co.jp)

Attachment: z1.html.gz
Description: Binary data

PNG image