[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

EUC-JP pages with w3m-0.5



問題提起のみですが.

w3m-0.5 に更新してから,EUC-JP で書かれていて,HTTP へッダに charset 
の指定がないページが文字化けしてしまうようになりました.例えば,
http://namazu.org/~satoru/scmail/index.html.ja など.

その場しのぎの対策ですが,一応,~/.w3m/config に

    document_charset EUC-JP

と書くと文字化けしないようになりました.

それで,これはおそらく文字コードの自動判定時の優先順位の問題なんではな
いかと思います.この予想が正しいならば,全世界に共通して利用できるよう
な優先順位というのはおそらく存在しないでしょうから,国際化のためには,

  (1) ユーザーの locale を参照して,適当な優先順位のデフォルト値を設定
      するようにする.
  (2) その優先順位を,ユーザーの個人設定で上書きできるようにする.

という実装が必要なのではないでしょうか.

-- 
土屋 雅稔 ( TSUCHIYA Masatoshi )