[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: sb-nikkei.el
>>>>> In [emacs-w3m : No.09195] 山岡 wrote:
> ところで、その top グループの「見せたくなるカデン」という題名の記事に、
> 次のような日本語ファイル名の画像があります。
> <img
> src="/photo/byhand/「アマダナ」の「銀座velvia(ベルビア)館」店内.jpg"
> alt="写真">
> どうエンコードしたらいいんでしょうかね。ちなみに元記事の url は:
> http://waga.nikkei.co.jp/comfort/shopping.aspx?i=20070213g5000g5
>>>>> In [emacs-w3m : No.09196] 長さん wrote:
長さん> Firefox 2.0.0.1 @ Windows XP SP2では
長さん> http://waga.nikkei.co.jp/photo/byhand/%81u%83A%83%7D%83_%83i%81v%82%CC%81u%8B%E2%8D%C0%82%96%82%85%82%8C%82%96%82%89%82%81%81i%83x%83%8B%83r%83A%81j%8A%D9%81v%93X%93%E0.jpg
長さん> ですね。
そうですね。結局 w3m-decode-buffer で、コンテンツを取得して全体
をデコードした直後の html ソースの段階で、その手の非-ASCII文字を
含む url をエンコードしてしまうことにしました。これなら shimbun
でも有効なはずです。
;; 実はくだんの記事は expire してしまったので試すことができませ
;; ん。どなたかまだお持ちでしたらテストよろしく。
ただ困ったことに、上記のページ (http://waga.nikkei.co.jp/comfort/...)
で問題の画像を表示したり、画像を表示せずにその部分にカーソルを持っ
て行くと Emacs 21 が segfault で落ちてしまうので、それらの Emacs
の版では従来通り何もしないようにしておきました。原因はよくわかり
ません。画像そのものの問題ではないし、w3m-url-decode-string 単体
ではエンコードした url を正しくデコードしてくれるんですが。
長さん> URL エンコードの前の文字列は SJIS でした。
長さん> (ex.http://home.kendomo.net/board/decode/decode.php)
長さん> tryすなら、
長さん> pageの文字コード
長さん> UTF-8
長さん> でファイルの取得を行うとかでしょうか。
長さん> # たぶんサーバdefaultの文字コードになる気がするんですが...
はい、w3m-decode-buffer が決めてくれた coding system をそのまま
使いました。
--
山岡