[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: sb-nikkei.el



>>>>> In [emacs-w3m : No.09195] 山岡 wrote:

> ところで、その top グループの「見せたくなるカデン」という題名の記事に、
> 次のような日本語ファイル名の画像があります。

> <img
>  src="/photo/byhand/「アマダナ」の「銀座velvia(ベルビア)館」店内.jpg"
>  alt="写真">

> どうエンコードしたらいいんでしょうかね。ちなみに元記事の url は:

> http://waga.nikkei.co.jp/comfort/shopping.aspx?i=20070213g5000g5

>>>>> In [emacs-w3m : No.09196] 長さん wrote:

長さん> Firefox 2.0.0.1 @ Windows XP SP2では

長さん> http://waga.nikkei.co.jp/photo/byhand/%81u%83A%83%7D%83_%83i%81v%82%CC%81u%8B%E2%8D%C0%82%96%82%85%82%8C%82%96%82%89%82%81%81i%83x%83%8B%83r%83A%81j%8A%D9%81v%93X%93%E0.jpg

長さん> ですね。

そうですね。結局 w3m-decode-buffer で、コンテンツを取得して全体
をデコードした直後の html ソースの段階で、その手の非-ASCII文字を
含む url をエンコードしてしまうことにしました。これなら shimbun
でも有効なはずです。

;; 実はくだんの記事は expire してしまったので試すことができませ
;; ん。どなたかまだお持ちでしたらテストよろしく。

ただ困ったことに、上記のページ (http://waga.nikkei.co.jp/comfort/...)
で問題の画像を表示したり、画像を表示せずにその部分にカーソルを持っ
て行くと Emacs 21 が segfault で落ちてしまうので、それらの Emacs
の版では従来通り何もしないようにしておきました。原因はよくわかり
ません。画像そのものの問題ではないし、w3m-url-decode-string 単体
ではエンコードした url を正しくデコードしてくれるんですが。

長さん> URL エンコードの前の文字列は SJIS でした。
長さん> (ex.http://home.kendomo.net/board/decode/decode.php)

長さん> tryすなら、
長さん>  pageの文字コード
長さん>  UTF-8
長さん> でファイルの取得を行うとかでしょうか。

長さん> # たぶんサーバdefaultの文字コードになる気がするんですが...

はい、w3m-decode-buffer が決めてくれた coding system をそのまま
使いました。
-- 
山岡