[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: w3m-decode-buffer



>>>>> In [emacs-w3m : No.09408] 青田さん wrote:

> 人間の可読性のためなら賛成です。他のブラウザのソース表示と同じ
> イメージで考えてたので。
> ;; ですが、ちょっと生ソース見たい時用に切り替えられるといいかも、とも
> ;; 思います。

ぼくも後でそれを考えました。例えば C-u \ でそれを行なうとか。
ちょっと検討してみますね。

>>> 2.""でくくったものはdecodeされるが、''ではされないこと
>>
>> 疎くてすみません。具体的には?

> 例えば、
> <a href="日本語.html">日本語.html</a><br>
> <a href='日本語.html'>日本語.html</a><br>
> が、
> <a href="%e6%97%a5%e6%9c%ac%e8%aa%9e.html">日本語.html</a><br>
> <a href='日本語.html'>日本語.html</a><br>
> となっています。

あ、なるほど。

> HTMLの仕様に詳しくはないのですが、htmllintにもvalidatorにもひっかから
> ないので''もURIをくくるのに使えると思います…が、実際に使ってるサイト
> は見つけられませんでした…。とりあえず、パッチにしてあります。

ぼくも href では見た記憶は無いのですが、つい最近
<p class='...'> というものを見て (sb-sankei.el で) 対策したばか
りです。たぶん OK なんでしょうね。

> また、これを実験してて気がついたのですが、リンク先がローカルファイルの時は
> 逆にencodeしたらだめのように思います。

> 解決方法として
> 1.ローカルな時はencodeしない
> 2.w3m-goto-urlで読む時にdecodeする
> と2つ思いつきましたが、カーソルのせた時に日本語で表示させるため、
> 2のほうがよりWeb上のデータと処理が似ているため、下のパッチでは2番を使っ
> ています。

[...]

> ということで、今回のパッチは
> 1.src='...'・href='...'の中もencodeする
> 2.localなURIな時はdecodeしなおす
> の2点です。

> 2の変更時にg、Gで非ASCII文字を含むURLをいれた時にエラーになっていました。
> w3m内部からの呼出しならURL encodeされている、と思うので
> 非ASCII文字を含む時はdecodeしないようにしてあります。

うーむ、すばらしい。毎度ありがとうございます。CVS 幹にインストー
ルしました。
-- 
山岡