[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: URLencoding vs. *Completions* buffer



Hideyuki SHIRAI (白井秀行) <shirai@xxxxxxxxxxx> writes:

> From: Hideyuki SHIRAI (白井秀行) <shirai@xxxxxxxxxxx> 曰く
> Subject: [emacs-w3m:10811] Re: URLencoding vs. *Completions* buffer
> Message-ID: <20090402.130539.132787275.shirai.hideyuki@xxxxxxxxxxx>
> Date: Thu, 02 Apr 2009 13:05:39 +0900 (JST)
>
>>>> When I hit TAB at the end of
>>>> http://radioscanningtw.jidanni.org/index.php?title=
>>>> in the *Completions* buffer I see
>>>> http://radioscanningtw.jidanni.org/index.php?title=%E9%A3%9B%E8%88%AA%E7%AE%A1%E7%90%86
>>>> http://radioscanningtw.jidanni.org/index.php?title=%E9%AB%98%E9%9B%84%E5%B8%82%E6%B6%88%E9%98%B2%E5%B1%80
>>>> which is useless. I would rather see
>>>> http://radioscanningtw.jidanni.org/index.php?title=飛航管理
>>>> http://radioscanningtw.jidanni.org/index.php?title=高雄市消防局
>>>
>>> Thank you for your suggestion. I've changed the code to show the both
>>> completions: encoded one and decoded one.
>
> これ、一回取り消しませんか?
>
> (1) C-u M-x w3m-history したときに二重で出てくる。前のメールで出
>     したパッチの適用前はだいたい四重だったんですけど ^^;
>
> (2) そこで、decode してある方の URL をリターンしても、ほとんどつ
>     ながらないで NG となる。
>
> というのが、気にくわないのです。が、これがちょっと変えただけで簡
> 単に治るとは思えません。。history から補完しても (2) になるのは
> 一緒です。よくわかっていないのですが、たまたまうまくいくときはあ
> るようです。

あー… w3m-history のことを忘れてました。そういえば db-history でも
arrived-db が参照されるんですね…。とりあえずもとのものに戻しておきまし
た。

> (記憶が確かなら)今の emacs-w3m は生のマルチバイト文字を含んだ
> URI を符号化して w3m を動かす、という機能は入っていないので、そ
> のあたりを作ってから再チャレンジっていう方が良いと思います。
> history にはちゃんと読める文字列の方が良いのは間違いないですから。
>
> # そのときは、符号化形式はデフォルト utf-8 でよいとは思うのです
> # が、おそらく正解は無いような気がします。っていうか、正解ってあ
> # りましたっけ? ^^;;;
>
> ## MS-IE vs Namazu の『UTF-8 の URL を送信する』っていうのがある
> ## ぐらいだから、さっぱりわからん。

目標を整理すると

1. g (w3m-goto-url)で decode された補完がきくこと
2. db-history でもなるべく decode されたものが1つずつ出てくること
3. 補完したものからちゃんとリンクがとべること

でしょうか。

;; 他に db-history を表示するところはないですよね? ^^;

1番はやはり補完専用の alist かなにかを作っておかないと厳しいように思えて
きました :( arrived-db との整合性をとらせるのが大変かもしれませんが…。

2番は元のもので、 about://db-histroy 側で decode してあげるだけでも解決
できるように思います。

3番は、 w3m-goto-url の今の encode の方法に問題があるみたいです。
w3m-current-coding-system を使っているので現在のページと全く違うサイトに
行こうとするとおかしくなりますね。 入力された URL が arrived-db に見つか
れば、そこから coding を取得するようにすれば直りそうに思います。

--
青田