[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: some Google links not linked?
- From: Hiroyuki Ito <ZXB01226@xxxxxxxxx>
- Date: Sat, 18 Dec 2010 14:11:04 +0900 (JST)
- X-ml-name: emacs-w3m
- X-mail-count: 11451
- References: <b4mfwtxnhid.fsf@xxxxxxx> <20101217.184049.164321981.hito@xxxxxxxxxx> <b4my67oezig.fsf@xxxxxxx>
伊東です。
>> <div> で <a> が閉じられてしまうためですね。
>
> そういうことなのですか。素人としては <foo> を閉じるのは </foo>
> だけだと思っていたので、ちょっと驚きです。
これについては、【えぬ】さんの御指摘のとおりです。<div> が現れた時点で
<a> の閉じ忘れと判断してしまいます。
> 私の手元ではスペースの代わりに 0x9E というものが返ってきました。
念のため確認しましたが、確かにスペース (0x20) でした。
$ w3m -halfdump test.html |hd
00000000 3c 61 20 68 73 65 71 3d 22 31 22 20 68 72 65 66 |<a hseq="1" href|
00000010 3d 22 68 74 74 70 3a 2f 2f 77 77 77 2e 61 73 61 |="http://www.asa|
00000020 68 69 2e 63 6f 6d 2f 22 3e 20 3c 2f 61 3e 0a 54 |hi.com/"> </a>.T|
00000030 68 65 20 41 73 61 68 69 20 53 68 69 6d 62 75 6e |he Asahi Shimbun|
00000040 0a 3c 69 6e 74 65 72 6e 61 6c 3e 0a 3c 2f 69 6e |.<internal>.</in|
00000050 74 65 72 6e 61 6c 3e 0a |ternal>.|
00000058
>> emacs-w3m 側での対応は難しいのでしょうか。
>
> 力づくで対応するのはそう難しくないと思います。例えば <a>...</a>
> の内にある <div> と </div> をはぎ取るとか。
w3m 単体と同様に上記のスペース部分のリンクが機能すればよいのではないか
というつもりでした。
> でも emacs-w3m ではなくて w3m 単体で使う場合に、Google 台湾など
> で不便なのはかまわないのですか?
スペースなので見えませんがリンク自体は存在しているので致命的な問題では
ないと思いました。また、できれば google に指摘して直してもらうのが最も
よい解決方法だと思います。