[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: =?utf-8?b?5pel5pys6Kqe?= WIKIPEDIA =?utf-8?q?=E3=81=AE?= anchor



In [emacs-w3m:12812]
On Sat, 18 Nov 2017 15:59:50 +0900, 白井さん wrote:
> ご無沙汰しています。白井です。

こんにちは。お久しぶりです。

[...]

> WIKIPEDIA がマルチバイト文字の anchor を作るときに、UTF8の各BYTE
> を "." で区切って生成しているようですが、

> <a href="#.E7.89.B9.E5.BE.B4"><span class="tocnumber">1</span>
> <span class="toctext">特徴</span></a></li>

> のように "." で始めているのが敗因で

今まで気が付きませんでした。ご指摘ありがとうございます。
そんなエンコーディングの手法、というか規格があるんですか?  もし
wikipedia 独自なのであれば

> w3m-filter-add-name-anchors() は href=\"#\\([a-z][-.0-9:_a-z]*\\)\"
> と受けているため、emacs-w3mが扱える <a name=XXX> の生成をしてい
> ません。

> ここを href=\"#\\([\\.a-z][-.0-9:_a-z]*\\)\ に変えれば動作します
> が、HTML4 だと name や id は [A-Za-z] で始まると規定されていたの
> で悩ましいところです。

そういう対処も仕方ないと思います。
そもそも w3m-filter-add-name-anchors じたい、

<TAG ... id=\"FOO_BAR\" ...>FOO BAR</TAG>

というものの前に

<a name=\"FOO_BAR\"></a>

をむりやり置いて w3m が扱えるようにする、しかも用の無い name ア
ンカーも作ってしまうものなので、わざわざ ja.wikipedia.org 専用に
仕立てる必要も無いだろうと。

というわけで変更しておきました。
-- 
山岡
;; eww の、閲覧バッファ内に置く input/textarea を emacs-w3m でも
;; 使えないかと思ったのが発端で、この一ヶ月 eww をいじっています。