[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: 日本語 WIKIPEDIA の anchor



こんばんは、白井です。

From: Katsumi Yamaoka <yamaoka@xxxxxxx> さん曰く
Subject: [emacs-w3m:12824] Re: 日本語 WIKIPEDIA の anchor
Message-ID: <b4m4lpolfao.fsf@xxxxxxx>
Date: Tue, 21 Nov 2017 08:07:59 +0900

> In [emacs-w3m:12823]
> On Mon, 20 Nov 2017 20:12:07 +0900, 武者さん wrote:
>> HTML5 では、id属性値(a要素のnameはobsolete)もURLのfragmentにも
>> 禁則事項はほとんどなく、ドットで始まる値はもちろん記号類だけで
>> も良いと規定されています。
> 
>> http://www.w3.org/TR/html5/dom.html#the-id-attribute
>> https://www.w3.org/TR/html5/obsolete.html#obsolete-but-conforming-features
>> https://url.spec.whatwg.org/#url-fragment-string
> 
>> ここで許されない非ASCII文字は、普通は%-encodingすると思いますが、
>> Wikipediaのように独自の様式でエンコードするのもあり、ですね。
>> 現状の [a-z][-.0-9:_a-z]* はちょっと狭すぎるかもしれません。
> 
> なぜそんな値にしたのか今となっては忘却の彼方ですが、"[^\t\n \"<>]"
> ぐらいで行けそうですね。ご教授ありがとうございます。

またまた、wikipedia でダメなページが出てきたので見たところ、

https://ja.wikipedia.org/wiki/HyperText_Markup_Language

前回のメールだと

<a href="#.E7.89.B9.E5.BE.B4"><span class="tocnumber">1</span>
<span class="toctext">特徴</span></a></li>

だったのが、

<li class="toclevel-1 tocsection-1"><a href="#特徴">
<span class="tocnumber">1</span>
 <span class="toctext">特徴</span></a></li>

↑から↓を指し示している

<h2><span id=".E7.89.B9.E5.BE.B4"></span>
<span class="mw-headline" id="特徴">特徴</span>

となっていました。.XX.YY のページもあるので、順次?変わってきて
いるのかな? なお、"[^\t\n \"<>]" ならイケます。

# non-ASCII ありなのか。

P.S. > 山岡さん
某所の返事なし。。。