[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: cannot follow link



坂本です。

> From: TSUCHIYA Masatoshi <tsuchiya@pine.kuee.kyoto-u.ac.jp>
> で、ちょっと仕様に詳しい方に教えて頂きたいのですが、HTML の世界で言う
> ところの文字列の条件はどうなっているのでしょうか。例えば、

属性値については、
  http://www.w3.org/TR/html4/
以下の
  intro/sgmltut.html
  sgml/dtd.html
  types.html
あたりを見てください。基本的には SGML の CDATA
  types.html#type-cdata
です。
# 私も完全に理解している訳ではないのですが。

嫌らしいのは、
    User agents may ignore leading and trailing white space in CDATA attribute
    values (e.g., "   myval   " may be interpreted as "myval"). Authors should
    not declare attribute values with leading or trailing white space.
ですね。

なお、タグ中(というか HTML 中)で任意の数の空白をおける場所には
任意の数の改行を置くことがが出来ます。
例えば、

A <a href="URL">B</a> C

と

A
<a
href
=
"URL"
>
B
</a
>
C

は同じです。
<pre> 中でもタグ中の改行は無視されます。(もしくは空白扱いになります)
# が w3m の halfdump ではタグは一行と仮定して構わないはずです。

> というように \ でエスケープすることは許されているのでしょうか。また、

\ は特殊文字ではありません。" で quote です。
# ' での quote も時々見かけますが、SGML 的に正しいかどうかは調べてません。
# 間違っていても認識せざるを得ないけど… さすがに ` は見ない。

特殊文字(<, >, ", &)は & で実体参照してエスケープします。
-------------------------------------------
Hironori SAKAMOTO <hsaka@mth.biglobe.ne.jp>
 http://www2u.biglobe.ne.jp/~hsaka/