[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: 文字化け?



Naohiro Aota writes:

>>>    http://bizplus.nikkei.co.jp/colm/xu.cfm
> そのページの metaタグの書き方が少し変だからみたいです。

それとそのページには IBM拡張文字が含まれているために、Mule6 だと 
自動判定に失敗、というか厳密な判定をして ISO8859-1 と判断しているようです。
;; バックナンバー 第13回の U+60D5 です。

(set-coding-system-priority 'cp932) とかで、cp932 の優先度を ISO8859-1
より高くすると期待通りに表示されます。


> | <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS;">
> 変な気はするのですが、これで http://validator.w3.org/check にかけても
> This Page Is Valid HTML 4.01 Strict! と言われてしまいましたし、 ';' も区
> 切り文字として認識するように修正しておきました。

http://www.asahi-net.or.jp/~SD5A-UCD/rec-html401j/struct/global.html#h-7.4.4
| 適正なHTTPヘッダに関する詳細は、HTTP仕様([RFC2616])を参照されたい。

http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616#Sec14.17
| Content-Type   = "Content-Type" ":" media-type

http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616#Sec3.7
| media-type     = type "/" subtype *( ";" parameter )

http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616#Sec3.6
| parameter               = attribute "=" value

ということで、厳密には `;' はパラメータの前にしか書けないようです。
とはいえ、青田さんの修正は賛成です。

;; charset には `;' は含むことができないようですし。

http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616#Sec3.4
| charset = token

http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616#Sec2.2
| token          = 1*<CTL や separators を除いたあらゆる CHAR>
| separators     = "(" | ")" | "<" | ">" | "@"
|                | "," | ";" | ":" | "\" | <">
|                | "/" | "[" | "]" | "?" | "="
|                | "{" | "}" | SP | HT

-- 
有沢 明宏