[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 文字化け?
- From: ARISAWA Akihiro <ari@xxxxxxxxxxxxx>
- Date: Mon, 02 Jun 2008 22:35:49 +0900
- X-ml-name: emacs-w3m
- X-mail-count: 10194
- References: <87prr0wn60.wl%nomiya@xxxxxxxxxxxxxxxx> <87od6kqwem.wl%nomiya@xxxxxxxxxxxxxxxx> <b4my75o8meg.fsf@xxxxxxx> <87ej7gxoe4.fsf@xxxxxxxxx>
Naohiro Aota writes:
>>> http://bizplus.nikkei.co.jp/colm/xu.cfm
> そのページの metaタグの書き方が少し変だからみたいです。
それとそのページには IBM拡張文字が含まれているために、Mule6 だと
自動判定に失敗、というか厳密な判定をして ISO8859-1 と判断しているようです。
;; バックナンバー 第13回の U+60D5 です。
(set-coding-system-priority 'cp932) とかで、cp932 の優先度を ISO8859-1
より高くすると期待通りに表示されます。
> | <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS;">
> 変な気はするのですが、これで http://validator.w3.org/check にかけても
> This Page Is Valid HTML 4.01 Strict! と言われてしまいましたし、 ';' も区
> 切り文字として認識するように修正しておきました。
http://www.asahi-net.or.jp/~SD5A-UCD/rec-html401j/struct/global.html#h-7.4.4
| 適正なHTTPヘッダに関する詳細は、HTTP仕様([RFC2616])を参照されたい。
http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616#Sec14.17
| Content-Type = "Content-Type" ":" media-type
http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616#Sec3.7
| media-type = type "/" subtype *( ";" parameter )
http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616#Sec3.6
| parameter = attribute "=" value
ということで、厳密には `;' はパラメータの前にしか書けないようです。
とはいえ、青田さんの修正は賛成です。
;; charset には `;' は含むことができないようですし。
http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616#Sec3.4
| charset = token
http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616#Sec2.2
| token = 1*<CTL や separators を除いたあらゆる CHAR>
| separators = "(" | ")" | "<" | ">" | "@"
| | "," | ";" | ":" | "\" | <">
| | "/" | "[" | "]" | "?" | "="
| | "{" | "}" | SP | HT
--
有沢 明宏