[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Can't decode mule-ja archive
- From: Katsumi Yamaoka <yamaoka@xxxxxxx>
- Date: Fri, 12 Oct 2007 10:46:03 +0900
- X-ml-name: emacs-w3m
- X-mail-count: 09723
mule-ja のアーカイブがデコードできなくなっています。例えば:
http://www.m17n.org/mlarchive/mule-ja/200710/msg00002.html
sb-m17n.el を使っても同様。
2007-09-24 TSUCHIYA Masatoshi <tsuchiya@xxxxxxxxxx>
[...]
(w3m-entity-regexp): Stricten.
[...]
(w3m-decode-entities-string): Rewritten to use the above constants.
ここには以下のコメントがあるのですが、
;; Character entity references are case-sensitive.
;; Cf. http://www.w3.org/TR/1999/REC-html401-19991224/charset.html#h-5.3.2
&#xNNNN; の場合は適用されないんじゃないか、と。
直すとすればこうでしょうか?
--- w3m.el~ 2007-10-09 10:21:40 +0000
+++ w3m.el 2007-10-12 01:43:15 +0000
@@ -2060,3 +2060,3 @@
(regexp-opt buf))
- "\\|#\\(?:x[0-9a-f]+\\|[0-9]+\\)\\)\\(\\'\\|[^0-9a-zA-Z]\\)"))
+ "\\|#\\(?:[xX][0-9a-fA-F]+\\|[0-9]+\\)\\)\\(\\'\\|[^0-9a-zA-Z]\\)"))
"Regexp matching html character entities.")