[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Can't decode mule-ja archive



mule-ja のアーカイブがデコードできなくなっています。例えば:

http://www.m17n.org/mlarchive/mule-ja/200710/msg00002.html

sb-m17n.el を使っても同様。

2007-09-24  TSUCHIYA Masatoshi  <tsuchiya@xxxxxxxxxx>
[...]
(w3m-entity-regexp): Stricten.
[...]
(w3m-decode-entities-string): Rewritten to use the above constants.

ここには以下のコメントがあるのですが、

;; Character entity references are case-sensitive.
;; Cf. http://www.w3.org/TR/1999/REC-html401-19991224/charset.html#h-5.3.2

&#xNNNN; の場合は適用されないんじゃないか、と。
直すとすればこうでしょうか?

--- w3m.el~	2007-10-09 10:21:40 +0000
+++ w3m.el	2007-10-12 01:43:15 +0000
@@ -2060,3 +2060,3 @@
 	      (regexp-opt buf))
-	    "\\|#\\(?:x[0-9a-f]+\\|[0-9]+\\)\\)\\(\\'\\|[^0-9a-zA-Z]\\)"))
+	    "\\|#\\(?:[xX][0-9a-fA-F]+\\|[0-9]+\\)\\)\\(\\'\\|[^0-9a-zA-Z]\\)"))
   "Regexp matching html character entities.")