[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

bold



前から感じていたのですが、

(defun w3m-fontify-bold ()
  "Fontify bold characters in this buffer which contains half-dumped data."
  (goto-char (point-min))
  (while (re-search-forward "<[\t\n ]*b[^>]*>" nil t)
                            ~~~~~~~~~~~~~~~~~~
だと、shimbun でありがちな

% cat index.html
<html><head><base href="http://ko.meadowy.net/~shirai/diary/20030723.html#p08"></head><body>
<p>夢の内容は『<b>あぁぁぁ、こんなバグがまだあったのかぁぁぁぁぁぁ</b>』。
</body></html>

% w3m -halfdump ./index.html 
<base href="http://ko.meadowy.net/~shirai/diary/20030723.html#p08">夢の内容は『<b>あぁぁぁ、こんなバグがまだあったのかぁぁぁぁぁぁ</b>』。
...

なパターンだと、"<base h.." を bold の開始だと思って文章の先頭か
ら bold にしてしまいます。

(1) 気にしない
(2) 正規表現を厳密に書く(けど、遅くなりそう)
(3) 実は、<bxxx> の "xxx" の部分に whitespace 以外の文字が来るこ
    とはないので、"<[\t\n ]*b[\t\n ]*>" で大丈夫。
(4) <base href...> は事前に消しておく。

どれかしら? (3)を期待。

-- 
白井秀行 (mailto:shirai@rdmg.mgcs.mei.co.jp)