[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: max-specpdl-size



From: TSUCHIYA Masatoshi <tsuchiya@pine.kuee.kyoto-u.ac.jp> さん曰く
Subject: [emacs-w3m:04079] Re: max-specpdl-size
Message-ID: <mpaelajc4np.fsf@moss.lang-private.kuee.kyoto-u.ac.jp>
Date: Tue, 22 Oct 2002 16:29:46 +0900

後> コードはちょっとしか読んでませんが、これって全てのentity を文字列
後> リストにしてregexp で処理しようとしてますよね。そんな必要ってある
後> んですか?以下のようにregexp は汎用の形で利用して、match-string か
後> ら w3m-entity-db を引いて利用するようにすべきではないかなと...

後> (defconst w3m-entity-regexp
後> "&\\([a-z][a-z0-9]*\\|#[0-9]+\\|#x[0-9a-f]+\\);?")

土> これだと,&ampHOGE とかみたいに,; を省略している場合に動かないのでは
土> ないでしょうか.まあ規格表にも「; は出来るだけ省略しないでね」と書いて
土> あるので,省略する筆者または encoder が良くないとは思いますが.

(息抜きに ^^;) 試してみました。HTML に以下を書いて実験。

&amp(改行) <= (1)
&ampHOGE(改行) <= (2)

たしかに (1) はみんな '&' にしましたけど、
(2) を '&HOGE' ってしたのは emacs-w3m と MS-IE 5.5 だけですね。

ほかに試した Mozilla 1.1、opera 6、w3m ファミリはみな '&ampHOGE'
になりました。

## HTML 4 をざぁぁぁとみたところ、*省略して良い* とは読めません
## でした。単に興味があるだけなんですが、どのへんに書いてありますか?

あまり巨大な regexp はなにがおこるかわからないし、後藤方式に賛成。

-- 
白井秀行@息抜きの割にはつかれてしまったかも。