[Date Prev][Date Next][Thread Prev][][Date Index][Thread Index]

Re: 朝日の jpeg はときどき gif



>>>>> In [emacs-w3m : No.06818] 白井秀行さん wrote:

> 「ff d8 xx xx xx xx "JFIF"」 で JFIF になるのですよね、きっと。

この「xx xx xx xx "JFIF"」ではじまるマーカーは、必ず「ff d8」の
直後にあるわけではなさそうです。image-jpeg-p() を読むと「ff d8」
に続くいくつかのマーカーの、最初でなくても検出できるようになって
います。だとすれば、

>>>>> In [emacs-w3m : No.06829] 土屋さん wrote:

> それはともかく,バッファ全体を使うのは処理効率が良くないだろうと思い
> ましたので、超適当に最初の 300 バイトだけを使うように修正しておきまし
> た.もう少し妥当な値があれば修正してください.

データのほとんど全体を見ないといけないことになってしまうのですが、
emacs-w3m は画像フォーマットの解析器ではないので、jpeg に関して
はうーんと簡単に「ff d8」を見るだけにしようと思います。

さらに、現在判明しているのは朝日新聞の問題だけですから、多く使わ
れている gif, jpeg および png は自前で判断、それ以外はヘッダー情
報を信用する、という最初に考えた路線で再度作業を行なうことにしま
す (w3m-image-type-from-data は廃止します)。

JFIF と Exif に関しては、以下のページを斜めに読みました。

http://www.geocities.co.jp/SiliconValley-Oakland/2324/JPEG_file_format.html
http://park2.wakwak.com/~tsuruzoh/Computer/Digicams/exif.html
-- 
Katsumi Yamaoka <yamaoka@jpl.org>