ども、長です。
続けてですが、Wikimediaおよび上位クラスのmailmanもチェックしてみました。
すると次の問題点があることが分り、その修正を作成しましたので、送付します。
# ただし、どれも妥当性に自信を持てないので、皆様にチェックしていただきたいです。
以前の問題で解決していないのは
CHO> 3.一部のアーカイブが取得できない。
CHO> wikipedia.fr : 各月日のアーカイブをフェッチしているようだが、記事が生成されない
CHO> wikipedia.is : アーカイブが2004q[1-4]みたいに四半期ごとにアーカイブされている
とありました。
1.wikipedia.frの問題
これは結局sb-mailman.elでの各メッセージのリンクが取得できていないことが判明しました。
通常mailmanでのメッセージのリンクは
<LI><A HREF="000001.html">article title
</A><A NAME="1"> </A>
<I>writer name
</I>
となっていますが、frでは
<li><a href="000001.html">article title
</a><a name="2204"> </a>
<i>writer name
</i></li>
となっており Iタグの前のスペースのためメッセージを認識できていませんでした。
2.wikipedia.is
ここのメッセージは 20xxq[1-4]/xxxx.htmの様になっているので、
これも受け付けるようにしました。
私としましては、正規のmailmanで生成されているので、
環境やオプションで発生する差異はできるだけ吸収して取得できたほうがよいと思えるので、
これらへの修正(1および2)はmailmanで行なってもよいのではないかと思います。
3.case-fold-searchについて
さて、1の修正の時、frだけ小文字になっていたので、当初それが悪いのかと考えました。
そこでcase-fold-searchを設定していないか確認したところ、
sb-mailman.elのshimbun-mailman-headersの中で
(setq case-fold-search t)
としていました。
なので最初はスルーしていたのですが、改めて見た時 letで束縛する変数に
case-fold-searchが無く、この処理が走るとglobalなcase-fold-searchを書き換えている
のではないかと思います。
なので、今回のpatchにはこれをletで束縛するものに変更する修正も入れました。
各修正についてはそれぞれ違う問題を指しているので、まとめるべきではないかもしれませんが
よろしければ見ていただきたいです。
お役に立てば幸いです。
では。
--
Tsuyoshi CHO mailto:mfalcon_sky@emailuser.net
取るに足らないと思っても、仕事をむげに断ってはいけない。その仕事が何
をもたらすか、やってみなければわからないのだから。
(ジュリア・モーガン アメリカの建築家)
2005-01-03 Tsuyoshi CHO <mfalcon_sky@emailuser.net> * shimbun/sb-mailman.el (shimbun-mailman-headers): Change "case-fold-search" from global binding to "let" local binding; Modify regex for supporting quarter of a year message list (20xxq[1-4]); Modify regex for message link to contain space before "I" tag. * shimbun/sb-wikimedia.el (shimbun-wikimedia-l10n-make-contents): Append "case-fold-search" local binding.
Attachment:
sb-mailman.el.diff
Description: Binary data
Attachment:
sb-wikimedia.el.diff
Description: Binary data
No virus found in this outgoing message. Checked by AVG Anti-Virus. Version: 7.0.298 / Virus Database: 265.6.7 - Release Date: 2004/12/30