更新チェッカー
わけあってWebサイトの更新チェックツールについて調べている。いろいろな種類があるものだ。オーソドックスなのはheader情報を見て更新の有無を判断するもの。しかし、それでは十分ではないらしい。
よくはわからないが、header情報をきちんと返さないページがあるらしい。動的に生成されるページがそうだとか。動的に生成ってのは、要するに cgi? ブログ、掲示板、wikiだろうか。MTとかを使ってサイトを作る例もあるからブログブログしたページだけが要注意ではない。でも pukiwikiで試したら、ちゃんとLast-modifiedはブラウザが拾えた...そういう問題ではない?
さらに気になるのは、こういう更新チェッカーって、htmlだけ変化した場合も更新とみなすのだろうか。たとえば<:strong>の位置を変えたり、コメントアウトの位置を変えたり...
この記事を使って更新チェッカーの動きを調べています。まずは文字数不変の更新を検知するか。仮説では「しない」。
| 固定リンク
コメント