ファイルの全比較とHASH値比較 (5)

自分で書いて気づいたのですが、ファイルの比較用ハッシュ値も別にファイル全体のハッシュ値を完全に計算する必要なんてなくて、例えば先頭10KBだけを使うとした場合でも十分平均速度向上の効果があると思います。どうせ、ハッシュ値が一致したら全体比較するわけだし、一致をチェックするというよりも、不一致を早いところ取り除くのが目的なので。
Fuktommy氏が言った「どんなハッシュ関数を使うかということも」というのはそういうことなのかな。実際CRC32でも十分だろうし。

ただ、「全体比較よりMD5比較のほうが遅い」と言った初めの話の反論にはならないか。
しかも、不一致を取り除くのが目的なら全体チェックのほうが速いだろうし……。
こうやって混乱してくるから、まじめに計算してみと言われたのか。