Simhash ist eine Methode zur Erstellung eines festen "Hash" oder "Fingerabdrucks" einer Eingabe variabler Länge, wie z. B. eines Textes oder Dokuments. Obwohl es einer Hash-Funktion ähnelt und eine Art lokal empfindliches Hashing darstellt, ist es darauf ausgelegt, widerstandsfähiger gegen Kollisionsangriffe zu sein, bei denen zwei verschiedene Eingaben denselben Hash erzeugen. Simhash erstellt einen Hash für jedes Merkmal, in das es die Eingabe unterteilt, die als "Features" bezeichnet werden, bevor es diese kombiniert. Der endgültige Hash für die Eingabe wird durch das Zusammenführen dieser Hashes erstellt.
Was ist Simhash?