Skip to main content
Piloterr

Qu'est-ce que Simhash ?

Simhash

Simhash est une méthode de création d'un « hash » ou « fingerprint » de longueur fixe à partir d'une entrée de longueur variable, comme un texte ou un document. Bien qu'il ressemble à une fonction de hash et soit un type de locally sensitive hashing, il est conçu pour être plus résistant aux collision attacks, où deux entrées distinctes produisent le même hash. Simhash divise l'entrée en « features », calcule un hash pour chacune, puis les combine pour produire le hash final.

Simhash est une méthode de création d'un "hash" ou "fingerprint" de longueur fixe à partir d'une entrée de longueur variable, comme un texte ou un document. Bien qu'il ressemble à une fonction de hash et soit un type de locally sensitive hashing, il est conçu pour être plus résistant aux collision attacks, où deux entrées distinctes produisent le même hash. Simhash divise l'entrée en "features," calcule un hash pour chacune, puis les combine pour produire le hash final.