Simhash es un método para crear un "hash" o "huella digital" de longitud fija a partir de una entrada de longitud variable, como un texto o documento. Aunque se asemeja a una función hash y es un tipo de hashing sensible a la localidad, está diseñado para ser más resistente a ataques de colisión, en los que dos entradas diferentes generan el mismo hash. Simhash crea un hash de cada característica en la que divide la entrada, denominadas "features", antes de combinarlos para formar la entrada final. El hash final para la entrada se crea combinando estos hashes.
¿Qué es Simhash?