El proceso de recopilar datos de diversas fuentes para modificarlos, almacenarlos o alimentar otro sistema con el fin de realizar análisis adicionales se conoce como extracción de datos. Dado que implica la recopilación de información de diferentes fuentes, como páginas web, correos electrónicos, archivos planos, PDFs, etc., la extracción de datos a menudo se denomina recolección de datos. Estos datos pueden obtenerse tanto de fuentes estructuradas como no estructuradas.
¿Qué es la extracción de datos?