Saltar al contenido principal
Piloterr

¿Qué son las tuberías de datos?

Una tubería de datos es un método para mover datos sin procesar desde varias fuentes de datos a un almacén de datos listo para análisis, como un data lake o un data warehouse. En la mayoría de los casos, los datos se procesan antes de ingresar a un repositorio de datos. Esto incluye transformaciones de datos que garantizan una integración y estandarización adecuadas, como filtrado, enmascaramiento y agregaciones. Esto es especialmente crucial cuando una base de datos relacional es el destino final del conjunto de datos. Para actualizar los datos actuales con nuevos datos, este tipo de repositorio de datos necesita alineación, o la coincidencia de columnas y tipos de datos.