Le lignage de données (data lineage) consiste à suivre le flux des données dans le temps pour comprendre leur origine, leurs transformations et leur destination finale dans le pipeline. Les technologies de data lineage fournissent une trace des données tout au long de leur cycle de vie, y compris les données sources et les transformations appliquées lors des opérations ETL ou ELT. Les utilisateurs peuvent vérifier que leurs données proviennent d'une source fiable, ont subi les transformations nécessaires et ont été placées à l'emplacement prévu. Le data lineage est essentiel lorsque des informations fiables soutiennent des décisions stratégiques. Sans suivi rigoureux des opérations data, la vérification devient quasi impossible, ou au minimum coûteuse et longue. En permettant d'explorer en amont et en aval, de la source à la destination, le data lineage évalue la précision et la cohérence des données et aide à repérer et corriger les anomalies.
Qu'est-ce que le lignage de données ?