Data Hub & lineage
Eén hub voor elke datavorm — mét het spoor erbij.
Gestructureerde rijen, ongestructureerde documenten en IoT-telemetrie leven zelden samen. In de Indentia Data Hub doen ze dat wel — verbonden door wat ze betekenen, niet door waar ze vandaan komen. Elk record landt mét volledige lineage, zodat een vraag altijd een antwoord én een papieren spoor heeft.
Hoe het samenkomt
Drie datavormen, één entiteit-gestuurde hub.
Reactief & proactief
Reageert wanneer de data dat doet. Kijkt zelf wanneer ze stilstaat.
Sommige bronnen versturen events op het moment dat er iets verandert — een chatbericht komt binnen, een sensor overschrijdt een drempel, een record wordt bijgewerkt. De hub reageert direct. Andere bronnen — oude databases, fileshares, archiefsystemen — vertellen u nooit iets. Die scant de hub volgens een schema, detecteert delta's en haalt alleen op wat nieuw is. Eén model, twee gedragingen, geen blinde vlekken.
- Reactief — webhooks, CDC-streams, NATS-events, IoT-telemetrie. Nieuwe data is binnen seconden zichtbaar.
- Proactief — geplande crawlers met delta-detectie. Alleen gewijzigde rijen / bestanden / objects komen door.
- Cross-source joins — het contract van een klant (gestructureerd), hun support-mails (ongestructureerd) en hun device-telemetrie (IoT) verwijzen allemaal naar dezelfde entiteit.
- Eén query-taal — SPARQL over de verenigde graaf. Lineage en data staan naast elkaar.
Capabilities
Wat de hub voor uw data doet.
Eén hub voor alle datavormen
Gestructureerde tabellen, ongestructureerde documenten en IoT-telemetrie landen in dezelfde hub. Verbonden op entiteit (een order, een sensor, een persoon, een contract) — niet op bestandslocatie.
Lineage op elk record
Elk record draagt een OpenLineage-keten terug naar de bron: welk bestand, welke sensor, welke transformatie, welke approval. Antwoord een toezichthouder met een query, niet met een forensisch onderzoek.
Reactieve ingest
Nieuwe events triggeren pipelines automatisch. Een document, een IoT-signaal, een rij-wijziging — elk fan-outt naar de consumers die ertoe doen, met backpressure om alles beheersbaar te houden.
Proactief scannen
Voor bronnen die geen events versturen, scant de hub volgens een schema — met delta-detectie zodat onveranderde data niet opnieuw verwerkt wordt.
Data-contracten
Elke producer publiceert een contract: schema, freshness, SLA. Breuken worden bij de grens gevangen, niet diep in een downstream notebook.
Lineage en data in dezelfde store
Lineage is RDF in dezelfde kennisgraaf als de data zelf. Vraag "welke rapporten zijn gebouwd op deze dataset?" met één SPARQL-statement.
Beschikbaar voor
Eenmaal in de hub, overal beschikbaar waar het ertoe doet.
Search
Hybrid retrieval die gestructureerde rijen, ongestructureerde paragrafen en live signalen samen brengt.
Agents
Multi-step agents redeneren over alle drie de vormen — met lineage bij elke uitspraak.
Analytics & BI
Lineage-bewuste datasets voeden dashboards, notebooks en forecasting-modellen.
Audit & compliance
Trace elke output terug naar elke bron die het aanraakte.
Lineage in de praktijk
Trace elk antwoord terug naar elke bron die het vormde.
Een toezichthouder vraagt "waar komt dit getal vandaan?". Een controller vraagt "welke contracten verwezen naar deze clausule-versie?". Een model-owner vraagt "welke datasets trainen deze classifier?". Met lineage co-located in de kennisgraaf worden dat éénregelige queries — geen forensische projecten van maanden.