Blockchain ≠ TRUST
15. April 2021

Data Bereinigung/Cleanup und Migration mit semantischen Technologien: Proof of Concept Package

Data Cleanup Robot

Wir bieten aktuell ein PoC Package (Proof of Concept) für unser spezielles Angebot „Data Cleanup mit semantischen Technologien“ an.

Worum geht es?

In verschiedensten Szenarien wird die kontrollierte Vernichtung und Transformation bzw. Migration von Datenbeständen notwendig. Anwendungsfälle finden sich in allen Branchen, hier eine kleine Auswahl:

  • Datenschutz: Identifikation und Aussonderung von PID-Daten (Personendaten); Vollständigkeits- und Bestandsanalyse
  • Archivbereinigung: Nachvollziehbare Löschung von Datenbeständen (Kassation) bei nicht oder unzureichend vorhanden Metadaten (Lifecycle Attributen)
  • Datenmigration: Verschieben von Daten aus unstrukturierten in strukturierte Umgebungen (z.B. aus Foldern in ECM/DMS Systeme)
  • Kontrollierte Datenübergaben: Datenübergaben, die auf Grund regulatorischer Anforderungen lückenlos nachvollziehbar gemacht werden müssen (z.B. bei der Medikamentenentwicklung). Übergabe von Patientendaten aus verschiedenen Anwendungen in eine PID.
  • Erhöhung der Datenqualität: Datenbereinigung und entfernen von ROT-Daten.
  • Kontrolle von Dokumentationen: Nachvollziehbarkeit der Versionierung und lückenlosen Nachvollziehbarkeit

Die Erschliessung von grossen Datenmengen kann heute nur noch mittels KI-Unterstützung erfolgen.

Nutzen

Der Nutzen liegt auf der Hand.  Die Kernfrage lautet also: Wie kann man die wertvollen Nutzdaten von den ROT-Daten trennen? (ROT steht hier für Redundant, Outdated, Trivial, also Daten, welche doppelt vorhanden sind, veraltet oder keine Bedeutung für die Organisation haben).

  • Nutzen POC: Anhand eines ausgewählten Datenbestandes kann die Machbarkeit des automatisierten Data Cleanups aufgezeigt werden.
  • Nutzen automatisierter Data Cleanup: Das Einsparpotenzials gegenüber einer manuellen Datenbereinigung wird quantifiziert.
  • Die benötigten Verfahren stehen heute auch Kunden zur Verfügung, welche nicht die Lizenzen eines „Big Players“ bezahlen möchten.

ROT-Daten verursachen heute geschätzte 70% der gesamten IT-Kosten.

Nebst dem finanziellen Nutzen kann eine wesentliche Verbesserung der Datenqualität erreicht werden.

Die Kernfrage lautet also: Wie kann man die wertvollen Nutzdaten von den ROT-Daten trennen? (ROT steht hier für Redundant, Outdated, Trivial, also Daten, welche doppelt vorhanden sind, veraltet oder keine Bedeutung für die Organisation haben).

Methode

Der PoC basiert auf der MATRIO® Data Cleanup Methode (Whitepaper):

Unser Angebot

Wir führen Sie strukturiert durch diesen Prozess und erarbeiten mit Ihnen ein umfassendes Konzept zur Bereinigung. Dabei setzen wir sowohl auf die PoolParty Semantic Suite wie auch auf einen Methodenbaukasten für die Analyse Ihrer Daten. Wir arbeiten dabei mit einer erfahrenen SW-Entwicklungsfirma zusammen, welche sich auf u.a. auf NLP und intelligente Suchverfahren spezialisiert hat.

Technologie-Baukasten:

Namenserkennung
Identitätscheck, Erkennung und
Löschung persönlicher Information aus Dokumenten
ThemenerkennungE-Mail Triage, Weiterleitung von Anfragen und
Informationen
Textklassifikation Automatische Dokumentenzuweisung und -Ablage
InformationsextraktionZusammenfassung & Extraktion von
Schlüsselinformation aus Dokumenten und Dossiers
AnnotationAuszeichnung von Textelementen mit
kundenspezifischen Labels
Recommender SystemeEmpfehlungen aufgrund von Textinhalten und
Metadaten
ÄhnlichkeitsbestimmungBestimmung und Suche ähnlicher Dokumente /
Entitäten
Intelligente SucheSemantische Volltextsuche, Unterstützung bei der
Navigation in Dokumenten-Repositories,
Informationsfilterung
Kombination von
Komponenten
Inhaltsgesteuerte Entscheidungsunterstützung
DatenklassifikationTaxonomien, Ontologien
Knowledge GraphsEinsatz von KG Verfahren auf Basis der PoolParty Semantic Suite

Interessiert?  Dann melden Sie sich bitte direkt bei uns! Ihr Ansprechpartner: Bruno Wildhaber

 

 

 

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.