Extraktion von Informationen aus semi-strukturierten Dokumenten

Die Extraktion von Informationen bezieht sich auf den Prozess der automatisierten Identifizierung, Extraktion und Verarbeitung von relevanten Informationen aus Dokumenten, die ein bestimmtes Format oder eine bestimmte Struktur aufweisen. Semi-strukturierte Dokumente können z.B. Tabellen, Formulare oder XML-Dateien sein, während unstrukturierte Dokumente Texte ohne erkennbare Struktur sind.

Das Team des DataLab hat hierfür eine Handreichung verfasst, die Sie per Klick auf den folgenden Text herunterladen können. Viel Freude beim Lesen!

Handreichung_Extraktion von Informationen_DataLabWestSax