Google mit KI auch für "Dokument-Verstehen"?

11.10.2019

AI, Automatisierung & Information Management: auch Google bietet jetzt Services in der Cloud zur Dokumenten-Analyse an: Google: "Unlocking the power of AI with solutions designed for every enterprise" http://bit.ly/Google-ECM. Die Effekte werden gut im Artikel "Bringing Intelligence to Enterprise Content Management, Google Releases Document Understanding AI" beschrieben: http://bit.ly/Google-Document-Understanding. Zu den Einsatzmöglichkeiten von AI und ML auf der Google-Plattform gibt es auch das Video eines aktuellen Vortrages: https://www.youtube.com/watch?v=7dtl650D0y0.

Mit "Document Understanding" wird bei Google die Analyse, die Klassifikation und das inhaltliche "Verstehen" beliebiger digitaler - auslesbarer, also nicht Images, dafür braucht es noch zwischendurch OCR/ICR  - Objekte bezeichnet. Dafür lassen sich auch Profile per ML erlernen oder trainieren und als kundenspezifische Schema speichern.

Google AI Architecture for Document Understanding | Screenshot https://www.youtube.com/watch?v=7dtl650D0y0
[ Google Document Understanding AI | Screenshot https://www.youtube.com/watch?v=7dtl650D0y0 ]

Für diese Lösungen gibt es bereits eine Reihe von Entwicklungs- und Lösungs-Partnern. Darunter namhafte Anbieter aus der ECM-Branche: Iron MountainBoxEgnyteUiPathAccenture und Taulia. Interessant wird die AI-Konkurrenz-Situation bei Box werden. Box ist Partner von IBM und nutzt Watson. Zudem strebt Box eine engere Kooperation mit Microsoft an und wird dort auch auf Automatisierungs-Services zurückgreifen wollen.

Google AI ML Content Extraction | Screenshot https://www.youtube.com/watch?v=7dtl650D0y0
[ Google AI ML Content Extraction | Screenshot https://www.youtube.com/watch?v=7dtl650D0y0 ]

Künstliche Intelligenz ist zur treibenden Kraft im Information Management geworden. Automatisierung wird von AI & ML vorangetrieben. So wird auch BPM Business Process Management und RPA Robotic Process Automation ebenso profitieren wie die traditionellen Einsatzgebiete beim Input-Management (Capture), inhaltlicher Erschließung (Taxonomy, Classification, Indexing) und Wiederfinden (Retrieval, Search). Brauchen wir dann zukünftig noch manuell erstellte Aktenpläne für das Records Management? Klassifiziert und ordnet die Maschine dann alles selbst? Findet die Maschine alles? Befinden wir uns auch hier auf dem Weg zum SICS? http://bit.ly/updateIM19-HH-SICS

Kommentare

Das Video von Google ist schon sehr interessant. Hier kann man auch auf Bestrebungen von Microsoft mit den Cognitive Services verweisen. AWS hat da sicher auch was :) Aber ich finde nach meiner aktuellen Marktsondierung den Begriff AI für die Künstliche Intelligenz im Bereich Dokumentenklassifizierung deutlich überbewertet.

Wo wird diese verwendet? Sind meine Ansprüche zu hoch? Wir wollen unseren Kunden auch einen perfekten Komfort bieten, um das Gold (also die Daten) als allen(!) relevanten Dokumentarten zu ziehen und in Prozessen und Weiterverarbeitung anzubieten. Nicht nur immer wieder „Rechnungen“. Und so sucht man, ergänzend zu eigenen Engine, an der man einfach, aber klassisch, Dokumente durch anklicken antrainiert, auch nach neuen Welten, die das Leben für die Anwender einfacher macht. Und meine aktuelle Recherche ist eher ernüchternd.

Die Lösungen, die ich mir angesehen habe, konzentrieren sich auf Rechnungen mit vordefinierten Erkennungsbibliotheken im Hintergrund. Wenigstens hier teilweise auf Crowd Learning Basis. Sobald man die Rechnungen verlässt, wird es eng.

Den interessantesten „Fall“ hatte ich in der Schweiz bei einem erstmal vielversprechenden Anbieter für eine sehr KI umworbene unterstützte automatische Erkennung von mehreren Dutzend Dokumentarten. 98% Genauigkeit. Super, dachte ich, endlich mal Fortschritte. Ein junges Startup, massiv VC gestützt.

Im Gespräch wurde es spannend. Von den vielen beworbenen Dateitypen konnte die Bibliothek „erstmal“ nur eine ... nämlich Rechnungen. Was für eine Überraschung. Die anderen würden irgendwann mal kommen. Die 98% Genauigkeit wolle man aber auch auf der Homepage korrigieren, so genau wäre es dann nicht. Ok, und was passiert mit Dokumenten, die noch nicht mit der angepriesenen Super-KI automatisch klassifiziert wurden? Ja, die werden tatsächlich von einem externen Team per Hand nachgearbeitet. Zum Nachtrainieren .... Das Thema Datenschutz hab ich dann mal außen vor gelassen. Das darf man doch bitte nicht „KI“ nennen. Das ist Marketinghumbug.

Wenn wir noch auf dieser Ebene arbeiten, dann sind wir noch meilenweit von einer Automatisierung auf Basis von KI entfernt. Kann mir jemand erklären, wozu die KI denn überhaupt bei den Klassifizierungsanbietern eingesetzt wird? Was übernimmt die KI? Fast immer entpuppte sich das als Hinterlegung von sprachflexiblen Synonymen in Kombination mit Regeln und von „Hand“ gesetzten (geskripteten) Ankerpunkten und relativen Koordinaten auf Basis von Crowd Learning und großen Dokumentbeständen. Bestenfalls angereichert mit ergänzenden Datenquellen aus ERP.

Ich stimme Ulli zu. KI kann die treibende Kraft in Segment Information Management werden. Aber aktuell ist mir da viel zu viel Schein als Sein. LEIDER. Wer mag mich von Gegenteil überzeugen?

dsgvo_einverstaendnis_comment
Einverständniserklärung nach DSGVO
Einhaltung der EU-Urheberrechtsrichtlinie
Einhaltung der EU-Urheberrechtsrichtlinie

Gespeichert von Steffen Grigull (nicht überprüft) am/um 4. November 2019 - 7:57 Permanenter Link

Das Thema ist sehr interessant und wichtig für die Zukunft. Die aktuelle Situation ist aber tatsächlich ernüchternd. Trotz zahlreicher auch größerer Projekte gibt es kaum praxisnahe Ergebnisse. Außer den Rechnungen und Anfängen bei der Verarbeitung von Mails, sind mir keine nennenswerten Fortschritte bekannt. Wir hatten erst kürzlich in einem Projekt die Situation , dass auf die Ankündigung "Das machen wir mit KI" im Test eine Erkennungsrate von 2% folgt (bei rein zufälliger Klassifikation, kann man statistisch gesehen wahrscheinlich erfolgreicher sein).

Auch bei den Rechnungen ist eine stabile Lösung fast immer mit einem Stammdatenvergleich auf Positionsebene versehen, was ja keine AI darstellt.

Aber es freut mich, dass es noch mehr Zweifler gibt. Denn aktuell passen die Anstrengungen und Ansprüche (damit auch die Erwartungen der Kunden) überhaupt nicht zu den Ergebnissen.

dsgvo_einverstaendnis_comment
Einverständniserklärung nach DSGVO
Einhaltung der EU-Urheberrechtsrichtlinie
Einhaltung der EU-Urheberrechtsrichtlinie

AIIM hat ein neues Whitepaper veröffentlicht, dass sich mit der Bedeutung der Künstlichen Intelligenz beim Information Management beschäftigt: "Why Care about Artificial Intelligence? A Guide for Adopting AI for Process Improvement" https://info.aiim.org/why-care-about-artificial-intelligence Hier wird Künstliche Intelligenz als der wichtigste Treiber beschrieben. Viel geben die par dicht mit Text bepackten Folien nicht her. Das als eBook zu bezeichnen ist schon gewagt.

AIIM AI Automation Process RPA

AIIM eBook bei PROJECT CONSULT im Download: "Why Care about Artificial Intelligence? A Guide for Adopting AI for Process Improvement" | #AIIM #AI #Automation http://bit.ly/33Q3Txp

dsgvo_einverstaendnis_comment
Einverständniserklärung nach DSGVO
Einhaltung der EU-Urheberrechtsrichtlinie
Einhaltung der EU-Urheberrechtsrichtlinie

Neuen Kommentar schreiben

Ich stimme zu, dass die von mir eingegebenen Daten einschließlich der personenbezogenen Daten an PROJECT CONSULT übermittelt und dort zur Prüfung der Freischaltung meines Kommentars verwendet werden. Bei Veröffentlichung meines Kommentars wird mein Name, jedoch nicht meine E-Mail und meine Webseite, angezeigt. Die Anzeige des Namens ist notwendig, um eine individuelle persönliche Kommunikation zu meinem Beitrag zu ermöglichen. Anonyme oder mit falschen Angaben eingereichte Kommentare werden nicht veröffentlicht. Zu Nutzung, Speicherung und Löschung meiner Daten habe die Datenschutzerklärung zur Kenntnis genommen.
Ich versichere, alle gültigen Vorgaben des Urheberrechts beachtet zu haben. Dies betrifft besonders die Nicht-Verwendung von urheberrechtlich geschütztem Material und die Nicht-Verwendung von Inhalten und Links zu Inhalten, die dem Leistungsschutz unterliegen. Für den Inhalt meines Kommentars bin ich trotz Prüfung und Freischaltung durch PROJECT CONSLT ausschließlich selbst verantwortlich. Meine Rechte am Beitrag werden bei PROJECT CONSULT nur durch die CC Creative Commons Vorgaben gewahrt. Für die Verfolgung mißbräuchlicher Nutzung meiner Beiträge durch Dritte bin ich selbst verantwortlich.

This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.