REGELFREIE DOKUMENTENKLASSIFIZIERUNG FÜR
SCANning Service provider

KPIs der Dokumentenklassifizierung

DER KUNDE
Unser renommierter Kunde bietet seit über 50 Jahren Business Process Outsourcing-Dienstleistungen für Gesundheitsdienstleister, den öffentlichen Sektor und Unternehmenskunden an.
Der Kunde hat sich auf die Digitalisierung, Indexierung und Archivierung von Dokumenten spezialisiert und verarbeitet jährlich ein Volumen von einer Milliarde Seiten.
DIE HERAUSFORDERUNG
Vor der Implementierung von IDA waren die täglichen Prozesse des Kunden mit dem Scannen und Lesen eingehender Dokumentenboxen verbunden. Anfangs wurde ein führendes Intelligent Document Processing (IDP) Produkt für eine regelbasierte Dokumentenklassifizierung verwendet.
Unser Kunde hatte jedoch erhebliche Schwierigkeiten bei der Automatisierung ihrer Dokumentenscan- und Archivierungsprozesse. Die Automatisierungsrate der Dokumentenklassifizierung lag unter 50%. Dadurch war eine erhebliche Menge an manueller Arbeit erforderlich, um Dokumente zu korrigieren und zu validieren, die unterhalb der erforderlichen Vertrauensschwellen lagen.
Zusätzlich war der regelbasierte Ansatz zur Dokumentenklassifizierung des Kunden ressourcenintensiv und teuer in der Wartung, insbesondere bei der Änderung bestehender Dokumentenklassen oder der Erstellung neuer Klassen. Die Einführung von regulatorischen Änderungen betonte die Notwendigkeit eines präziseren Kategorisierungssystems, das ihre bisherige Lösung nicht effektiv liefern konnte.
DIE LÖSUNG
Genau

Während der Evaluierungsphase zeigte IDA, das neue implementierte System, eine bemerkenswerte Leistung mit einer Automatisierungsrate von 90% für die Dokumentenklassifizierung von Anfang an. Dieser Erfolg kann der hochmodernen OCR-Engine von IDA zugeschrieben werden, die eine herausragende Genauigkeit und Confidence Scores liefert.
Im Gegensatz zur vorherigen Lösung verwendet IDA einen regelfreien Ansatz mit Few-Shot Learning. Dies ermöglichte eine schnelle Ersteinrichtung in weniger als drei Tagen, im Vergleich zu den langwierigen 240 Tagen der vorherigen Lösung. Aufgrund von regulatorischen Änderungen war eine erhebliche Erweiterung der Dokumentenklassen erforderlich, von etwa 150 auf über 300. Die Fähigkeit von IDA, sich mittels Few-Shot Learning an neue Dokumentenklassen anzupassen, ermöglichte es dem Kunden, die Anforderungen prompt zu erfüllen.
Effizient

Die Implementierung von IDA hatte eine erhebliche Auswirkung und führte zu einer Reduzierung des manuellen Aufwands um 80% durch eine erhöhte Straight-Through-Verarbeitung – selbst bei dem Ziel des Kunden, falsch positive Ergebnisse auf weniger als 1% zu minimieren.
Insgesamt ermöglicht die erhebliche Verbesserung der Automatisierung unserem Kunden eine signifikante Skalierung ihres Geschäfts.
Ausblick
Das Scannen und Verarbeiten großer Dokumentenmengen kann äußerst herausfordernd sein, insbesondere wenn es sich um PDFs mit 100 oder mehr aufeinanderfolgenden Formularen handelt. Die automatische Klassifizierung dieser Dokumente basierend auf ihren Kategorien scheint fast unmöglich zu sein. Der Prozess der Trennung der Dokumente erfordert derzeit einen erheblichen manuellen Aufwand, der in der Regel das Einfügen von Trennblättern zwischen jedem Dokument beinhaltet.
Document Splitting

In Zukunft plant der Kunde jedoch, dieses Problem durch die Nutzung des Document Splitting Features von IDA anzugehen. Dadurch wird es ihnen möglich sein, ein neuronales Netzwerk zu trainieren, um den Anfang und das Ende von mehrseitigen Dokumenten automatisch zu erkennen oder Dokumente nach einer festgelegten Anzahl von Seiten regelbasiert zu teilen.
Durch die Nutzung der Datenextraktionsfähigkeiten von IDA hat der Kunde die Möglichkeit, sein Serviceportfolio zu erweitern und weitere Expansionsmöglichkeiten zu erkunden.