Best Paper Award für PLANET AI auf der ICDAR 2021
Die ICDAR – International Conference on Document Analysis and Recognition – ist die wichtigste Konferenz für Wissenschaft und Industrie im Bereich der Dokumentenanalyse und Schrifterkennung. Das Forschungsteam von PLANET AI trat mit insgesamt drei Beiträgen an und konnte einen Best Paper Award gewinnen.
Im 6. International Workshop in Historical Document Imaging and Processing (HIP ’21) wurde der Artikel „Mixed Model OCR Training on Historical Latin Script for Out-of-the-Box Recognition and Fine-tuning“ als beste wissenschaftliche Veröffentlichung ausgezeichnet.
In Kooperation mit Forschern der Universität Würzburg und der LMU München wurde zunächst ein umfangreicher Korpus an OCR-Trainingsdaten gesammelt und aufbereitet, der mehrere Sprachen und fast 450 Jahre Druckgeschichte abdeckt. Anschließend wurde, unter Verwendung bestehender Best Practices kombiniert mit neuen datenseitigen Optimierungen, ein OCR-Modell trainiert. Dieses übertraf zum einen bei der out-of-the-box Anwendung auf ungesehenem Material existierende Methoden deutlich und erwies sich zum anderen als wertvoller Ausgangspunkt für weitere, gezieltere Trainingsprozesse hat.
Die ICDAR, die vom 05. bis 10. September im schweizerischen Lausanne stattfand, war in der Vergangenheit schon mehrfach ein erfolgreiches Pflaster für PLANET AI. 2019, 2017 und 2015 konnte das Forschungsteam insgesamt sechs Awards im Bereich der Handschrifterkennung erringen. Praktische Anwendungsbeispiele für die mehrfach ausgezeichnete Technologie ist die Digitalisierung historischer Dokumente mithilfe der IDA Suite, PLANET AIs Produkt zur Intelligenten Dokumentenanalyse.
Auf der ICDAR wurde außerdem der Beitrag „Transformer for Handwritten Text Recognition using Bidirectional Post-Decoding“ als Poster-Präsentation vorgestellt, der in Kooperation mit der Universität Rostock entstand. Darin wurde zum einen gezeigt, wie mittels komplexer Transformer-Netzwerke handschriftliche Texte gelesen werden können. Zum anderen wurde ein Verbesserungsverfahren vorgestellt, das durch zweimaliges Lesen der Zeile – einmal von links nach rechts und einmal von rechts nach links – die Genauigkeit deutlich erhöht werden konnte.
Ebenso ging PLANET AI mit einem Vortrag zum Paper „One-Model Ensemble-Learning for Text Recognition of Historical Printings“ an den Start. In Kooperation mit dem Zentrum für Philologie und Digitalität „Kallimachos“ (ZPD) der Universität Würzburg wurde ein neuartiges Verfahren entwickelt, das es ermöglicht, Modelle für unbekannte Schrifttypen mit nur wenigen Zeilen an manuell erstellter Ground Truth effizient zu trainieren.
Grundlagenforschung ist ein wichtiger Bestandteil des Innovationsprozesses bei PLANET AI. Anwendung finden die neuesten Forschungsergebnisse in der Weiterentwicklung von PLANETBRAIN, der Künstlichen Intelligenz, die sich in all unseren Produkten wiederfindet.