PLANET AI gewinnt DocVQA 2026: Architektur schlägt Modellgröße
Rostocker KI-Unternehmen setzt sich beim weltweit anspruchsvollsten Dokumenten-KI-Wettbewerb mit deutlichem Vorsprung gegen ein internationales Teilnehmerfeld durch
Rostock, 22. Juni 2026 – Die PLANET AI GmbH, das KI-Forschungs- und Entwicklungsunternehmen der Bechtle Group, hat die ICDAR Competition on Multimodal Reasoning over Documents 2026 (DocVQA 2026) gewonnen. Das Rostocker Unternehmen liegt nicht nur insgesamt vorne, sondern in sieben von acht Wettbewerbskategorien, mit einem Vorsprung von 22,5 Prozentpunkten vor der besten Frontier-Model-Baseline (37,5 %) und 13,75 Prozentpunkten vor dem zweitplatzierten Team (46,25 %).
DocVQA 2026 gilt als der weltweit anspruchsvollste KI-Wettbewerb für Dokumentenverstehen. Ausgerichtet vom Computer Vision Center (CVC) der Universitat Autònoma de Barcelona, verlangt die Aufgabe tiefes Reasoning, Planung und mehrstufige Inferenz über reale Dokumente in acht völlig unterschiedlichen Kategorien: Geschäftsberichte, wissenschaftliche Publikationen, Präsentationsfolien, wissenschaftliche Poster, Infografiken, Karten, Comics und technische Zeichnungen. Ein System, das in nur einer Kategorie stark ist, scheitert in den anderen.
Architektur schlägt Modellgröße
In der offenen Kategorie (über 35 Milliarden Parameter) durfte jedes Team mit jeder Architektur antreten, von einzelnen Frontier-Modellen über Mixture-of-Experts-Konfigurationen bis zu komplexen agentischen Flows, jeweils auf Basis der stärksten Foundation Models von Google, Anthropic, OpenAI und Alibaba. Den entscheidenden Unterschied machte für PLANET AI nicht die Modellgröße, sondern die Architektur.
PLANET AIs Ansatz, die Distributed Cognitive Architecture (DCA), koordiniert mehrere Foundation Models als kooperierendes Team. Sie ergänzt diese Modelle um Fähigkeiten, die ihnen einzeln strukturell fehlen: Gedächtnis über lange Dokumente, eine exekutive Instanz, die Widersprüche erkennt, und eine Konvergenzdynamik, die Antworten nicht in einem Schritt erzeugt, sondern schrittweise stabilisiert.
Konkret arbeitet die Architektur in drei Schichten. IDA, die Intelligente Dokumenten-Analyse von PLANET AI, liefert deterministisch strukturierten Text als Fundament. Die zugrunde liegende Technologie hat zwischen 2014 und 2019 bereits sieben internationale ICDAR/ICFHR-Wettbewerbe gewonnen. DocVQA 2026 ist der achte. Vier Vision-Language-Modelle (Gemini 3.1 Pro, Gemini 2.5 Pro, Claude Sonnet 4, Qwen3.5) lesen das Dokument unabhängig voneinander, jedes auf seine Stärken zugeschnitten. Claude Opus 4.6 als orchestrierender Reasoning-Agent vergleicht die Aussagen aller Modelle, erkennt Widersprüche, gewichtet Quellen nach Dokumenttyp und stellt bei rund 10 Prozent der Fragen gezielte Rückfragen an einzelne Lese-Agenten, bevor er sich festlegt. Das System ist dabei vollständig modell-agnostisch und profitiert automatisch von Fortschritten in Foundation Models.
Welf Wustlich, CTO und Gründer von PLANET AI: „Große KI-Modelle, sogenannte Foundation Models, sind Welt-Modelle mit beeindruckendem Weltwissen und Sprachfähigkeit. Denken und Intelligenz erfordern aber mehr: Gedächtnis, exekutive Kontrolle und eine Konvergenzdynamik. Genau das ergänzt DCA, und erweitert Foundation Models zu intelligenten Wissensarbeitern. Ich glaube, das ist die Grundlage für einen Paradigmenwechsel. DocVQA 2026 ist der erste öffentliche Beleg dafür, dass dieser Weg trägt.“
Eine neue Produktkategorie: digitale Wissensarbeiter
Das Ergebnis hat eine klare Konsequenz für Unternehmen mit dokumentenbasierten Prozessen in Finance, Versicherungen, Verwaltung, Industrie und im öffentlichen Sektor. Ein System, das die volle Bandbreite von Geschäftsberichten und wissenschaftlichen Postern über Infografiken bis hin zu Karten, Comics und technischen Zeichnungen gleichermaßen meistert, versteht Rechnungen, Verträge und Anträge erst recht.
Klassische Dokumentenverarbeitung sieht Dokumente als Datenquellen: Felder werden ausgelesen, in Systeme gebucht, abgehakt. Was PLANET AI mit DCA liefert, ist etwas Anderes, die Fähigkeit, Dokumente als Wissensobjekte zu behandeln: extrahieren, in Beziehung setzen, Widersprüche erkennen, mehrstufig schlussfolgern und auf Rückfragen antworten. Das ist eine eigene Produktkategorie.
Jesper Kleinjohann, CEO von PLANET AI: „Der Gewinn bei DocVQA 2026 ist für uns kein Selbstzweck. Er zeigt, dass europäische KI-Forschung international konkurrenzfähig ist und gleichzeitig die Anforderungen erfüllt, die gerade im öffentlichen Sektor nicht verhandelbar sind: Datensouveränität, DSGVO-Konformität und Unabhängigkeit von US-Infrastruktur. Als KI-Lab der Bechtle Group können wir das mit der Implementierungsstärke verbinden, die Unternehmen und Behörden für den Praxiseinsatz brauchen.“
Souveräne KI aus Europa
PLANET AI wurde 2015 in Rostock gegründet und ist über mehr als ein Jahrzehnt in Kooperationen mit europäischen Universitäten und im Rahmen europäischer Forschungsprogramme wie FP7 und Horizon 2020 gewachsen. Das System läuft auf Wunsch vollständig in der eigenen Infrastruktur des Kunden, DSGVO-konform, ohne Abhängigkeit von US-Cloud-Diensten. Souveränität ist Teil der DNA, nicht eine nachträgliche Compliance-Schicht.
Der Sieg ist auch ein vorzeitiges Ergebnis des Forschungsvorhabens SPOC-AI, das PLANET AI seit 2024 im Verbund mit ALTOW und der Universität Rostock betreibt, gefördert vom Land Mecklenburg-Vorpommern über das Wirtschaftsministerium. Die Distributed Cognitive Architecture, mit der PLANET AI DocVQA 2026 gewonnen hat, ist ein direktes Ergebnis dieser Arbeit, mehr als ein Jahr vor dem offiziellen Projektende im Juli 2027.
Die offizielle Preisverleihung findet auf der ICDAR 2026 in Wien statt (30. August bis 4. September 2026). Die wissenschaftlichen Grundlagen sind im technischen Bericht zum Wettbewerb dokumentiert: https://doi.org/10.5281/zenodo.20707289
Über PLANET AI
PLANET AI ist Pionier in der Automatisierung dokumentenbasierter Geschäftsprozesse mit deutscher KI-Technologie. Die Kernlösungen umfassen IDA für die präzise Dokumentenerfassung und JAIDE als KI-Assistenz. Gemeinsam sorgen sie für durchgängige Datenqualität von der Erfassung bis zur Entscheidung. PLANET AI ist seit 2023 Teil der Bechtle-Gruppe und bedient Scandienstleister, Softwarehersteller und dokumentenintensive Branchen, von Versicherungen über Banken bis hin zum öffentlichen Sektor. Die Lösungen zeichnen sich durch modulare Technologie, flexible Einsatzmodelle und die konsequente Einhaltung europäischer Datenschutzstandards aus. PLANET AI wurde 2015 in Rostock gegründet und hat rund 50 Mitarbeitende.
Weiterführende Links
• ICDAR 2026: https://icdar2026.org/
• DocVQA 2026 Competition: https://rrc.cvc.uab.es/?ch=34&com=introduction
• Offizielle Winner-Bekanntgabe: https://rrc.cvc.uab.es/?ch=34&com=news&view=data&id=83
• Leaderboard: https://rrc.cvc.uab.es/?ch=34&com=evaluation&task=1
• Technischer Bericht (Zenodo): https://doi.org/10.5281/zenodo.20707289
Für Medienanfragen kontaktieren Sie bitte:
Claudia Korb
Online Marketing Management
PLANET AI
claudia.korb@planet-ai.de


