ICDAR 2026 • DocVQA Competition
Technischer Bericht: DCA at DocVQA 2026
Welf Wustlich, CTO, PLANET AI
Juni 2026 · 19 Seiten
PLANET AI gewinnt DocVQA 2026: Architektur schlägt Modellgröße
DocVQA 2026 ist der weltweit anspruchsvollste Wettbewerb für Dokumentenverstehen. Ausgerichtet vom Computer Vision Center der Universitat Autònoma de Barcelona, verlangt er tiefes Reasoning über acht völlig unterschiedliche Dokumentkategorien. Kein einzelnes Modell schlägt sich in allen acht gleich gut.
PLANET AI hat gewonnen, nicht mit einem größeren Modell, sondern mit einer anderen Architektur. Die Distributed Cognitive Architecture (DCA) koordiniert mehrere Foundation Models als kooperierendes Team, ergänzt durch IDA als präzise OCR-Grundlage. Das Ergebnis: 60,0 % Accuracy gegenüber rund 40 % der besten Frontier-Model-Konfiguration.