Wie lernt die künstliche Intelligenz von Finmatics das Auslesen von Belegen?

Finmatics nutzt Deep Learning und Auto Machine Learning um Belege zu analysieren und auszulesen.

Wie liest Finmatics Informationen aus Dokumenten aus?  

Für das Erfassen von Information aus Rechnungen (Rechnungsnummer, Rechnungsdatum, Beträge…) setzt Finmatics eine Kombination aus Deep Learning und Auto Machine Learning ein.  

Die Machine Learning Technologie von Finmatics erkennt das Rechnungslayout (über Stammdaten, UID) und „erlernt“ automatisch ein Modell pro Rechnungs-Aussteller.
Korrekturen in den ERP Systemen oder im Buchhalter Cockpit trainieren automatisch die Modelle und das System wird laufend besser (Auto Machine Learning). Typischerweise muss ein Geschäftspartner 3-5x angelernt werden, um das Modell vollständig zu trainieren.  

Die Modelle, wie Rechnungslayouts auszulesen sind, werden über alle Kanzleien geteilt. Bereits mehrere Millionen Rechnungslayouts für mehrere Länder wurden durch das System angelernt (Stand Mai 2022) .

Das Lernverhalten des Auto Machine Learning von Finmatics ist hier exemplarisch dargestellt: 

KI_Rechnung_auslesen_small2

Abbildung 1: Lernverhalten von Finmatics – Auto Machine Learning Modell.  

Die Auto Machine Learning Technologie hat einen Nachteil: Wenn das Rechnungslayout noch nicht im Finmatics System antrainiert wurde, können durch dieses Modell keine Werte auslegelesen werden. 
 

Daher wurde die Auto Machine Learning Technologie mit einem weiteren Modell, einem Deep Learning Modell, kombiniert.
Das Deep Learning Modell ist antrainiert auf alle Rechnungen im Finmatics System und wird regelmäßig weiter trainiert.  Das Deep Learning Modell von Finmatics lernt allgemeine Zusammenhänge ähnlich wie ein Mensch, d.h. es kann generalisieren (auch neue, unbekannte Rechnungen auslesen). 

Die Kombination von Auto Machine Learning und Deep Learning ist ideal:
Wenn der Rechnungsersteller für Finmatics unbekannt ist, liefert das Deep Learning Modell Daten.
Ist der Rechnungsersteller bekannt und angelernt, „übernimmt“ das Auto Machine Learning Modell.  

Welche Fehler können beim Auslesen von Information aus Dokumenten passieren?  
  

  • Geschäftspartner kann nicht erkannt werden
    Ist der Geschäftspartner unbekannt oder kann über Stammdaten nicht zugewiesen werden, kann das „Auto Machine Learning Modell“ nicht das richtige Modell ziehen. Ausschließlich die Ergebnisse des Deep Learning Modells werden angezeigt und die Trefferquote ist geringer.  

Tipp: Die Geschäftspartnererkennung kann durch Stammdatenpflege perfektioniert werden: Nutzen Sie hierfür den Stammdaten-Automatisierungreport und 50% höhere Automatisierung durch Pflege der top 100 Geschäftspartner. 

  • OCR Fehler
    Schlechte Scans können zu OCR Fehlern (z.B. Verwechslung von der Zahl Null (0) und dem Buchstaben O. OCR Fehler können durch einen gut definierten Scanprozess reduziert werden (Mehr Informationen zum richtigen Scannen finden Sie in unserem Scanguide
  • Labelling Fehler
    Finmatics lernt, indem ausgelesene Werte auf dem Dokument gesucht und automatisch „markiert“ werden. Datumsformate werden z.B. in 70 übliche Formate konvertiert und dann am Dokument gesucht. Ebenso werden Leerzeichen etc. reduziert. Manchmal kann es jedoch sein, dass ausgelesene Werte nicht am Dokument gefunden werden können. Wenn dies der Fall ist, findet kein Training statt und die Ausleseergebnisse werden nicht besser.

    Tipp: Erfassen Sie die Felder immer so, wie sie auf dem Dokument stehen, sonst kann Finmatics nicht lernen.
      
  • Modell ist (noch) nicht perfekt trainiert.
    Für einen kleinen Teil von Dokumenten, z.B. mit speziellen Layouts oder komplexen steuerlichen Aufteilungen, liefert weder Finmatics' Deep Learning, noch das Auto Machine Learning Modell richtige Resultate. Das Finmatics Data Science Team ist immer bestrebt, die Modelle weiter zu verbessern.