cosmiq85
Enthusiast
Guten Morgen,
wir haben 2 Anwendungsszenarien bei uns in der Firma:
1. Ein Lieferschein, der immer gleich aussieht, wird per PDF OCR eingescannt und dann mittels KI Modell, Seriennummer und 2 Zählerstände ausgelesen.
Deutlich häufiger:
2. Eingescannte Seiten, meist mehr zwischen 20 und 40, auf denen ebenfalls Modell, Seriennummer und 2 Zählerstände stehen.
Mein Problem ist jetzt, dass ChatGPT hier recht häufig versagt und dann von x Seiten grade mal 3 ausliest.
Gemini kann, wenn es grade Lust hat, alle Seiten auslesen.
Manchmal bringt es von 30 Seiten aber nur 25 oder schlimmer, es fängt ab einer Seite in den 20ern an, einfach Zählerstände oder Seriennummern zu erfinden.
Ich benutze immer die gleiche Anfrage, bekomme aber nicht immer zuverlässige Ergebnisse.
Gibt es hier eine KI, die das besser kann ?
wir haben 2 Anwendungsszenarien bei uns in der Firma:
1. Ein Lieferschein, der immer gleich aussieht, wird per PDF OCR eingescannt und dann mittels KI Modell, Seriennummer und 2 Zählerstände ausgelesen.
Deutlich häufiger:
2. Eingescannte Seiten, meist mehr zwischen 20 und 40, auf denen ebenfalls Modell, Seriennummer und 2 Zählerstände stehen.
Mein Problem ist jetzt, dass ChatGPT hier recht häufig versagt und dann von x Seiten grade mal 3 ausliest.
Gemini kann, wenn es grade Lust hat, alle Seiten auslesen.
Manchmal bringt es von 30 Seiten aber nur 25 oder schlimmer, es fängt ab einer Seite in den 20ern an, einfach Zählerstände oder Seriennummern zu erfinden.
Ich benutze immer die gleiche Anfrage, bekomme aber nicht immer zuverlässige Ergebnisse.
Gibt es hier eine KI, die das besser kann ?