Zasto OCR racuna baziran na predloscima ne radi za racunovodje — i sto koristiti umjesto toga | Arhivix

Zasto OCR racuna baziran na predloscima ne radi za racunovodje — i sto koristiti umjesto toga

Zasto OCR racuna baziran na predloscima ne radi za racunovodje — i sto koristiti umjesto toga

Zamka predlozaka

Ako vodite racunovodstvenu tvrtku, vjerojatno ste probali Dext, Hubdoc ili AutoEntry. Rade — dok ne prestanu raditi. Cim dobavljac promijeni izgled svog racuna (novi logo, pomicanje stupaca, drugaciji blok adrese), ekstrakcija se kvari. Netko iz vaseg tima mora rucno kreirati ili popraviti predlozak. Za tvrtku koja opsluzuje 30 klijenata sa 50 dobavljaca svaki, to je 1.500 potencijalnih kvarova predlozaka koji cekaju da se dogode.

Hubdoc, kojeg je preuzeo Xero, jedva se razvijao od akvizicije — sjedi na 3,3 zvjezdice u Xero App Storeu bez podrske za stavke retka i minimalnim razvojem. Dext je bolji, ali i dalje zahtijeva rucnu intervenciju predloska za nestandardne formate. A niti jedan ne rjesava dobro ne-latinicna pisma — probajte kroz njih provuci srpski ili arapski racun.

Problem 10-15% iznimaka

Cak i najbolji OCR alati bazirani na predloscima ispravno obradjuju 85-90% racuna pri prvom prolazu. To zvuci dobro dok ne izracunate: za tvrtku koja obraduje 2.000 racuna miesecno, 200-300 racuna treba rucni pregled i ispravak. Po 3 minute po ispravku, to je 10-15 sati strucnog rada svaki mjesec samo na rjesavanju iznimaka koje je alat stvorio.

AI ekstrakcija: bez predlozaka, bez kvarova

Moderni OCR baziran na AI uopce ne koristi predloske. Umjesto podudaranja piksela s unaprijed definiranim zonama, razumije strukturu dokumenta. Prepoznaje da je broj pored "Total" ili "Ukupno" ili "Gesamt" iznos racuna, bez obzira gdje se na stranici nalazi. Identificira dobavljaca iz zaglavlja, datum iz bilo kojeg od dvanaest uobicajenih formata datuma i razrez PDV-a iz konteksta — ne pozicije.

Kada dobavljac promijeni izgled svog racuna, AI ekstrakcija se automatski prilagodjava jer nikada nije ovisila o izgledu.

Sto vasa tvrtka zapravo treba od OCR-a za racune

  • Ekstrakcija stavki retka — ne samo ukupni iznosi, vec svaki proizvod, kolicina, jedinicna cijena i stopa PDV-a
  • Podrska vise valuta — ispravno parsiranje EUR, RSD, USD, GBP iznosa i konverzija po potrebi
  • Visejezicno prepoznavanje — obrada srpske cirilice/latinice, njemackog, hrvatskog i engleskog na istom racunu
  • Rad bez predlozaka — funkcionira na prvom racunu novog dobavljaca bez ikakve konfiguracije
  • Ocjenjivanje pouzdanosti — govori vam kada nije siguran umjesto da tiho krivo pogodja

Kako Arhivix rjesava OCR za racunovodstvo

Arhivix koristi Tesseract OCR s AI post-obradom koja specificno cilja izazove racunovodstvenih dokumenata: vracanje srpskih dijakriticnih znakova, parsiranje iznosa u raznim valutama i normalizacija datuma u europskim formatima. Klasifikacijski motor automatski identificira vrstu dokumenta (racun, potvrda, knjizno odobrenje), izvlaci dobavljaca, iznos, valutu, datum i broj racuna — zatim sve preusmjerava u Smart Inbox gdje vas tim pregleda i odobrava jednim klikom. Bez predlozaka. Bez konfiguracije specificne za dobavljaca. Dokumenti su sifreni AES-256 na AWS S3 i svaka odluka ekstrakcije biljezi se u revizijskom tragu.