Zasto OCR faktura zasnovan na sablonima ne odgovara racunovodstvima — i sta koristiti umesto toga | Arhivix

Zasto OCR faktura zasnovan na sablonima ne odgovara racunovodstvima — i sta koristiti umesto toga

Zasto OCR faktura zasnovan na sablonima ne odgovara racunovodstvima — i sta koristiti umesto toga

Zamka sablona

Ako vodite racunovodstvenu agenciju, verovatno ste probali Dext, Hubdoc ili AutoEntry. Rade — dok ne prestanu. Cim dobavljac promeni izgled fakture (novi logo, pomerene kolone, drugaciji blok adrese), ekstrakcija puca. Neko iz vaseg tima mora rucno da kreira ili ispravi sablon. Za agenciju koja opsluzuje 30 klijenata sa po 50 dobavljaca, to je 1.500 potencijalnih kvarova sablona koji cekaju da se dogode.

Hubdoc, koga je preuzeo Xero, jedva da se razvijao od akvizicije — sa ocenom 3.3 zvezdice u Xero App Store-u, bez podrske za stavke i minimalnim razvojem. Dext je bolji, ali i dalje zahteva rucnu intervenciju sablona za nestandardne formate. I ni jedan ne obradjuje dobro ne-latinska pisma — probajte provuci srpsku ili arapsku fakturu kroz njih.

Problem izuzetaka od 10-15%

Cak i najbolji OCR alati zasnovani na sablonima ispravno obrade 85-90% faktura u prvom prolazu. Zvuci dobro, dok ne uradite matematiku: za agenciju koja obradjuje 2.000 faktura mesecno, 200-300 faktura zahtevaju rucni pregled i korekciju. Sa 3 minuta po korekciji, to je 10-15 sati strucnog rada mesecno — samo za resavanje izuzetaka koje je alat napravio.

AI ekstrakcija: bez sablona, bez kvarova

Moderni OCR zasnovan na AI uopste ne koristi sablone. Umesto podudaranja piksela sa unapred definisanim zonama, razume strukturu dokumenta. Prepoznaje da je broj pored "Total" ili "Ukupno" ili "Gesamt" iznos fakture, bez obzira gde se na stranici nalazi. Identifikuje dobavljaca iz zaglavlja pisma, datum iz bilo kog od dvanaest uobicajenih formata datuma, i razclanjavanjepDV-a iz konteksta — ne pozicije.

Kada dobavljac promeni izgled fakture, ekstrakcija zasnovana na AI se automatski prilagodja jer nikada nije zavisila od izgleda.

Sta vasa agencija zapravo treba od OCR-a faktura

  • Ekstrakcija stavki — ne samo ukupne iznose, vec svaki proizvod, kolicinu, jedinicnu cenu i stopu PDV-a
  • Podrska za vise valuta — ispravno parsiranje iznosa u EUR, RSD, USD, GBP i konverzija po potrebi
  • Visejezicno prepoznavanje — obrada srpske cirilice/latinice, nemackog, hrvatskog i engleskog na istoj fakturi
  • Rad bez sablona — radi na prvoj fakturi novog dobavljaca bez ikakvih podesavanja
  • Ocena pouzdanosti — govori kada nije siguran, umesto da tacno pogadja pogresnno

Kako Arhivix obradjuje racunovodstveni OCR

Arhivix koristi Tesseract OCR sa AI post-procesiranjem specificno usmerenim na izazove racunovodstvenih dokumenata: obnavljanje srpskih dijakritika, parsiranje iznosa u razlicitim valutama i normalizacija datuma u evropskim formatima. Motor klasifikacije automatski identifikuje tip dokumenta (faktura, racun, knjizno odobrenje), izvlaci dobavljaca, iznos, valutu, datum i broj fakture — zatim sve usmerava u Smart Inbox gde vas tim pregledava i odobrava jednim klikom. Bez sablona. Bez konfiguracije po dobavljacu. Dokumenti su sifrovani sa AES-256 na AWS S3, a svaka odluka ekstrakcije je zabelebezena u revizorskom tragu.