Ko v slovenskem podjetju nekdo reče »OCR«, običajno misli na nekaj povsem drugega kot ponudnik AI orodja, ki to besedo uporablja. Razlika ni terminološka. Je razlika med branjem dokumenta in razumevanjem dokumenta. Pri prepoznavi računa, dobavnice ali pogodbe se ta razlika pokaže v tem, kar sistem na izhodu vrne.
Ta članek vzporedno postavi, kaj naredi klasičen OCR in kaj sodobna AI prepoznava pri štirih tipih finančnih in operativnih dokumentov. Cilj ni omalovaževati klasičen OCR. Ima svoje mesto. Pomembno pa je vedeti, kje to mesto ni.
Kaj klasičen OCR sploh je
Klasičen OCR (optično prepoznavanje znakov) pretvori sliko v besedilo. To je vse. Pri kakovostnem skenu vrne dokaj zanesljiv prepis. Pri slabšem skenu vrne prepis z napakami. Pri nestrukturiranem dokumentu vrne tok besedila brez podatka, kateri del pomeni kaj.
Klasičen OCR ne ve, kaj je račun. Ne ve, kaj je dobavitelj. Ne ve, kaj je postavka. Vidi črke, številke in presledke. Vse, kar se zgodi za tem, je delo nekoga ali nečesa drugega, običajno človeka, ki gleda zaslon in prepisuje v ERP.
Kaj naredi AI prepoznava dokumentov
AI prepoznava dokumentov se začne tam, kjer se OCR konča. Nad surovim besedilom deluje model, ki razume tip dokumenta in to, kateri deli pomenijo glavo, postavke, skupne vrednosti in sklicne podatke. Izhod ni tok besedila, izhod je strukturiran zapis polj, ki ga je mogoče neposredno prenesti v ERP ali povezati z drugim dokumentom.
Pri dobrem AI sloju je vključena tudi kontekstualna razlaga: predlog konta na podlagi zgodovine, prepoznava dobavitelja ne glede na zapis imena, povezava na pričakovan prevzem ali naročilnico. To je sloj, ki dela razliko v praksi.
Štirje dokumenti, dve obravnavi
Račun za blago
Klasičen OCR na računu vrne nekaj takega:
- Tok besedila s pomešanimi stolpci.
- Zneski, ki niso povezani s posameznimi postavkami.
- DDV in osnova le kot številki, brez konteksta.
- Datum kot niz brez razlike med datumom izdaje, zapadlosti in opravljene storitve.
AI sloj na istem računu vrne strukturiran zapis: dobavitelj z davčno številko, datum izdaje, datum zapadlosti, posamezne postavke z opisom in zneskom, razčlenjen DDV po stopnjah, sklic za plačilo. Dodatno, če je sistem povezan z vašo zgodovino, vrne predlog konta in opozorilo, če se kaj na računu razlikuje od običajnega vzorca pri tem dobavitelju.
Dobavnica
Klasičen OCR na dobavnici naredi največ škode, ker so dobavnice oblikovno najbolj raznolike. Vrne tok besedila, kjer so stolpci pomešani, in kjer računovodja ali skladiščnik še vedno ročno prepiše vsako vrstico v ERP. Pri večstranskih dobavnicah se postavke razdelijo, kar pri klasičnem OCR-ju zahteva ročno združevanje.
AI sloj prepozna dokument kot dobavnico, izvleče stolpce z opisom, količino, enoto in po potrebi ceno, prepozna povezavo na predhodno naročilnico ter pripravi dokument za prihajajočo povezavo z računom. Razlike v količini ali artiklu pri prevzemu sprožijo opozorilo, namesto da bi ostale neopažene.
Naročilnica
Klasičen OCR na naročilnici pogosto ne najde smiselne strukture, ker naročilnice nimajo standardne postavitve. Pri eni je struktura tabela, pri drugi proza, pri tretji Excel, izvožen v PDF. OCR vrne, kar zmore, in to je običajno premalo za avtomatsko obravnavo.
AI sloj naročilnico obravnava kot ločen tip dokumenta s svojo logiko: identificira kupca, dobavitelja, postavke z dogovorjenimi cenami, datum dostave, plačilni rok. Te podatke shrani na način, ki omogoči, da prihajajoči prevzem in račun najdeta pravo naročilnico in se z njo primerjata.
Pogodba z dobaviteljem
Klasičen OCR na pogodbi vrne dolg tok besedila brez strukture. To je uporabno za iskanje po besedilu (»v katerih pogodbah omenjamo transport«), ni pa uporabno za nič drugega.
AI sloj iz pogodbe izvleče ključne pogoje: pogodbeni partner, plačilni rok, cenovni pogoji, popusti glede na volumen, posebne klavzule, datum veljavnosti in datum izteka. Ti podatki postanejo dostopni pri obravnavi računa, kar omogoča avtomatsko preverjanje, ali so pogoji na računu skladni s pogodbenimi.
Kdaj klasičen OCR še vedno zadošča
Klasičen OCR ima svoje mesto pri scenarijih, kjer je cilj le, da dokument postane dostopen za iskanje in shranjen v digitalni obliki, brez nadaljnje obdelave. Tipično:
- Arhiviranje starih papirnih dokumentov, ki niso več v aktivnem prometu.
- Iskanje po besedilu dokumentov (npr. »kateri račun omenja naslov X«).
- Začasna digitalizacija pri pripravi na revizijo, kjer dokumenti niso povezani v procesu.
V vseh teh primerih je klasičen OCR cenovno smiseln in dovolj dober. Razlika postane pomembna takrat, ko je dokument vhod v poslovni proces.
Kdaj klasičen OCR ni dovolj
Kakor hitro je naslednji korak po dokumentu knjižba, prevzem, povezava z drugim dokumentom ali avtomatska akcija, klasičen OCR ne zadošča. Razlog je preprost: klasičen OCR vrne besedilo, knjižba pa potrebuje strukturirana polja. Razlika med obema mora nekdo premostiti, in če ni AI sloja, je to oseba.
Pri ročnem prepisu iz OCR besedila v ERP se prihranek avtomatizacije v celoti izgubi. Klasičen OCR brez AI sloja je polovica avtomatizacije, kar je pogosto manj uporabno od ničesar.
Tipičen znak, da je organizacija obtičala na klasičnem OCR-ju, je polovična digitalizacija: dokumenti so prebrani, vendar jih nekdo še vedno prepisuje v drugo okolje. Občutek je »delamo digitalno«, dejansko delo pa je še vedno ročno.
Bistvo
Razlika med klasičnim OCR-jem in AI prepoznavo dokumentov ni majhna. Klasičen OCR rešuje branje, AI sloj rešuje razumevanje. Pri arhivu in iskanju zadošča prvi. Pri vsakem dokumentu, ki sproži poslovno akcijo, je potreben drugi.
Pri izboru orodja se splača preveriti, ali ponujeni izdelek vrača besedilo ali strukturirana polja s povezavo na ERP. To sta dva različna izdelka, ki sta po imenu pogosto podobna, po rezultatu pa popolnoma drugačna.