Přínosy automatického vytěžování dokumentů a jak funguje

vytezovani-dokumentu

Přepisujete ve firmě data z přijatých dokumentů ručně? Nebo používáte OCR, ale nevíte, jak dál pracovat se získanými daty? Pojďme se podívat na to, jak řízení dokumentů ve firmě dostat na vyšší úroveň díky vytěžování dat.

Řada firem svá data digitalizuje. Skenuje, skenuje a záhy zjistí, že má najednou neuvěřitelné množství dat, která jsou pro další práci nepoužitelná. Například, když převede do pdf stovky faktur a až pak zjistí, že z nich mohla všechna data z dokumentu jednoduše vytěžit a dále s nimi pracovat, například s DMS software.

Prosté rozpoznávání textu pro efektivní vytěžování dokumentů nestačí

Vytěžování dat znamená získání strukturovaných dat z dokumentů, například z dodavatelských faktur, dotazníků, smluv apod. 


Po převedení dokumentu z papírové do digitální podoby provede OCR software jednoduché rozpoznání textu. Výsledkem jsou data v prosté podobě. Na ukázku si prohlédněte výstup pro fiktivní fakturu: 


“Novák Petr. IČ: 1234567 Faktura - daňový doklad č. 2018-06-11-7 Neznámá 11 Datum plnění 30. říjen 2018 77900 Olomouc Datum vystavení 10. říjen 2018 DIČ: CZ1234567 Datum splatnosti 30. říjen 2018 Banka: LuftBank, a.s. Účet: 11111111/2222 Forma úhrady převodním příkazem Konečný příjemce Příjemce IČ 654311 DIČ: CZ654311 Rajský Adam, V ráji 1 190 00 Praha 9-Vysočany”


Technologie OCR tedy dokáže perfektně rozpoznat text, ale bez vytěžení dat je výstup dále jeho využití jen velmi omezené. Stačí například pouze pro fulltextové vyhledávání v rámci DMS systému.

Jedině strukturovaná data při vytěžování dokumentů vám umožní automatizaci

Jestli očekáváte od vytěžování a toku dokumentů ve firmě víc, bez technologie pro vytěžování dat se neobejdete –⁠ vytěžovací algoritmus vytvoří strukturovaná data, která lze dále automatizovat. 

Ukažme si část výsledku po vytěžení dat na fiktivním dokumentu:

Typ                             ID                                        Hodnota

Faktura přijatá         id_Dodavatel                  Novák Petr

Faktura přijatá         id_AdresaDodavatel        Neznámá 11 77900 Olomouc

Faktura přijatá         id_IcoDodavatel              1234567

 

Takové řešení firmě ušetří spoustu lidské práce a minimalizuje chybovost. 

Hodí se například pro automatické zpracování dodavatelských faktur, kde snížíte nutnost práce s papírovými dokumenty a zefektivníte celý proces.

Další správa vytěžených dokumentů

Pro správu vytěžených dokumentů je výhodné dále využívat DMS software, který dovoluje inteligentní vyhledávání, ukládání dokumentů a jejich změn a usnadňuje workflow. 

Po udělení různé úrovně správcovských práv pak získává uživatel možnost s dokumenty pracovat odkudkoliv.