Digitalizace

Skenování dokumentů

 

Skenování dokumentů je prováděno na vysokokapacitních skenerech Fujitsu v rozlišení 300 DPI (popř. až 900 DPI), a to buď z automatického podavače nebo na plochém loži. V obou případech lze využít čárového kódu pro separaci jednotlivých listů nebo celků, či pro automatizaci některých pracovních postupů. V případě následného vytěžování dat (vytváření indexů/metadat) doporučujeme skenovat v rozlišení min. 400 DPI pro přesnější rozpoznání znaků. Digitalizujeme formáty od A4 do A1.

 

Vytěžování dat pomocí OCR

 

Z vytvořených obrazových souborů je možné pomocí technologie OCR vytěžit text nebo relevantní textové hodnoty pro jejich editaci či další zpracování např. v okolních systémech, vytvoření metadatových popisných údajů, editovatelný text.

 

Vytvoření popisných údajů (indexů, metadat)

 

Popisné údaje (metadatové indexy) slouží pro rychlé vyhledávání dokumentů dle klíčových slov. Vytvoření popisných údajů vychází z potřeby přesnějšího uspořádání či efektivnějšího zpracování dokumentů. Popisné údaje jsou přikládány v dohodnuté struktuře např. ve formátu XML nebo CSV, který umožňuje zpracování v databázi či výměnu mezi okolními systémy (např. vyhledávání, automatizace pracovních postupů).

 

Výstupní formát a uložení

 

Výstupem digitalizace jsou data dosahující stejné nebo často vyšší kvality (čitelnost, jasnost obrazu…) než původní papírový originál. Při ukládání dat do formátu PDF/A jsou data komprimována tak, aby zabírala minimum místa na disku, v databázi apod. a byla tak rychleji zobrazitelná a umožňovala snazší distribuci.