LEADTOOLS表單識別教程:自動歸檔掃描文件
無紙化報表和手動掃描紙質(zhì)文檔無紙化報表和手動掃描紙質(zhì)文檔是歸檔賬單、發(fā)票和財務(wù)報表的比較好的方式。然而,工作人員需要花較多的時間和精力來整理這些數(shù)字文件夾。并且,隨著數(shù)字文檔的增多,即使整理歸檔的人具
無紙化報表和手動掃描紙質(zhì)文檔
無紙化報表和手動掃描紙質(zhì)文檔是歸檔賬單、發(fā)票和財務(wù)報表的比較好的方式。然而,工作人員需要花較多的時間和精力來整理這些數(shù)字文件夾。并且,隨著數(shù)字文檔的增多,即使整理歸檔的人具有很好的記憶力和習(xí)慣,也容易出現(xiàn)差錯。
LEADTOOLS Forms Recognition and Processing
LEADTOOLS Forms Recognition and Processing擁有強大而靈活的圖像庫。通過LEADTOOLS構(gòu)建出的應(yīng)用程序可以自動對比掃描文檔與已知模板,然后準(zhǔn)確地對掃描文檔進行歸類。當(dāng)文檔被準(zhǔn)確識別后,LEADTOOLS可以從表單上所定義的位置提取OCR、OMR和Barcodes等。
處理文檔庫
解決文檔歸類問題的首要步驟就是處理和管理所有掃描文檔歸類時所存放的文檔庫。處理文檔庫的方法很多,本示例選擇使用控制臺應(yīng)用程序來處理文檔庫。管理文檔庫的代碼比較簡單,因為它主要使用基本文件和帶有命名空間的文件夾操作。而最關(guān)鍵的部分就是將應(yīng)用程序傳遞到封裝了LEADTOOLS Forms Recognition的DocumentClassifier,從而返回移動的數(shù)據(jù)并重命名文件。
使用LEADTOOLS表單識別功能
在LEADTOOLS歸類文檔前,必須創(chuàng)建一個Master Form模板集,使LEADTOOLS知道如何對文檔進行分類。LEADTOOLS自帶一個Master Form編輯器演示,我們根據(jù)演示為包含了發(fā)票日期字段的兩張不同發(fā)票添加一個Master Form。
準(zhǔn)備處理文檔
我們已經(jīng)掃描了2張基于Master Form的發(fā)票和tax form,將每個文件放置到"New"中,LEADTOOLS會自動對比主模板。如果LEADTOOLS找到匹配文件,它會處理文檔的字段,然后返回表單名稱和日期字段。
以上是關(guān)于LEADTOOLS表單識別教程的內(nèi)容介紹。LEADTOOLS的強大功能可以幫助企業(yè)實現(xiàn)自動歸檔和掃描文件的效率提升,節(jié)省人力成本和時間。通過合理利用LEADTOOLS的特性,企業(yè)可以更好地管理和處理大量的掃描文檔,并避免錯誤和遺漏。