卖逼视频免费看片|狼人就干网中文字慕|成人av影院导航|人妻少妇精品无码专区二区妖婧|亚洲丝袜视频玖玖|一区二区免费中文|日本高清无码一区|国产91无码小说|国产黄片子视频91sese日韩|免费高清无码成人网站入口

如何提高掃描儀識別圖片內(nèi)的文字

掃描儀不僅僅可以復制圖像,結(jié)合OCR軟件使用,工作會變得更加輕松。以下是我在掃描OCR中總結(jié)出來的一些經(jīng)驗,希望對你有所幫助。 1. 準備原稿 為了獲得最高的識別率,原稿必須平整,沒有皺紋,并且沒

掃描儀不僅僅可以復制圖像,結(jié)合OCR軟件使用,工作會變得更加輕松。以下是我在掃描OCR中總結(jié)出來的一些經(jīng)驗,希望對你有所幫助。

1. 準備原稿

為了獲得最高的識別率,原稿必須平整,沒有皺紋,并且沒有污漬。當放置在玻璃板上時,邊緣要與玻璃板平行,不能歪斜。同時,保持玻璃板的清潔,避免雜物進入。

2. 選擇合適的軟件

選擇一款優(yōu)秀的OCR軟件非常重要,例如云脈文檔識別軟件。通常不建議使用掃描儀自帶的OEM軟件,因為它們功能有限,效果差,甚至可能沒有中文識別功能。經(jīng)過比較,我選擇了清華TH-OCR MF7.50專業(yè)版文本自動識別輸入系統(tǒng)。此外,還需要選擇一個圖像處理軟件,如Photoshop。因為有些OCR軟件并不能兼容所有的掃描儀,利用圖像軟件的掃描接口可以更方便地處理圖像。

3. 設置掃描參數(shù)

對于用于OCR的圖像,我的經(jīng)驗是:選擇黑白模式,高質(zhì)量的掃描模式,300DPI的分辨率,100%的縮放比例,根據(jù)原稿選擇適當?shù)臑V鏡。

4. 選取掃描區(qū)域

在設置好參數(shù)后,先進行預覽,然后開始選取掃描區(qū)域。不要將所有要使用的文章都選在一個區(qū)域內(nèi),因為現(xiàn)在的文章排版通常采用圖文混排,將其作為一幅圖像掃描會影響OCR識別。根據(jù)實際情況將版面劃分為多個區(qū)域,每個區(qū)域內(nèi)文字的字體、字號最好一致,沒有圖形或圖片,每行的寬度也保持一致。如果行長不一致,可以再次細分。一次最多掃描10個選取區(qū)域。雖然這個過程有些繁瑣,但是可以提高識別率。

5. 存儲圖像

掃描出來的圖像可以以TIF格式進行存儲。

6. OCR軟件操作

打開已掃描好的圖像文件,將圖像旋轉(zhuǎn)至橫排正文。然后進行圖像傾斜校正和版面分析。在版面分析后,將非橫排正文的區(qū)塊設置為橫排正文,并對各個區(qū)塊進行傾斜校正。最后進行識別工作。

7. 編輯

識別后會出現(xiàn)編輯窗口,在此時打開漢字輸入法。不必理會識別系統(tǒng)對可疑字的相似字提示,直接根據(jù)修改參照行(也稱為浮動跟蹤窗口)進行修改。完成修改后,OCR工作也就結(jié)束了。

8. 字體的影響

經(jīng)過多次OCR工作,我發(fā)現(xiàn)軟件對于不同字體的識別效果會有所不同。其中楷體的識別效果最好,仿宋和宋體次之,而圓體(特別是細圓體)的識別效果最差。

9. 掃描報紙的注意事項

由于報紙比較薄,且大部分紙質(zhì)不高,掃描儀上的蓋板無法完全壓住報紙,導致有縫隙。因此,一般情況下,報紙的掃描識別效果不如雜志。解決辦法是在報紙上放置一至兩本16K雜志,這樣可以改善掃描識別效果。

標簽: