卖逼视频免费看片|狼人就干网中文字慕|成人av影院导航|人妻少妇精品无码专区二区妖婧|亚洲丝袜视频玖玖|一区二区免费中文|日本高清无码一区|国产91无码小说|国产黄片子视频91sese日韩|免费高清无码成人网站入口

如何提高掃描儀識(shí)別圖片內(nèi)的文字

掃描儀不僅僅可以復(fù)制圖像,結(jié)合OCR軟件使用,工作會(huì)變得更加輕松。以下是我在掃描OCR中總結(jié)出來(lái)的一些經(jīng)驗(yàn),希望對(duì)你有所幫助。 1. 準(zhǔn)備原稿 為了獲得最高的識(shí)別率,原稿必須平整,沒(méi)有皺紋,并且沒(méi)

掃描儀不僅僅可以復(fù)制圖像,結(jié)合OCR軟件使用,工作會(huì)變得更加輕松。以下是我在掃描OCR中總結(jié)出來(lái)的一些經(jīng)驗(yàn),希望對(duì)你有所幫助。

1. 準(zhǔn)備原稿

為了獲得最高的識(shí)別率,原稿必須平整,沒(méi)有皺紋,并且沒(méi)有污漬。當(dāng)放置在玻璃板上時(shí),邊緣要與玻璃板平行,不能歪斜。同時(shí),保持玻璃板的清潔,避免雜物進(jìn)入。

2. 選擇合適的軟件

選擇一款優(yōu)秀的OCR軟件非常重要,例如云脈文檔識(shí)別軟件。通常不建議使用掃描儀自帶的OEM軟件,因?yàn)樗鼈児δ苡邢?,效果差,甚至可能沒(méi)有中文識(shí)別功能。經(jīng)過(guò)比較,我選擇了清華TH-OCR MF7.50專業(yè)版文本自動(dòng)識(shí)別輸入系統(tǒng)。此外,還需要選擇一個(gè)圖像處理軟件,如Photoshop。因?yàn)橛行㎡CR軟件并不能兼容所有的掃描儀,利用圖像軟件的掃描接口可以更方便地處理圖像。

3. 設(shè)置掃描參數(shù)

對(duì)于用于OCR的圖像,我的經(jīng)驗(yàn)是:選擇黑白模式,高質(zhì)量的掃描模式,300DPI的分辨率,100%的縮放比例,根據(jù)原稿選擇適當(dāng)?shù)臑V鏡。

4. 選取掃描區(qū)域

在設(shè)置好參數(shù)后,先進(jìn)行預(yù)覽,然后開始選取掃描區(qū)域。不要將所有要使用的文章都選在一個(gè)區(qū)域內(nèi),因?yàn)楝F(xiàn)在的文章排版通常采用圖文混排,將其作為一幅圖像掃描會(huì)影響OCR識(shí)別。根據(jù)實(shí)際情況將版面劃分為多個(gè)區(qū)域,每個(gè)區(qū)域內(nèi)文字的字體、字號(hào)最好一致,沒(méi)有圖形或圖片,每行的寬度也保持一致。如果行長(zhǎng)不一致,可以再次細(xì)分。一次最多掃描10個(gè)選取區(qū)域。雖然這個(gè)過(guò)程有些繁瑣,但是可以提高識(shí)別率。

5. 存儲(chǔ)圖像

掃描出來(lái)的圖像可以以TIF格式進(jìn)行存儲(chǔ)。

6. OCR軟件操作

打開已掃描好的圖像文件,將圖像旋轉(zhuǎn)至橫排正文。然后進(jìn)行圖像傾斜校正和版面分析。在版面分析后,將非橫排正文的區(qū)塊設(shè)置為橫排正文,并對(duì)各個(gè)區(qū)塊進(jìn)行傾斜校正。最后進(jìn)行識(shí)別工作。

7. 編輯

識(shí)別后會(huì)出現(xiàn)編輯窗口,在此時(shí)打開漢字輸入法。不必理會(huì)識(shí)別系統(tǒng)對(duì)可疑字的相似字提示,直接根據(jù)修改參照行(也稱為浮動(dòng)跟蹤窗口)進(jìn)行修改。完成修改后,OCR工作也就結(jié)束了。

8. 字體的影響

經(jīng)過(guò)多次OCR工作,我發(fā)現(xiàn)軟件對(duì)于不同字體的識(shí)別效果會(huì)有所不同。其中楷體的識(shí)別效果最好,仿宋和宋體次之,而圓體(特別是細(xì)圓體)的識(shí)別效果最差。

9. 掃描報(bào)紙的注意事項(xiàng)

由于報(bào)紙比較薄,且大部分紙質(zhì)不高,掃描儀上的蓋板無(wú)法完全壓住報(bào)紙,導(dǎo)致有縫隙。因此,一般情況下,報(bào)紙的掃描識(shí)別效果不如雜志。解決辦法是在報(bào)紙上放置一至兩本16K雜志,這樣可以改善掃描識(shí)別效果。

標(biāo)簽: