python 文件讀寫(xiě)操作教程 Python如何通過(guò)編程實(shí)現(xiàn)pdf文字轉(zhuǎn)word文檔?
Python如何通過(guò)編程實(shí)現(xiàn)pdf文字轉(zhuǎn)word文檔?有沒(méi)有相關(guān)的代碼可以參考?這個(gè)不難。主要使用兩個(gè)庫(kù),一個(gè)是pdfminer3k,一個(gè)是python-docx,其中pdfminer3k用于解析pd
Python如何通過(guò)編程實(shí)現(xiàn)pdf文字轉(zhuǎn)word文檔?
有沒(méi)有相關(guān)的代碼可以參考?
這個(gè)不難。主要使用兩個(gè)庫(kù),一個(gè)是pdfminer3k,一個(gè)是python-docx,其中pdfminer3k用于解析pdf提取文本內(nèi)容,python-docx用于將解析后的文本內(nèi)容寫(xiě)入word文檔。我簡(jiǎn)單介紹一下實(shí)現(xiàn)過(guò)程,實(shí)驗(yàn)環(huán)境是win10 python3.6 pycharm5.0,主要內(nèi)容如下:
這里,為了方便說(shuō)明問(wèn)題,我新建了一個(gè)test.pdf文件,測(cè)試內(nèi)容如下,下面圍繞這個(gè)文件進(jìn)行分析:
1.首先,安裝pdfminer3k和python-docx,只需輸入命令 "pip安裝pdf miner 3k python-docx "在cmd窗口中,如下所示:
2.安裝成功后,我們就可以編寫(xiě)一個(gè)程序來(lái)實(shí)現(xiàn)將pdf文本轉(zhuǎn)換成word文檔的功能,主要分兩步。首先分析pdf文件,提取文本內(nèi)容,然后將文本內(nèi)容寫(xiě)入word文檔。主要代碼和截圖如下:
解析pdf文件的文本內(nèi)容,基本思路是創(chuàng)建一個(gè)pdf解析器,然后逐頁(yè)解析提取文本內(nèi)容。主要代碼如下:
寫(xiě)word文檔,這一步很簡(jiǎn)單,就是將上一步分離出來(lái)的文本內(nèi)容直接逐段添加到word文檔中,在這里可以設(shè)置字體大小。主要代碼如下:
單擊Run在當(dāng)前目錄中生成一個(gè)文檔。打開(kāi)這個(gè)word文檔,它是轉(zhuǎn)換后的內(nèi)容,如下所示:
至此,我們已經(jīng)完成了用python將pdf文本轉(zhuǎn)換成word文檔的功能??偟膩?lái)說(shuō),整個(gè)過(guò)程并不難,主要分兩步。首先使用pdfminer3k解析pdf文件并提取文本內(nèi)容,然后使用python-docx將提取的文本內(nèi)容寫(xiě)入word文檔。只要有一定的python基礎(chǔ),熟悉相關(guān)的代碼和例子,多調(diào)試幾遍代碼,很快就能掌握。網(wǎng)上也有相關(guān)教程和資料。有興趣的可以搜一下,希望能分享到上面。
網(wǎng)上已經(jīng)有這樣的程序是免費(fèi)的了,沒(méi)必要再開(kāi)發(fā)了。
由相應(yīng)的程序員編程。
python自學(xué)難度有多大,怎樣算出師?
自學(xué)Python也不是不可以,但是要注意以下三點(diǎn):
第一:從Web開(kāi)發(fā)開(kāi)始學(xué)起。雖然目前Python在大數(shù)據(jù)和人工智能領(lǐng)域應(yīng)用廣泛,但是大數(shù)據(jù)開(kāi)發(fā)還處于應(yīng)用的初級(jí)階段,大量的開(kāi)發(fā)任務(wù)還沒(méi)有在市場(chǎng)上發(fā)布。目前大量的開(kāi)發(fā)還是基于Web開(kāi)發(fā),所以從就業(yè)的角度來(lái)說(shuō),應(yīng)該從Web開(kāi)發(fā)入手。同時(shí),網(wǎng)頁(yè)開(kāi)發(fā)中涉及的內(nèi)容容量比較大,從Web開(kāi)發(fā)進(jìn)入其他領(lǐng)域相對(duì)容易。
第二:學(xué)習(xí)數(shù)據(jù)分析技術(shù)。Python目前廣泛應(yīng)用于數(shù)據(jù)分析領(lǐng)域,未來(lái)數(shù)據(jù)分析將有廣闊的發(fā)展空間,大量相關(guān)工作崗位將陸續(xù)在傳統(tǒng)行業(yè)釋放。從這個(gè)角度來(lái)說(shuō),掌握一定的數(shù)據(jù)分析技術(shù),顯然會(huì)提升就業(yè)競(jìng)爭(zhēng)力。
學(xué)習(xí)數(shù)據(jù)分析技術(shù)可以從機(jī)器學(xué)習(xí)開(kāi)始,需要學(xué)習(xí)一些常用的機(jī)器學(xué)習(xí)算法,比如決策樹(shù)、支持向量機(jī)、樸素貝葉斯等等。核心關(guān)鍵:python實(shí)戰(zhàn)是檢驗(yàn)學(xué)習(xí)效果的唯一標(biāo)準(zhǔn),你可以 不要懶惰。如果缺少最新的python實(shí)戰(zhàn)教程,可以去我們的python直播技術(shù)紐扣裙:855-408-893。
* *第三:注重實(shí)踐。學(xué)習(xí)編程語(yǔ)言一定要注重實(shí)踐環(huán)節(jié),學(xué)習(xí)Python也是如此。Python s實(shí)驗(yàn)環(huán)節(jié)相對(duì)容易搭建,對(duì)于新手來(lái)說(shuō)非常有利,也會(huì)讓新手快速上手。學(xué)完基礎(chǔ)語(yǔ)法后,如果能去項(xiàng)目實(shí)習(xí)是個(gè)不錯(cuò)的選擇。