python 文件讀寫操作教程 Python如何通過編程實(shí)現(xiàn)pdf文字轉(zhuǎn)word文檔?
Python如何通過編程實(shí)現(xiàn)pdf文字轉(zhuǎn)word文檔?有沒有相關(guān)的代碼可以參考?這個不難。主要使用兩個庫,一個是pdfminer3k,一個是python-docx,其中pdfminer3k用于解析pd
Python如何通過編程實(shí)現(xiàn)pdf文字轉(zhuǎn)word文檔?
有沒有相關(guān)的代碼可以參考?
這個不難。主要使用兩個庫,一個是pdfminer3k,一個是python-docx,其中pdfminer3k用于解析pdf提取文本內(nèi)容,python-docx用于將解析后的文本內(nèi)容寫入word文檔。我簡單介紹一下實(shí)現(xiàn)過程,實(shí)驗環(huán)境是win10 python3.6 pycharm5.0,主要內(nèi)容如下:
這里,為了方便說明問題,我新建了一個test.pdf文件,測試內(nèi)容如下,下面圍繞這個文件進(jìn)行分析:
1.首先,安裝pdfminer3k和python-docx,只需輸入命令 "pip安裝pdf miner 3k python-docx "在cmd窗口中,如下所示:
2.安裝成功后,我們就可以編寫一個程序來實(shí)現(xiàn)將pdf文本轉(zhuǎn)換成word文檔的功能,主要分兩步。首先分析pdf文件,提取文本內(nèi)容,然后將文本內(nèi)容寫入word文檔。主要代碼和截圖如下:
解析pdf文件的文本內(nèi)容,基本思路是創(chuàng)建一個pdf解析器,然后逐頁解析提取文本內(nèi)容。主要代碼如下:
寫word文檔,這一步很簡單,就是將上一步分離出來的文本內(nèi)容直接逐段添加到word文檔中,在這里可以設(shè)置字體大小。主要代碼如下:
單擊Run在當(dāng)前目錄中生成一個文檔。打開這個word文檔,它是轉(zhuǎn)換后的內(nèi)容,如下所示:
至此,我們已經(jīng)完成了用python將pdf文本轉(zhuǎn)換成word文檔的功能。總的來說,整個過程并不難,主要分兩步。首先使用pdfminer3k解析pdf文件并提取文本內(nèi)容,然后使用python-docx將提取的文本內(nèi)容寫入word文檔。只要有一定的python基礎(chǔ),熟悉相關(guān)的代碼和例子,多調(diào)試幾遍代碼,很快就能掌握。網(wǎng)上也有相關(guān)教程和資料。有興趣的可以搜一下,希望能分享到上面。
網(wǎng)上已經(jīng)有這樣的程序是免費(fèi)的了,沒必要再開發(fā)了。
由相應(yīng)的程序員編程。
python自學(xué)難度有多大,怎樣算出師?
自學(xué)Python也不是不可以,但是要注意以下三點(diǎn):
第一:從Web開發(fā)開始學(xué)起。雖然目前Python在大數(shù)據(jù)和人工智能領(lǐng)域應(yīng)用廣泛,但是大數(shù)據(jù)開發(fā)還處于應(yīng)用的初級階段,大量的開發(fā)任務(wù)還沒有在市場上發(fā)布。目前大量的開發(fā)還是基于Web開發(fā),所以從就業(yè)的角度來說,應(yīng)該從Web開發(fā)入手。同時,網(wǎng)頁開發(fā)中涉及的內(nèi)容容量比較大,從Web開發(fā)進(jìn)入其他領(lǐng)域相對容易。
第二:學(xué)習(xí)數(shù)據(jù)分析技術(shù)。Python目前廣泛應(yīng)用于數(shù)據(jù)分析領(lǐng)域,未來數(shù)據(jù)分析將有廣闊的發(fā)展空間,大量相關(guān)工作崗位將陸續(xù)在傳統(tǒng)行業(yè)釋放。從這個角度來說,掌握一定的數(shù)據(jù)分析技術(shù),顯然會提升就業(yè)競爭力。
學(xué)習(xí)數(shù)據(jù)分析技術(shù)可以從機(jī)器學(xué)習(xí)開始,需要學(xué)習(xí)一些常用的機(jī)器學(xué)習(xí)算法,比如決策樹、支持向量機(jī)、樸素貝葉斯等等。核心關(guān)鍵:python實(shí)戰(zhàn)是檢驗學(xué)習(xí)效果的唯一標(biāo)準(zhǔn),你可以 不要懶惰。如果缺少最新的python實(shí)戰(zhàn)教程,可以去我們的python直播技術(shù)紐扣裙:855-408-893。
* *第三:注重實(shí)踐。學(xué)習(xí)編程語言一定要注重實(shí)踐環(huán)節(jié),學(xué)習(xí)Python也是如此。Python s實(shí)驗環(huán)節(jié)相對容易搭建,對于新手來說非常有利,也會讓新手快速上手。學(xué)完基礎(chǔ)語法后,如果能去項目實(shí)習(xí)是個不錯的選擇。