pythondocx 使用教程 python-docx為什么不支持doc格式?
python-docx為什么不支持doc格式?Docx是一種開放格式。它本質(zhì)上是一個(gè)zip文件,可以用解壓軟件把它解壓到一個(gè)目錄中,包括幾個(gè)目錄,內(nèi)置圖片,所有的東西都在相應(yīng)的目錄中。文本的內(nèi)容存儲在
python-docx為什么不支持doc格式?
Docx是一種開放格式。它本質(zhì)上是一個(gè)zip文件,可以用解壓軟件把它解壓到一個(gè)目錄中,包括幾個(gè)目錄,內(nèi)置圖片,所有的東西都在相應(yīng)的目錄中。文本的內(nèi)容存儲在XML中,因此用Python解析它相對容易。
Doc是早期生成的文件,已關(guān)閉。一般來說,類似的軟件如OpenOffice或WPS會對格式進(jìn)行解碼和支持,但不能保證完全支持。這比docx困難得多。
對于該庫的開發(fā)人員,我認(rèn)為他沒有心思或需要做這樣的事情。
如果需要讀取doc文件,可以使用win32com模塊將doc轉(zhuǎn)換為docx,然后使用python_uux讀取內(nèi)容。
python易于上手,你都用python做什么?
對于非程序員:1。輔助工作,如處理excel、基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)、批量處理一些常規(guī)的文件操作等。信息獲取,如去網(wǎng)站批量獲取數(shù)據(jù),去系統(tǒng)批量獲取查詢結(jié)果。
3. 數(shù)據(jù)分析,數(shù)據(jù)分析,可視化顯示等
程序員:
1。制作網(wǎng)站和系統(tǒng),例如豆瓣
2. 數(shù)據(jù)挖掘,輿情分析等
3。人工智能建模等