java獲取word文檔內(nèi)容 java用POI第三方API操作word的時(shí)候,讀取最終狀態(tài)?
java用POI第三方API操作word的時(shí)候,讀取最終狀態(tài)?Java閱讀word文檔時(shí),雖然互聯(lián)網(wǎng)上引入了POI、java2word、Jacob、iText等很多插件,但POI看不懂格式(新的API
java用POI第三方API操作word的時(shí)候,讀取最終狀態(tài)?
Java閱讀word文檔時(shí),雖然互聯(lián)網(wǎng)上引入了POI、java2word、Jacob、iText等很多插件,但POI看不懂格式(新的API估算行似乎還處于研發(fā)階段,不穩(wěn)定,做項(xiàng)目時(shí)不敢用);java2word和Jacob很容易上報(bào)錯(cuò)誤并且找不到注冊(cè),這很奇怪。我在不同的機(jī)器上試過,操作方法完全一致,有的不是機(jī)器不報(bào)錯(cuò),有的報(bào)錯(cuò),你去他們論壇找資深人士解決的時(shí)候也說不清原因。在項(xiàng)目部署中使用它有點(diǎn)神秘。它的文字寫起來似乎很方便,但我查了很長(zhǎng)時(shí)間的資料后,還沒有找到一個(gè)好的閱讀方法。經(jīng)過一番選擇,RTF是最好的選擇。畢竟,RTF是一種開源格式。它不需要任何插件。它只需要基本的IO操作和編碼轉(zhuǎn)換。表面上看,RTF格式的文件和doc沒有什么不同。它們可以在word中打開,并且可以設(shè)置各種格式。
用Java怎么把Word轉(zhuǎn)PDF不使用插件?
幾種解決方案:方法一:用Apache PIO讀取doc文件,然后轉(zhuǎn)換成HTML文件,用jsup格式化HTML文件,最后用iText將HTML文件轉(zhuǎn)換成PDF文件。方法二:使用jdoctopdf來實(shí)現(xiàn),這是一個(gè)打包的包,可以將doc轉(zhuǎn)換成PDF、HTML、XML格式,調(diào)用非常方便地址:安裝后啟動(dòng)OpenOffice服務(wù),具體啟動(dòng)方法請(qǐng)Google自己方法四:最好的方法,但是需要窗口環(huán)境,而且速度最慢需要安裝