如何使用Python提取mdx/mdd文件中的數(shù)據(jù)
mdx/mdd是供MDict、GoldenDict等加載使用的詞庫,有時候我們想要自己動手排版,這就需要解壓mdx/mdd,提取其中的文字、圖片、音頻等數(shù)據(jù)。在這種情況下,我們可以利用Python腳本
mdx/mdd是供MDict、GoldenDict等加載使用的詞庫,有時候我們想要自己動手排版,這就需要解壓mdx/mdd,提取其中的文字、圖片、音頻等數(shù)據(jù)。在這種情況下,我們可以利用Python腳本來處理。
步驟一:安裝Python 2.7
首先,請自行完成Python 2.7的安裝。安裝完成后,開始菜單應該能找到IDLE(Python GUI)。
步驟二:下載所需的Python腳本
下載以下3個Python腳本文件:、和。你可以從以下地址下載:
步驟三:打開并運行
在IDLE中,點擊"File" -> "Open",然后打開文件。接著點擊"Run" -> "Run Module",會彈出一個"Open"窗口。
步驟四:選擇要提取的mdx或mdd文件
在彈出的"Open"窗口中,選擇要提取的mdx或mdd文件。例如,選擇并點擊"Open"。稍等片刻,提取過程就會完成。
在mdx文件所在的目錄下,你會看到test.txt和data文件夾。其中,data文件夾完美呈現(xiàn)了原有的目錄結(jié)構,這是使用GetDict2.6.exe解壓mdd無法實現(xiàn)的。
當然,你也可以在當前目錄下使用命令行操作python -x ,效果是一樣的。