pandas讀取csv實(shí)例 怎么調(diào)用pandas讀取csv文件?
怎么調(diào)用pandas讀取csv文件?介紹panda并使用panda下的readucsv方法,讀取CSV文件,參數(shù)是文件的路徑,它是一個(gè)相對路徑,是相對于當(dāng)前工作目錄的,那么如何知道當(dāng)前工作目錄呢?使用
怎么調(diào)用pandas讀取csv文件?
介紹panda并使用panda下的readucsv方法,讀取CSV文件,參數(shù)是文件的路徑,它是一個(gè)相對路徑,是相對于當(dāng)前工作目錄的,那么如何知道當(dāng)前工作目錄呢?使用操作系統(tǒng)getcwd()方法在讀取前三個(gè)工作目錄后,獲取當(dāng)前工作目錄的數(shù)據(jù),檢查讀取是否正確,是否有明顯的亂碼,是什么問題?我們需要設(shè)置參數(shù)編碼,即編碼方法。如果不設(shè)置編碼方法,則默認(rèn)值為utf8。現(xiàn)在CSV文件是GBK編碼的,所以我們需要使用encoding=“GBK”我的編輯器是eric4。請注意,eric4默認(rèn)情況下不支持中文。如果要顯示中文,前提是要設(shè)置正確的編碼,并在參數(shù)設(shè)置中將其設(shè)置為utf8返回panda,我們可以在打開數(shù)據(jù)時(shí)有更多的選項(xiàng)來設(shè)置操作
對于大量的數(shù)據(jù)更推薦Python。VBA通常將數(shù)據(jù)存儲在內(nèi)存中。當(dāng)數(shù)據(jù)沒有分割,計(jì)算機(jī)配置不高時(shí),會出現(xiàn)更多的卡。經(jīng)過數(shù)據(jù)處理后,如果內(nèi)存沒有釋放,電腦也會多卡。VBA一般啟動兩個(gè)CPU核進(jìn)行數(shù)據(jù)計(jì)算,運(yùn)算效率較低。現(xiàn)在微軟已經(jīng)停止更新VBA了,更建議大家學(xué)習(xí)python。如果只操作excel,兩種學(xué)習(xí)難度相差不大,但是Python的開發(fā)空間會更好
另一種更方便的方法是使用power Bi的三個(gè)組件進(jìn)行數(shù)據(jù)處理,power query進(jìn)行數(shù)據(jù)處理,PowerPivot進(jìn)行分析,power Bi進(jìn)行數(shù)據(jù)處理的優(yōu)點(diǎn)數(shù)據(jù)可視化的主要觀點(diǎn)是學(xué)習(xí)周期短,數(shù)據(jù)可以自動刷新,啟動時(shí)間相對較快。使用這種方法,效率可能比excel快,但速度仍然不如python快。當(dāng)然,為了長期的可持續(xù)性,建議大家學(xué)習(xí)python,但起步時(shí)間會比較長