大數(shù)據(jù) excel中,如何處理數(shù)據(jù)比較好?
excel中,如何處理數(shù)據(jù)比較好?這個(gè)問(wèn)題相當(dāng)廣泛,不容易回答。但我個(gè)人經(jīng)驗(yàn)總結(jié)如下數(shù)據(jù)處理不好,希望避免。1. 在表格中,請(qǐng)記住盡量少用合并單元格,因?yàn)樘幚磉^(guò)濾、函數(shù)公式等非常麻煩。輸入時(shí)間時(shí)不要輸
excel中,如何處理數(shù)據(jù)比較好?
這個(gè)問(wèn)題相當(dāng)廣泛,不容易回答。但我個(gè)人經(jīng)驗(yàn)總結(jié)如下數(shù)據(jù)處理不好,希望避免。
1. 在表格中,請(qǐng)記住盡量少用合并單元格,因?yàn)樘幚磉^(guò)濾、函數(shù)公式等非常麻煩。輸入時(shí)間時(shí)不要輸入2018.4.8。不是時(shí)間格式,-/兩者都可以。
對(duì)換行符使用ALT-enter,而不是空格。
4. 不能在單元格前后加空格字符,否則公式無(wú)法計(jì)算,看不見(jiàn)。
不學(xué)網(wǎng)絡(luò)爬蟲(chóng),用Excel抓取數(shù)據(jù),可以嗎?
當(dāng)然可以,但是使用起來(lái)不是很靈活。沒(méi)有像Python這樣的語(yǔ)言來(lái)捕獲數(shù)據(jù)以便于處理。下面我介紹一下用Excel采集數(shù)據(jù)的過(guò)程,實(shí)驗(yàn)環(huán)境win7office2013,主要內(nèi)容如下:
1。創(chuàng)建一個(gè)新的EXCEL文件,雙擊打開(kāi)該文件,然后選擇“數(shù)據(jù)”->“來(lái)自網(wǎng)絡(luò)”,如下所示:
2。在彈出子窗口中輸入要抓取的頁(yè)面,在此處抓取http://www.pm25.in/rank以頁(yè)面數(shù)據(jù)為例,分別點(diǎn)擊“go”—>“import”,如下所示:
3。導(dǎo)入成功后,數(shù)據(jù)如下:如果要定期刷新數(shù)據(jù),可以點(diǎn)擊“全部刷新”->“連接屬性”自定義刷新頻率。默認(rèn)值為60分鐘:
在彈出的“選擇屬性”窗口中,設(shè)計(jì)刷新頻率并定期刷新數(shù)據(jù):
到目前為止,我們已經(jīng)完成使用Excel抓取數(shù)據(jù)。一般來(lái)說(shuō),整個(gè)過(guò)程很簡(jiǎn)單,但是靈活性不是很高,如果頁(yè)面比較復(fù)雜,捕獲的數(shù)據(jù)量也比較多,后期直接在Excel中處理也不是很方便,問(wèn)題的主人已經(jīng)懂python了,所以建議用python直接捕獲,這是很好的更靈活。Python提供了很多爬蟲(chóng)包和框架,比如requests、BS4、lxml、scrapy等,可以快速抓取數(shù)據(jù),也方便后期處理(比如panda、numpy等),學(xué)習(xí)一下吧,你可以很快開(kāi)始,網(wǎng)上有相關(guān)的資料和教程,希望上面的分享內(nèi)容能對(duì)你有所幫助。輸入函數(shù)在表1中,即=VLOOKUP(A2,表2!$A$2:$B$5、2、0)。根據(jù)表1的ID號(hào),查表2,ID號(hào)對(duì)應(yīng)的內(nèi)容。VLOOKUP]
用EXCLE做人資表,表一和表二都有身份證號(hào)碼,怎樣可以把表二內(nèi)容聯(lián)庫(kù)到表一?
標(biāo)題繼續(xù)學(xué)習(xí)。