python如何進行數(shù)據(jù)分析 想做數(shù)據(jù)分析是學python還是學大數(shù)據(jù)?
想做數(shù)據(jù)分析是學python還是學大數(shù)據(jù)?大數(shù)據(jù)結(jié)構中的很多組件都是用Java語言編寫的,還有一些是用Scala編寫的,比如Hadoop中的HDFS、MapReduce、yarn、ZK、HBase、h
想做數(shù)據(jù)分析是學python還是學大數(shù)據(jù)?
大數(shù)據(jù)結(jié)構中的很多組件都是用Java語言編寫的,還有一些是用Scala編寫的,比如Hadoop中的HDFS、MapReduce、yarn、ZK、HBase、hive、spark等。這些東西更傾向于數(shù)據(jù)工程、數(shù)據(jù)處理和計算。Python語言,包括pandas、numpy、SciPy等數(shù)據(jù)分析擴展包,通過學習使用這些包,可以充分掌握數(shù)據(jù)分析的能力。因此,要學習數(shù)據(jù)分析,建議學習Python而不是大數(shù)據(jù)。
會用Excel,真的需要再學Python嗎?
雖然這種方法可以快速生成結(jié)果,而且效率很高,但因為它使用了設計良好的組件,所以您基本上可以遵循規(guī)則。遇到問題時,不能向下推組件并重建它們。您只能更換其他組件或更改組合方法;
并且不能使用大量數(shù)據(jù),因為Excel的邏輯關系太弱,就像積木一樣,處理萬級數(shù)據(jù)有點困難,就像倒塌一樣,所以Excel不能用來建造高層建筑。畢竟,世界上沒有高樓是用積木建造的。
從數(shù)據(jù)分析的角度看,Excel的可視化效果較差,數(shù)據(jù)采集無法與Python相比。這不是Excel的特長,但是Excel在數(shù)理統(tǒng)計方面的表現(xiàn)還是很好的
所以當數(shù)據(jù)量比較小的時候,你想快速得到結(jié)果,而且邏輯關系簡單,Excel很香
!缺點是您需要能夠做任何事情。你需要能夠建造墻壁,建造和繪制圖紙。自然比excel難學
從效率上講,處理簡單的問題肯定比excel差,但面對復雜的問題,Python的優(yōu)勢可以凸顯
有了這堆原材料,你不僅可以建造高樓,還可以建造飛機,船和火箭頭,所以人們說,Python是一種通用語言,它可以做任何事情,除了生孩子
另一點是,Python是開源的,至少比matlab(深執(zhí)迷)好得多
從數(shù)據(jù)分析的角度來看,Python絕對比excel、數(shù)據(jù)采集,數(shù)據(jù)處理和數(shù)據(jù)分析、可視化都比excel好,當然這只是用于數(shù)據(jù)分析
當數(shù)據(jù)量大、邏輯關系復雜時,Python是最佳的解決方案
PS:
當然VBA是另一點。其實,我覺得VBA的學習難度和python沒有太大區(qū)別,但是使用起來太難了。讓我們看看個人的具體需求。這里我不詳細說明具體的區(qū)別