軟件開發(fā)需要學什么 想做數(shù)據(jù)分析是學python還是學大數(shù)據(jù)?
想做數(shù)據(jù)分析是學python還是學大數(shù)據(jù)?大數(shù)據(jù)結(jié)構(gòu)中的很多組件都是用Java語言編寫的,還有一些是用Scala編寫的,比如Hadoop中的HDFS、MapReduce、yarn、ZK、HBase、h
想做數(shù)據(jù)分析是學python還是學大數(shù)據(jù)?
大數(shù)據(jù)結(jié)構(gòu)中的很多組件都是用Java語言編寫的,還有一些是用Scala編寫的,比如Hadoop中的HDFS、MapReduce、yarn、ZK、HBase、hive、spark等。這些東西更傾向于數(shù)據(jù)工程、數(shù)據(jù)處理和計算。Python語言,包括pandas、numpy、SciPy等數(shù)據(jù)分析擴展包,通過學習使用這些包,可以充分掌握數(shù)據(jù)分析的能力。因此,要學習數(shù)據(jù)分析,建議學習Python而不是大數(shù)據(jù)。
操控excel,選擇Python還是vba?
對于大量數(shù)據(jù),建議使用Python。VBA通常將數(shù)據(jù)存儲在內(nèi)存中。當數(shù)據(jù)沒有分割,計算機配置不高時,會出現(xiàn)更多的卡。經(jīng)過數(shù)據(jù)處理后,如果內(nèi)存沒有釋放,電腦也會多卡。VBA一般啟動兩個CPU核進行數(shù)據(jù)計算,運算效率較低?,F(xiàn)在微軟已經(jīng)停止更新VBA了,更建議大家學習python。如果只操作excel,兩種學習難度相差不大,但是Python的開發(fā)空間會更好
另一種更方便的方法是使用power Bi的三個組件進行數(shù)據(jù)處理,power query進行數(shù)據(jù)處理,PowerPivot進行分析,power Bi進行數(shù)據(jù)處理的優(yōu)點數(shù)據(jù)可視化的主要觀點是學習周期短,數(shù)據(jù)可以自動刷新,啟動時間相對較快。使用這種方法,效率可能比excel快,但速度仍然不如python快。當然,為了長期的可持續(xù)性,建議大家學習python,但起步時間會比較長