python怎么用來處理數(shù)據(jù) 想做數(shù)據(jù)分析是學(xué)python還是學(xué)大數(shù)據(jù)?
想做數(shù)據(jù)分析是學(xué)python還是學(xué)大數(shù)據(jù)?大數(shù)據(jù)結(jié)構(gòu)中的很多組件都是用Java語言編寫的,還有一些是用Scala編寫的,比如Hadoop中的HDFS、MapReduce、yarn、ZK、HBase、h
想做數(shù)據(jù)分析是學(xué)python還是學(xué)大數(shù)據(jù)?
大數(shù)據(jù)結(jié)構(gòu)中的很多組件都是用Java語言編寫的,還有一些是用Scala編寫的,比如Hadoop中的HDFS、MapReduce、yarn、ZK、HBase、hive、spark等。這些東西更傾向于數(shù)據(jù)工程、數(shù)據(jù)處理和計算。Python語言,包括pandas、numpy、SciPy等數(shù)據(jù)分析擴(kuò)展包,通過學(xué)習(xí)使用這些包,可以充分掌握數(shù)據(jù)分析的能力。因此,要學(xué)習(xí)數(shù)據(jù)分析,建議學(xué)習(xí)Python而不是大數(shù)據(jù)。
會用Excel,真的需要再學(xué)Python嗎?
雖然這種方法可以快速生成結(jié)果,而且效率很高,但因為它使用了設(shè)計良好的組件,所以您基本上可以遵循規(guī)則。遇到問題時,不能向下推組件并重建它們。您只能更換其他組件或更改組合方法;
并且不能使用大量數(shù)據(jù),因為Excel的邏輯關(guān)系太弱,就像積木一樣,處理萬級數(shù)據(jù)有點困難,就像倒塌一樣,所以Excel不能用來建造高層建筑。畢竟,世界上沒有高樓是用積木建造的。
從數(shù)據(jù)分析的角度看,Excel的可視化效果較差,數(shù)據(jù)采集無法與Python相比。這不是Excel的特長,但是Excel在數(shù)理統(tǒng)計方面的表現(xiàn)還是很好的
所以當(dāng)數(shù)據(jù)量比較小的時候,你想快速得到結(jié)果,而且邏輯關(guān)系簡單,Excel很香
!缺點是您需要能夠做任何事情。你需要能夠建造墻壁,建造和繪制圖紙。自然比excel難學(xué)
從效率上講,處理簡單的問題肯定比excel差,但面對復(fù)雜的問題,Python的優(yōu)勢可以凸顯
有了這堆原材料,你不僅可以建造高樓,還可以建造飛機(jī),船和火箭頭,所以人們說,Python是一種通用語言,它可以做任何事情,除了生孩子
另一點是,Python是開源的,至少比matlab(深執(zhí)迷)好得多
從數(shù)據(jù)分析的角度來看,Python絕對比excel、數(shù)據(jù)采集,數(shù)據(jù)處理和數(shù)據(jù)分析、可視化都比excel好,當(dāng)然這只是為了數(shù)據(jù)分析
當(dāng)數(shù)據(jù)量大、邏輯關(guān)系復(fù)雜時,Python是最佳的解決方案
]PS:
當(dāng)然VBA說的不是。其實,我覺得VBA的學(xué)習(xí)難度和python沒有太大區(qū)別,但是使用起來太難了。讓我們看看個人的具體需求。我不會在這里詳細(xì)說明具體的區(qū)別
答案是肯定的,肯定的。大專怎么了?不要限制自己。
如果你想去互聯(lián)網(wǎng)行業(yè),先把自己打包,因為互聯(lián)網(wǎng)還是很重視教育的;但是如果你想去傳統(tǒng)行業(yè)先做,也是一個好辦法。
你說你不能編程,所以完全可以。事實上,即使你會編程,你也不會在實際工作中使用它。很少有人真正使用Python進(jìn)行數(shù)據(jù)分析。他們可以對其進(jìn)行建模并在業(yè)務(wù)上加以利用。
為什么企業(yè)需要數(shù)據(jù)分析師?試想一個跨部門擁有海量數(shù)據(jù)的企業(yè),如何提取有效的數(shù)據(jù),并將數(shù)據(jù)轉(zhuǎn)化為清晰的圖表,呈現(xiàn)給管理者進(jìn)行決策?這是需要數(shù)據(jù)分析師的地方。
分析師玩數(shù)據(jù)庫,建立數(shù)據(jù)倉庫,使用Bi可視化工具獲取全局?jǐn)?shù)據(jù)視圖,分析過去的性能,了解當(dāng)前的問題并預(yù)測企業(yè)的未來發(fā)展,并將最終結(jié)果呈現(xiàn)給企業(yè)管理者以輔助決策。
分析師需要掌握哪些技能?
SQL非常重要,您的SQL查詢能力直接決定您能否得到一份工作,是的,得到一份工作。因為有不同的改進(jìn)方法,比如ETL開發(fā)、數(shù)據(jù)倉庫開發(fā)、報表等等,但是首先要通過這一行的門檻,那就是SQL。
DW(數(shù)據(jù)倉庫)提高了我們的查詢能力,確保了數(shù)據(jù)的安全性。數(shù)據(jù)倉庫中的數(shù)據(jù)可以根據(jù)需要排列成不同的模型。
以finebi為例,它不僅可以拖放形成圖表,還可以連接各種數(shù)據(jù)源,進(jìn)行數(shù)據(jù)轉(zhuǎn)換、清洗、建模、發(fā)布和共享。!EXCEL其實是很好做的基礎(chǔ),特別是對于金融公司來說。