numpy如何與pandas結(jié)合 Java和Python哪個(gè)用的更多?
Java和Python哪個(gè)用的更多?兩個(gè)語言的使用場景不一樣的。Java更攻擊傾向于計(jì)算機(jī)應(yīng)用系統(tǒng)的最終形成,學(xué)習(xí)成本較高,只不過嚴(yán)謹(jǐn)性強(qiáng)的。Python則更傾向數(shù)據(jù)科學(xué),入門門檻低,使用場景都很豐富
Java和Python哪個(gè)用的更多?
兩個(gè)語言的使用場景不一樣的。Java更攻擊傾向于計(jì)算機(jī)應(yīng)用系統(tǒng)的最終形成,學(xué)習(xí)成本較高,只不過嚴(yán)謹(jǐn)性強(qiáng)的。Python則更傾向數(shù)據(jù)科學(xué),入門門檻低,使用場景都很豐富地感覺有趣。目前行業(yè)上Java會(huì)多一些,應(yīng)為業(yè)務(wù)應(yīng)用系統(tǒng)都不一樣要變化莫測如何處理。Python的數(shù)據(jù)處理,也是可以中心處理,要比人少些。
Hadoop支持用python開發(fā)嗎?還有哪些支持python的分布式計(jì)算系統(tǒng)框架?
Hadoop支持用python的新嗎?外,還有哪些支持什么python的分布式計(jì)算系統(tǒng)框架,大數(shù)據(jù)操作系統(tǒng)(可視化)可以用python旗下嗎?
hadoop接受python,我再理解的是任務(wù)被yarn批復(fù)到工作節(jié)點(diǎn),按照shell被調(diào)用。這種比原生的MR還慢,因此沒大有人用吧。
spark應(yīng)該是是對(duì)python也很敵視的框架了。要說缺點(diǎn),況且是scala或java風(fēng)格的api,用起來太少python。再應(yīng)該是用過pandas和numpy,感覺上spark的api我還是也很基礎(chǔ)。
除了,python推薦一下你知道一點(diǎn)下dask,celery這兩個(gè)框架。dask是實(shí)現(xiàn)numpy,pandas裸芯片的,不兼容大部分np,pd的接口。且支持什么分布式,有可視化界面。整體來說是比較不錯(cuò)的選擇。
celery是一個(gè)分布式任務(wù)調(diào)度框架,本身啊,設(shè)計(jì)并又不是專門目的是etl,所以性能會(huì)比dask差一些。但個(gè)人感覺充當(dāng)生產(chǎn)系統(tǒng)使用,celery穩(wěn)定性稍低一些。