spark mllib 教程 如何用spark實(shí)現(xiàn)好友推薦?
如何用spark實(shí)現(xiàn)好友推薦?1. Spark-mllib是用推薦程序?qū)崿F(xiàn)的,它封裝了als(alternativeleastsquares)來(lái)求解用戶項(xiàng)目評(píng)分矩陣的空值,只要應(yīng)用了數(shù)據(jù)就可以使用。缺
如何用spark實(shí)現(xiàn)好友推薦?
1. Spark-mllib是用推薦程序?qū)崿F(xiàn)的,它封裝了als(alternativeleastsquares)來(lái)求解用戶項(xiàng)目評(píng)分矩陣的空值,只要應(yīng)用了數(shù)據(jù)就可以使用。缺點(diǎn)是不能增量計(jì)算,占用大量?jī)?nèi)存。
2. 協(xié)同過(guò)濾、基于項(xiàng)目或用戶的聚類(lèi)、SVM/Bayes的封裝,具體思路應(yīng)該不用多說(shuō)。實(shí)施強(qiáng)化學(xué)習(xí),實(shí)時(shí)反饋更新模型,推送給用戶。這是最近最難和最時(shí)髦的一個(gè)
謝謝。我建議轉(zhuǎn)向大數(shù)據(jù)。
我也從事java開(kāi)發(fā),我對(duì)這個(gè)主題的糾纏也有同樣的感受。畢竟,如果我精通Java,我已經(jīng)付出了大量的學(xué)習(xí)精力。如果我學(xué)習(xí)機(jī)器學(xué)習(xí),我基本上想告別Java,這無(wú)疑是一個(gè)非常不幸的選擇。
此外,轉(zhuǎn)向機(jī)器學(xué)習(xí)不僅需要深入了解python,還需要掌握數(shù)學(xué)算法,這是不可能一蹴而就的。因此,轉(zhuǎn)向人工智能的風(fēng)險(xiǎn)相對(duì)較高,很容易打亂一個(gè)人的職業(yè)規(guī)劃。
目前,大數(shù)據(jù)方向仍是一個(gè)需求量大、前景好的工作方向。Java廣泛應(yīng)用于大數(shù)據(jù)領(lǐng)域。單憑Hadoop生態(tài)系統(tǒng)就足以完成大量的大數(shù)據(jù)工作,而Hadoop和Java是分不開(kāi)的。
最重要的是大數(shù)據(jù)方向不會(huì)低于機(jī)器學(xué)習(xí)的工資,機(jī)器學(xué)習(xí)還處于初級(jí)階段。別擔(dān)心工資問(wèn)題。