spark推薦算法 如何用spark實(shí)現(xiàn)好友推薦?
如何用spark實(shí)現(xiàn)好友推薦?1. Spark-mllib是用推薦程序?qū)崿F(xiàn)的,它封裝了als(alternativeleastsquares)來求解用戶項(xiàng)目評(píng)分矩陣的空值,只要應(yīng)用了數(shù)據(jù)就可以使用。缺
如何用spark實(shí)現(xiàn)好友推薦?
1. Spark-mllib是用推薦程序?qū)崿F(xiàn)的,它封裝了als(alternativeleastsquares)來求解用戶項(xiàng)目評(píng)分矩陣的空值,只要應(yīng)用了數(shù)據(jù)就可以使用。缺點(diǎn)是不能增量計(jì)算,占用大量?jī)?nèi)存。
2. 協(xié)同過濾、基于項(xiàng)目或用戶的聚類、SVM/Bayes的封裝,具體思路應(yīng)該不用多說。實(shí)施強(qiáng)化學(xué)習(xí),實(shí)時(shí)反饋更新模型,推送給用戶。這是最近最難也最時(shí)髦的一個(gè)
你打算學(xué)哪個(gè)專業(yè)?這太簡(jiǎn)單了
]如果你擅長(zhǎng)數(shù)學(xué)和英語(yǔ),我就不談了。這是最基本的
對(duì)于阿里這樣的大公司來說,你至少需要985或者211所名牌大學(xué)
你可以問我一些關(guān)于計(jì)算機(jī)科學(xué)的問題
我會(huì)定期更新視頻科學(xué)
spark Streaming是一個(gè)基于spark的實(shí)時(shí)計(jì)算框架,擴(kuò)展了spark處理大規(guī)模流數(shù)據(jù)的能力。spark流的優(yōu)點(diǎn)是它可以在1000個(gè)節(jié)點(diǎn)上以秒延遲運(yùn)行。
采用基于內(nèi)存的spark作為執(zhí)行引擎,具有高效、容錯(cuò)的特點(diǎn)。
可以集成批量處理和spark的交互式查詢。
它提供了一個(gè)簡(jiǎn)單的界面,類似于復(fù)雜算法的批處理。
正是由于這個(gè)原因,spark-streaming受到了很多企業(yè)的追捧,在生產(chǎn)項(xiàng)目中得到了廣泛的應(yīng)用,但在使用過程中也存在一些熱點(diǎn)問題。
原文的詳細(xì)解釋:https://blog.csdn.net/GitChat/article/details/78050311