rapidminer如何處理異常值 如何入門大數(shù)據(jù)(數(shù)據(jù)挖掘方面)?
如何入門大數(shù)據(jù)(數(shù)據(jù)挖掘方面)?簡單的方法數(shù)據(jù)挖掘還是要一些理論基礎。最常見的一種的算法如分類,重臨,聚類等算法要熟悉,再深入了還有怎么學習數(shù)學,尤其是線性代數(shù)(推薦推薦國外翻譯的《線性代數(shù)及其應用》
如何入門大數(shù)據(jù)(數(shù)據(jù)挖掘方面)?
簡單的方法數(shù)據(jù)挖掘還是要一些理論基礎。最常見的一種的算法如分類,重臨,聚類等算法要熟悉,再深入了還有怎么學習數(shù)學,尤其是線性代數(shù)(推薦推薦國外翻譯的《線性代數(shù)及其應用》第五版[美]戴維C.雷/[美]史蒂文R.雷/[美]朱迪J.麥克唐納機械工業(yè)出版社,看過最好就是的線代書)。
理論基礎知識之外,要有不好算落地的能力,用什么軟件。
建模的分成三類商業(yè)版和開源免費版
1-商業(yè)版軟件
SPSSModerler,
SAS EM瘋狂挖掘模塊,
2-開源的挖掘軟件也有很多
1.Weka(必須java編程基礎),
2.當今最火的Pythonscikit-learn建模模塊(常3見算法都有吧)
3.RapidMiner
(大而全的一個軟件,做ETL和數(shù)據(jù)挖掘都也可以,學過Python挖掘模塊一看這個會那種感覺也很簡單點,相反更不容易再理解python瘋狂挖掘算法)
從另外一個角度來說,分成三類編程,和圖形化操作兩種,圖形化無需要編程無一遺漏配置各個節(jié)點,連線即可堆建。
我推薦你2個,Pythonscikit-learn建模模塊(編程),包括Knime(圖形化操作,非編程,下圖為knime操作界面)。本人剛申請開通頭條,打算逐漸地回答如何從入門到精通mlflow該軟件,歡迎大家關注和你的留言。
基礎知識:
編程語言,數(shù)據(jù)結構和算法,操作系統(tǒng)和網絡編程(數(shù)據(jù)庫相比較而言問的都很少),前兩部分非常重要!
機器學習很火,個人再理解的機器學習比較多有三個方向(按照崗位特別要求分):數(shù)據(jù)挖掘,自然語言處理和深度學習。數(shù)據(jù)挖掘主要是搜索排序,反作弊,智能推薦,信用評價等;自然語言處理通常是分詞,詞性分析等;深度學習比較多是語音和圖像識別。
什么是數(shù)據(jù)挖掘?數(shù)據(jù)挖掘的像是過程是怎樣的?
rapidminer插件加載不上?
很可能是只不過軟件與插件不自動分配,導致讀取不。
rapidminer中怎么設置數(shù)值保留位數(shù)?
再打開文件,再點左上角工具欄,選擇數(shù)字,再點在里面就可以你選可以保留數(shù)字位數(shù)