決策樹如何進(jìn)行分類 既然使用神經(jīng)網(wǎng)絡(luò)也可以解決分類問題,那SVM、決策樹這些算法還有什么意義呢?
既然使用神經(jīng)網(wǎng)絡(luò)也可以解決分類問題,那SVM、決策樹這些算法還有什么意義呢?要看你的數(shù)據(jù)量和樣本數(shù)量,不同的樣本數(shù)量和特征數(shù)據(jù)量適合采用的算法都不一樣。神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法需要訓(xùn)練很大的數(shù)據(jù)集才能構(gòu)
既然使用神經(jīng)網(wǎng)絡(luò)也可以解決分類問題,那SVM、決策樹這些算法還有什么意義呢?
要看你的數(shù)據(jù)量和樣本數(shù)量,不同的樣本數(shù)量和特征數(shù)據(jù)量適合采用的算法都不一樣。神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法需要訓(xùn)練很大的數(shù)據(jù)集才能構(gòu)建比較好的預(yù)測模型。很多互聯(lián)網(wǎng)大公司比較喜歡深度學(xué)習(xí)算法是他們獲得的用戶數(shù)據(jù)都是數(shù)以億計(jì)的海量數(shù)據(jù),這是比較適合卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法。
如果你的樣本數(shù)量很少,比較合適的是使用SVM,決策樹等機(jī)器學(xué)習(xí)算法,如果你的數(shù)據(jù)集比較大,可以考慮使用卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法。
這有一個(gè)圖,就是說明任何根據(jù)樣本數(shù)量和數(shù)據(jù)集大小來選擇機(jī)器學(xué)習(xí)算法的。
如果覺得對(duì)您有幫助,可以多多點(diǎn)贊哦,也可以隨手點(diǎn)個(gè)關(guān)注哦,謝謝!
決策樹適合什么樣的數(shù)據(jù)分類?
數(shù)據(jù)挖掘,也稱之為數(shù)據(jù)庫中知識(shí)發(fā)現(xiàn)是一個(gè)可以從海量數(shù)據(jù)中智能地和自動(dòng)地抽取一些有用的、可信的、有效的和可以理解的模式的過程.分類是數(shù)據(jù)挖掘的重要內(nèi)容之一.目前,分類已廣泛應(yīng)用于許多領(lǐng)域,如醫(yī)療診斷、天氣預(yù)測、信用證實(shí)、顧客區(qū)分、欺詐甄別. 現(xiàn)己有多種分類的方法,其中決策樹分類法在海量數(shù)據(jù)環(huán)境中應(yīng)用最為廣泛.其原因如下:
1、決策樹分類的直觀的表示方法較容易轉(zhuǎn)化為標(biāo)準(zhǔn)的數(shù)據(jù)庫查詢
2、決策樹分類歸納的方法行之有效,尤其適合大型數(shù)據(jù)集.
3、決策樹在分類過程中,除了數(shù)據(jù)集中已包括的信息外,不再需要額外的信息.
4、決策樹分類模型的精確度較高. 該文首先研究了評(píng)估分類模型的方法.在此基礎(chǔ)上著重研究了決策樹分類方法,并對(duì)決策樹算法的可伸縮性問題進(jìn)行了具體分析,最后給出了基于OLE DB for DM開發(fā)決策樹分類預(yù)測應(yīng)用程序.