kmeans輸出聚類結(jié)果 K-means的算法優(yōu)點(diǎn)?
K-means的算法優(yōu)點(diǎn)?K-means聚類算法的優(yōu)點(diǎn)如下:1。算法簡單快速。對(duì)于大數(shù)據(jù)集具有較高的效率和可擴(kuò)展性。時(shí)間復(fù)雜度近似線性,適合于挖掘大型數(shù)據(jù)集。K-means聚類算法的時(shí)間復(fù)雜度為O(N
K-means的算法優(yōu)點(diǎn)?
K-means聚類算法的優(yōu)點(diǎn)如下:1。算法簡單快速。對(duì)于大數(shù)據(jù)集具有較高的效率和可擴(kuò)展性。時(shí)間復(fù)雜度近似線性,適合于挖掘大型數(shù)據(jù)集。K-means聚類算法的時(shí)間復(fù)雜度為O(NKT),其中n表示數(shù)據(jù)集中的對(duì)象個(gè)數(shù),T表示迭代次數(shù),K表示聚類個(gè)數(shù)。
k均值聚類公式?
西格瑪=[1,0 0,1
]mu1=[1,-1
]x1=mvnrnd(mu1,西格瑪,200)
mu2=[5.5,-4.5
]x2=mvnrnd(mu2,西格瑪,200)
mu3=[1,4
]x3=mvnrnd(mu3,西格瑪,200)
mu4=[6,4.5
]x4=mvnrnd(mu4,西格瑪,200)
mu5=[9,0.0
]x5=mvnrnd(mu5,西格瑪,200)
%獲取要聚集的1000個(gè)數(shù)據(jù)點(diǎn)
X=[x1 x2 x3 x4 x5
]%顯示數(shù)據(jù)點(diǎn)
繪圖(x1(:,1),x1(:,2),“r.”)按住
繪圖(x2(:,1),x2(:,2),“b.”)
繪圖(x3(:,1),x3(:,2),“k.”)
繪圖(x4(:,1),x4(:,2),“g.”)
繪圖(x5(:,1),x5(:,2),“m.”)
保存myX%存儲(chǔ)X在文件中加載到其他文件中
因?yàn)榫垲愃惴〞?huì)在開始時(shí)隨機(jī)設(shè)置聚類中心,然后迭代直到分類成功,所以樣本的輸入順序會(huì)影響聚類算法初始聚類中心的選擇,進(jìn)而影響整個(gè)聚類算法模型。
該算法的原理如下:
選擇k個(gè)類別
隨機(jī)初始化k個(gè)聚類中心
計(jì)算每個(gè)數(shù)據(jù)點(diǎn)到中心點(diǎn)的距離,哪個(gè)數(shù)據(jù)集的中心接近哪個(gè)數(shù)據(jù)集的中心
計(jì)算每個(gè)聚類中心作為一個(gè)新的聚類中心
重復(fù)上述步驟,直到每個(gè)聚類中心聚類中心在每次迭代后變化很小或幾乎沒有變化
這個(gè)問題實(shí)際上是沒有問題的分類效果和算法的實(shí)際運(yùn)行時(shí)間因數(shù)據(jù)的不同而不同。在計(jì)算速度方面,K-means比hierarchy快。其原因是K-means算法是先找到中心,然后計(jì)算距離;層次是將樣本逐個(gè)合并,層次算法的復(fù)雜度較高。更重要的是,在很多情況下,K-means算法和層次聚類算法的分類效果只能用不同的觀點(diǎn)來描述。