卖逼视频免费看片|狼人就干网中文字慕|成人av影院导航|人妻少妇精品无码专区二区妖婧|亚洲丝袜视频玖玖|一区二区免费中文|日本高清无码一区|国产91无码小说|国产黄片子视频91sese日韩|免费高清无码成人网站入口

kmeans算法基本步驟 k-means聚類算法為什么會受到樣本輸入順序的影響?

k-means聚類算法為什么會受到樣本輸入順序的影響?因為聚類算法會在一開始就隨機(jī)設(shè)置聚類中心,然后迭代直到分類成功,所以樣本的輸入順序會影響聚類算法初始聚類中心的選擇,進(jìn)而影響整個聚類算法模型。算法

k-means聚類算法為什么會受到樣本輸入順序的影響?

因為聚類算法會在一開始就隨機(jī)設(shè)置聚類中心,然后迭代直到分類成功,所以樣本的輸入順序會影響聚類算法初始聚類中心的選擇,進(jìn)而影響整個聚類算法模型。

算法原理一般如下:

選擇k個類別

隨機(jī)初始化k個聚類中心

計算每個數(shù)據(jù)點到中心點的距離,數(shù)據(jù)集的哪個中心靠近哪個聚類

將每個聚類中心計算為一個新的聚類中心

重復(fù)上述步驟,直到每個聚類中心在每次迭代后變化很小或幾乎沒有變化

K均值聚類算法的優(yōu)缺點主要有以下幾點:

1。算法簡單快速

2。它對于大數(shù)據(jù)集具有很高的效率和可擴(kuò)展性

3。時間復(fù)雜度近似線性,適合于挖掘大型數(shù)據(jù)集。K-means聚類算法的時間復(fù)雜度為O(NKT),其中n表示數(shù)據(jù)集中的對象個數(shù),T表示迭代次數(shù),K表示聚類個數(shù)。