python關聯(lián)規(guī)則挖掘 apriori算法python包
數(shù)據(jù)關聯(lián)是數(shù)據(jù)庫中一種重要的可發(fā)現(xiàn)知識。如果兩個或多個變量的值之間存在某種規(guī)律性,則稱為關聯(lián)。關聯(lián)可以分為簡單關聯(lián)、時間關聯(lián)和因果關聯(lián)。關聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關聯(lián)網(wǎng)絡。有時數(shù)據(jù)庫中數(shù)據(jù)的關
數(shù)據(jù)關聯(lián)是數(shù)據(jù)庫中一種重要的可發(fā)現(xiàn)知識。
如果兩個或多個變量的值之間存在某種規(guī)律性,則稱為關聯(lián)。
關聯(lián)可以分為簡單關聯(lián)、時間關聯(lián)和因果關聯(lián)。
關聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關聯(lián)網(wǎng)絡。
有時數(shù)據(jù)庫中數(shù)據(jù)的關聯(lián)函數(shù)是未知的,即使是已知的,也是不確定的,因此關聯(lián)分析生成的規(guī)則具有可信性。
關聯(lián)規(guī)則挖掘在大量數(shù)據(jù)中查找項集之間有趣的關聯(lián)或相關性。
1993年,Agrawal首次提出在客戶事務數(shù)據(jù)庫中挖掘項目集之間關聯(lián)規(guī)則的問題。后來,許多研究者對關聯(lián)規(guī)則的挖掘問題做了大量的研究。
他們的工作包括對原有算法的優(yōu)化,如引入隨機抽樣、并行思想等,以提高算法挖掘規(guī)則的效率,促進關聯(lián)規(guī)則的應用。
關聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中的一個重要課題,近年來得到了廣泛的研究。