異常值檢測(cè)的三種方法 如何用統(tǒng)計(jì)方法去除一組數(shù)中的異常值?
如何用統(tǒng)計(jì)方法去除一組數(shù)中的異常值?可以選擇以下方法。用線性回歸的辦法求得某一點(diǎn)到直線最遠(yuǎn),去除這一點(diǎn)即可。異常值也稱離群值,具體地說(shuō),判斷標(biāo)準(zhǔn)依據(jù)實(shí)際情況,根據(jù)業(yè)務(wù)知識(shí)及實(shí)際需要而定。要是一般地說(shuō),
如何用統(tǒng)計(jì)方法去除一組數(shù)中的異常值?
可以選擇以下方法。用線性回歸的辦法求得某一點(diǎn)到直線最遠(yuǎn),去除這一點(diǎn)即可。異常值也稱離群值,具體地說(shuō),判斷標(biāo)準(zhǔn)依據(jù)實(shí)際情況,根據(jù)業(yè)務(wù)知識(shí)及實(shí)際需要而定。要是一般地說(shuō),可以用公式計(jì)算:upper adjacent value = 75th percentile (75th percentile – 25th percentile) * 1.5。lower adjacent value = 25th percentile – (75th percentile – 25th percentile) * 1.5。擴(kuò)展資料:計(jì)算統(tǒng)計(jì)量:μ=(X1 X2 … Xn)/n。s=(∑(Xi-μ)/(n-1))?(i=1,2…n)。Gn=(X(n)-μ)/s。式中μ——樣本平均值;s——樣本標(biāo)準(zhǔn)差;Gn——格拉布斯檢驗(yàn)統(tǒng)計(jì)量。確定檢出水平α,查表(見(jiàn)GB4883)得出對(duì)應(yīng)n,α的格拉布斯檢驗(yàn)臨界值G1-α(n)。當(dāng)Gn>G1-α(n),則判斷Xn為異常值,否則無(wú)異常值。給出剔除水平α’的G1-α’(n),當(dāng)當(dāng)Gn>G1-α’(n)時(shí),Xn為高度異常值,應(yīng)剔除。