pearson系數(shù)和回歸結(jié)果有關(guān)系嗎 pearson相關(guān)性系數(shù)模型的優(yōu)缺點(diǎn)?
pearson相關(guān)性系數(shù)模型的優(yōu)缺點(diǎn)?皮爾遜相關(guān)系數(shù)的優(yōu)點(diǎn)是。直觀地看到兩個(gè)變量之間的相關(guān)性是定量分析的基礎(chǔ),這樣可以篩選出許多不相關(guān)的因素,為后期建模即回歸方程對(duì)提供依據(jù),有利于簡(jiǎn)化模型。spss相
pearson相關(guān)性系數(shù)模型的優(yōu)缺點(diǎn)?
皮爾遜相關(guān)系數(shù)的優(yōu)點(diǎn)是。直觀地看到兩個(gè)變量之間的相關(guān)性是定量分析的基礎(chǔ),這樣可以篩選出許多不相關(guān)的因素,為后期建模即回歸方程對(duì)提供依據(jù),有利于簡(jiǎn)化模型。
spss相關(guān)性分析的類型?
相關(guān)性是指兩個(gè)變量之間變化趨勢(shì)的一致性。如果兩個(gè)變量的變化趨勢(shì)一致,那么就可以認(rèn)為這兩個(gè)變量之間存在一定的關(guān)系(但要說(shuō)存在一定的關(guān)系,必須是兩個(gè)具有實(shí)際經(jīng)濟(jì)意義的變量)。相關(guān)分析也是常用的統(tǒng)計(jì)方法,用SPSS統(tǒng)計(jì)軟件操作也很簡(jiǎn)單。具體方法步驟如下。
方法步驟
一個(gè)
選取理論上有關(guān)聯(lián)的兩個(gè)變量,如X和Y,將數(shù)據(jù)輸入SPSS。
2
一般來(lái)說(shuō),X和Y的趨勢(shì)是一致的。
三
為了解決相似性,采用SPSS對(duì)其進(jìn)行分析,從分析-相關(guān)-雙變量。
四
打開(kāi)二元相關(guān)對(duì)話框,將所選的x和y導(dǎo)入變量窗口。
五
然后選擇皮爾遜相關(guān)系數(shù)作為相關(guān)系數(shù),另外兩個(gè)也可以選擇。這只是統(tǒng)計(jì)方法上的細(xì)微差別,一般不影響結(jié)論。
六
單擊確定,在結(jié)果輸出窗口中顯示相關(guān)性分析的結(jié)果??梢钥吹絏和Y的相關(guān)系數(shù)是0.766,對(duì)應(yīng)的顯著性是0.076。如果顯著性水平設(shè)置為0.05,則不通過(guò)顯著性檢驗(yàn),即雖然兩個(gè)變量總體趨勢(shì)一致,但不顯著。
需要注意的事項(xiàng)
相關(guān)性分析研究的是兩個(gè)變量之間的相關(guān)性,但是你研究的兩個(gè)變量必須是相關(guān)的。如果你做歷年總?cè)丝诤湍闵砀叩南嚓P(guān)分析,分析結(jié)果會(huì)有顯著相關(guān),但沒(méi)有實(shí)際意義,因?yàn)榭側(cè)丝诤湍闵砀叨荚谥饾u增加,從數(shù)據(jù)上看是一致的,但沒(méi)有實(shí)際意義。
二維正態(tài)分布有哪些重要性質(zhì)?
性質(zhì)1:設(shè)X為隨機(jī)變量,其分布函數(shù)為F(x),則YF(X)服從[0,1]中的均勻分布。性質(zhì)2:設(shè)X1,K,Xn為一個(gè)分布的簡(jiǎn)單樣本,其分布函數(shù)為F(x)。根據(jù)性質(zhì)1,在概率意義下,f (x1),F(xiàn)(X2),K,F(xiàn)(Xn)均勻分布在(0,1)上,并從小到大排序,記為F(X1)。對(duì)應(yīng)分布函數(shù)的反函數(shù)值F-1(r1),F(xiàn)-1(r2),K,F(xiàn)-1(rn)(卡方分布中的卡方得分)應(yīng)該非常接近x1,x2k,xn,所以在概率意義上,這些散點(diǎn)(x1,F(xiàn)-1 (R1)),(x2,f-1。根據(jù)性質(zhì)2,如果x服從正態(tài)分布,則散點(diǎn)理論上應(yīng)該落在一條直線上,可以用皮爾遜系數(shù)來(lái)描述這種分布。但由于隨機(jī)變異的存在,皮爾遜系數(shù)不等于1,所以通過(guò)隨機(jī)模擬的方法,得出了皮爾遜系數(shù)95%的下限。性質(zhì)三:根據(jù)條件概率公式P(X,Y)P(Y|X)P(X)可知(X,Y)服從二元正態(tài)分布的充要條件是X是固定的,Y服從正態(tài)分布(條件概率分布),X的邊際分布是正態(tài)分布。根據(jù)線性回歸的性質(zhì)εY-(α βX)固定X,Y的條件概率分布為正態(tài)分布的充要條件是線性回歸的殘差ε服從正態(tài)分布,由此可以得出(X,Y)服從二元正態(tài)分布的充要條件是X的邊際分布為正態(tài)分布,線性回歸模型Y α β X的殘差ε服從正態(tài)分布。設(shè)x來(lái)自正態(tài)總體,從正態(tài)總體中隨機(jī)模擬抽樣5000次,每次抽樣的樣本含量為7到50。求F(x)的秩和排序F(x)與排序x的皮爾遜相關(guān)系數(shù)..表1 5000次隨機(jī)模擬得到的檢驗(yàn)正態(tài)分布的皮爾遜相關(guān)系數(shù)邊界值(略)同樣,我們也可以用同樣的方法得到檢驗(yàn)卡方分布的皮爾遜相關(guān)系數(shù)邊界表(簡(jiǎn)表)表2相關(guān)系數(shù)邊界表(略)2隨機(jī)模擬驗(yàn)證21皮爾遜相關(guān)系數(shù)邊界表隨機(jī)模擬驗(yàn)證設(shè)x來(lái)自正態(tài)總體,從正態(tài)總體中隨機(jī)模擬抽樣5000次,每次抽樣的樣本含量分別為10、20、30、40、50。并計(jì)算出相應(yīng)的Pearson卡方系數(shù),以及落在邊界值之外的比例,即剔除率,然后在同批數(shù)據(jù)的前提下,用McNemar檢驗(yàn)比較該方法與Swilk方法的差異。表3(一元正態(tài)分布)模擬次數(shù)(略)表4(一元偏態(tài)分布,χ2)模擬次數(shù)(略)或以上的方法在樣本量7的置信區(qū)間內(nèi)的拒識(shí)率為[78.37%,94.12%],在其他樣本量接近100%,可以證明是正確的。22卡方分布邊界表的隨機(jī)模擬驗(yàn)證5卡方分布:模擬5000次的隨機(jī)模擬驗(yàn)證(略)23馬氏距離根據(jù)馬氏距離的定義,從正態(tài)分布總體中隨機(jī)抽取樣本量為10、20、30、40、50的樣本模擬5000次,對(duì)X1、X2K、XN按上述方法進(jìn)行卡方評(píng)分,并根據(jù)上述相關(guān)性,得到皮爾遜系數(shù)。表6馬氏距離在皮爾遜系數(shù)邊界外的比例(略)表24二元正態(tài)分布數(shù)據(jù)對(duì)于材料的隨機(jī)模擬驗(yàn)證,設(shè)置一個(gè)二維矩陣A,分別求出特征值P和Z。假設(shè)X的所有元素都來(lái)自正態(tài)總體分布,YZ′×X必須服從二元正態(tài)分布,隨機(jī)模擬5000次。根據(jù)屬性3中介紹的方法進(jìn)行驗(yàn)證的拒絕率如下。表7(二元正態(tài)分布)模擬次數(shù)(略)表8(二元偏態(tài)分布,χ2)模擬次數(shù)(略)25三元正態(tài)分布數(shù)據(jù)的隨機(jī)模擬驗(yàn)證同樣用同樣的方法隨機(jī)模擬驗(yàn)證5000次,得到三元正態(tài)分布數(shù)據(jù)的拒識(shí)率。表9(三元正態(tài)分布)模擬次數(shù):5000次