validation code 交叉驗(yàn)證是什么意思?
交叉驗(yàn)證是什么意思?交叉驗(yàn)證主要用于建模應(yīng)用,如PCR、PLS回歸建模。在給定的建模樣本中,取出大部分樣本建立模型,留一小部分樣本用剛建立的模型進(jìn)行預(yù)測(cè),計(jì)算出小部分樣本的預(yù)測(cè)誤差,并記錄它們的平方和
交叉驗(yàn)證是什么意思?
交叉驗(yàn)證主要用于建模應(yīng)用,如PCR、PLS回歸建模。在給定的建模樣本中,取出大部分樣本建立模型,留一小部分樣本用剛建立的模型進(jìn)行預(yù)測(cè),計(jì)算出小部分樣本的預(yù)測(cè)誤差,并記錄它們的平方和。
交叉驗(yàn)證的作用?
交叉驗(yàn)證的作用:將原始數(shù)據(jù)(數(shù)據(jù)集)分組,一部分作為訓(xùn)練集來(lái)訓(xùn)練模型,另一部分作為測(cè)試集來(lái)評(píng)估模型。方法:[1。堅(jiān)持交叉驗(yàn)證
2。K-fold交叉驗(yàn)證
K-fold交叉驗(yàn)證是將原始數(shù)據(jù)隨機(jī)分成K部分。
在K部分中,選擇一個(gè)作為測(cè)試數(shù)據(jù),其余K-1作為訓(xùn)練數(shù)據(jù)。事實(shí)上,交叉測(cè)試的過(guò)程是重復(fù)實(shí)驗(yàn)K次。每個(gè)實(shí)驗(yàn)從K個(gè)部分中選擇一個(gè)不同的部分作為測(cè)試數(shù)據(jù)(以確保K個(gè)部分的數(shù)據(jù)已經(jīng)被單獨(dú)測(cè)試),剩余的K-1作為實(shí)驗(yàn)的訓(xùn)練數(shù)據(jù)。最后,對(duì)K實(shí)驗(yàn)結(jié)果進(jìn)行了平均。
什么是交叉檢驗(yàn)?
英文名為10倍交叉驗(yàn)證,用于測(cè)試算法的準(zhǔn)確性。這是一種常見(jiàn)的測(cè)試方法。數(shù)據(jù)集分為十部分,其中九部分作為訓(xùn)練數(shù)據(jù),一部分作為測(cè)試數(shù)據(jù)。每次測(cè)試都會(huì)得到相應(yīng)的正確率(或錯(cuò)誤率)。用10次結(jié)果的正確率(或錯(cuò)誤率)的平均值作為算法精度的估計(jì)。一般需要多次進(jìn)行10次交叉驗(yàn)證(如10次交叉驗(yàn)證),然后計(jì)算平均值作為對(duì)算法精度的估計(jì)。之所以選擇將數(shù)據(jù)集劃分為10個(gè)部分,是因?yàn)橥ㄟ^(guò)大量的實(shí)驗(yàn),使用大量的數(shù)據(jù)集和不同的學(xué)習(xí)技術(shù),證明了10%的折扣是獲得最佳誤差估計(jì)的合適選擇,并有一定的理論基礎(chǔ)來(lái)證明這一點(diǎn)。但這并不是最終的診斷,仍有爭(zhēng)議。而且五折、八折和九折的結(jié)果似乎差不多。