python圖像歸一化處理 如何進(jìn)行數(shù)據(jù)的歸一化處理?
如何進(jìn)行數(shù)據(jù)的歸一化處理?首先,測(cè)試集的標(biāo)準(zhǔn)化平均值和標(biāo)準(zhǔn)差應(yīng)該來(lái)自訓(xùn)練集。如果您熟悉Python的sklearn,您應(yīng)該知道應(yīng)該首先對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行擬合,得到包括均值和標(biāo)準(zhǔn)差的定標(biāo)器,然后分別變換訓(xùn)
如何進(jìn)行數(shù)據(jù)的歸一化處理?
首先,測(cè)試集的標(biāo)準(zhǔn)化平均值和標(biāo)準(zhǔn)差應(yīng)該來(lái)自訓(xùn)練集。如果您熟悉Python的sklearn,您應(yīng)該知道應(yīng)該首先對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行擬合,得到包括均值和標(biāo)準(zhǔn)差的定標(biāo)器,然后分別變換訓(xùn)練集和驗(yàn)證集。這個(gè)問(wèn)題其實(shí)很好。很多人不注意。最容易犯的錯(cuò)誤是在劃分訓(xùn)練測(cè)試集之前進(jìn)行規(guī)范化。
第二個(gè)問(wèn)題是不同歸一化方法的選擇,如均值方差歸一化、最大最小歸一化等。歸一化的目的是調(diào)整每個(gè)場(chǎng)之間的數(shù)量級(jí)差異。均值-方差歸一化可能更適合不知道數(shù)據(jù)邊界在哪里的情況。最大和最小規(guī)格化相當(dāng)于積分到01,這意味著您知道該字段的邊界在哪里。所以我個(gè)人更喜歡均值方差的標(biāo)準(zhǔn)化。我只是憑經(jīng)驗(yàn)說(shuō)的,不一定是對(duì)的。