mtcnn mtcnn訓(xùn)練代碼
Mtcnn算法是一種用于人臉檢測和對(duì)齊的多任務(wù)級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)。它是一種級(jí)聯(lián)結(jié)構(gòu),類似于AdaBoost算法,主要包括三個(gè)子網(wǎng)絡(luò):一個(gè)是p-net網(wǎng)絡(luò),主要得到候選窗口的回歸向量和人臉區(qū)域的包圍盒,并
Mtcnn算法是一種用于人臉檢測和對(duì)齊的多任務(wù)級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)。它是一種級(jí)聯(lián)結(jié)構(gòu),類似于AdaBoost算法,主要包括三個(gè)子網(wǎng)絡(luò):一個(gè)是p-net網(wǎng)絡(luò),主要得到候選窗口的回歸向量和人臉區(qū)域的包圍盒,并利用回歸向量對(duì)候選窗口進(jìn)行標(biāo)定,第二個(gè)子網(wǎng)絡(luò)是R-Net網(wǎng)絡(luò),它只做檢測和邊界盒回歸兩個(gè)任務(wù);最后一個(gè)子網(wǎng)絡(luò)是o-Net網(wǎng)絡(luò),它進(jìn)一步過濾前一個(gè)候選盒,對(duì)邊界盒進(jìn)行回歸,并計(jì)算特征點(diǎn)在每個(gè)邊界盒上的位置。此外,mtcnn是一種多尺度的網(wǎng)絡(luò)結(jié)構(gòu)。在輸入圖像數(shù)據(jù)之前,先構(gòu)造圖像金字塔,得到不同尺度的圖像,然后發(fā)送到p-net網(wǎng)絡(luò)。
SSD算法是一種單級(jí)端到端目標(biāo)檢測算法。其主要思想是對(duì)圖像的不同位置進(jìn)行密集采樣,采用不同的尺度比和縱橫比,并采用卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)提取特征進(jìn)行分類和回歸。它的優(yōu)點(diǎn)是速度快。SSD提取不同尺度的特征圖進(jìn)行檢測。前面的大比例尺特征圖用于檢測小目標(biāo),后面的小比例尺特征圖用于檢測大目標(biāo)。Vgg16作為基本模型。
Yolo目標(biāo)檢測算法的基本思想是利用CNN從輸入圖像中提取特征,并將輸入圖像分割成s×s單元。如果物體的中心落入其中一個(gè)細(xì)胞,該細(xì)胞負(fù)責(zé)探測目標(biāo)。在原有Yolo結(jié)構(gòu)的基礎(chǔ)上,yolov3采用多尺度融合進(jìn)行預(yù)測,提高了小目標(biāo)檢測的精度?;痉诸惥W(wǎng)絡(luò)與RESNET殘差網(wǎng)絡(luò)相似。分類任務(wù)使用logistic代替softmax,并使用9個(gè)尺度先驗(yàn)框來檢測大小目標(biāo)。
Mtcnn是一種用于人臉檢測的特殊目標(biāo)檢測算法,而Yolo和SSD是常見的目標(biāo)檢測算法。另一種常見的目標(biāo)檢測算法是兩級(jí)網(wǎng)絡(luò)模型。首先利用一些算法生成候選區(qū)域,然后對(duì)候選區(qū)域進(jìn)行分類和回歸。這類典型的算法包括r-cnn算法、快速r-cnn算法、快速r-cnn算法、FPN算法等。這些算法我也在學(xué)習(xí),有興趣的加關(guān)注,一起交流和討論!