深度神經(jīng)網(wǎng)絡(luò)原理 今年考上研究生,導(dǎo)師讓我在圖像處理算法和深度學(xué)習(xí)算法中選一個(gè)方向,請問有什么建議嗎?
今年考上研究生,導(dǎo)師讓我在圖像處理算法和深度學(xué)習(xí)算法中選一個(gè)方向,請問有什么建議嗎?選擇深度學(xué)習(xí),現(xiàn)在傳統(tǒng)方法做圖像處理基本是比不過深度學(xué)習(xí)做圖像處理,如果你要學(xué)深入,就多學(xué)機(jī)器學(xué)習(xí)理論是否存在通用的
今年考上研究生,導(dǎo)師讓我在圖像處理算法和深度學(xué)習(xí)算法中選一個(gè)方向,請問有什么建議嗎?
選擇深度學(xué)習(xí),現(xiàn)在傳統(tǒng)方法做圖像處理基本是比不過深度學(xué)習(xí)做圖像處理,如果你要學(xué)深入,就多學(xué)機(jī)器學(xué)習(xí)理論
是否存在通用的神經(jīng)網(wǎng)絡(luò)模型,可以處理圖像,語音以及NLP?
對于目前的深度學(xué)習(xí)模型來說,盡管深度學(xué)習(xí)的一個(gè)目標(biāo)是設(shè)計(jì)能夠處理各種任務(wù)的算法,然而截至目前深度學(xué)習(xí)的應(yīng)用仍然需要一定程度的特化,還沒有通用的神經(jīng)網(wǎng)絡(luò)處理模型。不過各個(gè)模型也在互相借鑒,彼此融合,共同提高,象有些創(chuàng)新能同時(shí)改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò),比如批標(biāo)準(zhǔn)化與注意力等。通用的模型還有待未來研究提出。
圖像和視頻處理,計(jì)算機(jī)視覺,目前最流行的是cnn,即卷積神經(jīng)網(wǎng)絡(luò),及其變形和發(fā)展,cnn適合處理空間數(shù)據(jù),在計(jì)算機(jī)視覺領(lǐng)域應(yīng)用廣泛。象陸續(xù)出現(xiàn)的AlexNet,VGGNet,GoogLeNet,ResNet等都很有特色。以上幾種模型是圖像分類識別使用的。象圖像分割,目標(biāo)檢測等還有更多針對性模型提出和得到廣泛應(yīng)用。
語音處理,2012 年前,最先進(jìn)的語音識別系統(tǒng)是隱馬爾可夫模型(HMM) 和高斯混合模型(GMM) 的結(jié)合。目前最流行的是深度學(xué)習(xí)的RNN循環(huán)神經(jīng)網(wǎng)絡(luò),及其發(fā)展長短時(shí)記憶網(wǎng)絡(luò)LSTM,以及GRU,雙向RNN,分層RNN等。
自然語言處理,除了傳統(tǒng)方法,目前深度學(xué)習(xí)用于自然語言處理的模型經(jīng)歷了基于CNN的模型,基于RNN的模型,基于Attention機(jī)制的模型,基于Transformer的模型等幾個(gè)發(fā)展階段。NLP有很多模型和方法,不同的任務(wù)場景有不同的模型和策略來解決某些問題。