hadoop自學(xué)要多久 為什么自然語(yǔ)言處理很難?
為什么自然語(yǔ)言處理很難?這是非常困難的,但它比前20年自然語(yǔ)言處理的進(jìn)步要好得多。最近,因?yàn)槲覀兿胙芯咳斯ぶ悄茏匀徽Z(yǔ)言處理項(xiàng)目,我們一直在閱讀相關(guān)書(shū)籍,從數(shù)學(xué)的奧秘,統(tǒng)計(jì)理論,概率論等。!讀了這么多書(shū)
為什么自然語(yǔ)言處理很難?
這是非常困難的,但它比前20年自然語(yǔ)言處理的進(jìn)步要好得多。最近,因?yàn)槲覀兿胙芯咳斯ぶ悄茏匀徽Z(yǔ)言處理項(xiàng)目,我們一直在閱讀相關(guān)書(shū)籍,從數(shù)學(xué)的奧秘,統(tǒng)計(jì)理論,概率論等。!讀了這么多書(shū)之后,我發(fā)現(xiàn)很多東西都取決于你的堅(jiān)實(shí)基礎(chǔ)。為什么自然語(yǔ)言處理的頭20年如此困難,或者沒(méi)有進(jìn)展?簡(jiǎn)單地說(shuō),人的習(xí)慣性思維決定了你對(duì)事物的理解方式。
在過(guò)去的20年里,科學(xué)家對(duì)自然語(yǔ)言處理的研究一直局限于或局限于人類(lèi)學(xué)習(xí)語(yǔ)言的方式。簡(jiǎn)而言之,就是用計(jì)算機(jī)來(lái)模仿人腦。當(dāng)時(shí),大多數(shù)科學(xué)家認(rèn)為,機(jī)器要翻譯或識(shí)別語(yǔ)音,就必須讓計(jì)算機(jī)理解我們的語(yǔ)言,而要做到這一點(diǎn),就必須讓計(jì)算機(jī)有能力模仿人類(lèi)什么樣的智慧,這是人類(lèi)理解的普遍規(guī)律,我們不應(yīng)該嘲笑他們,因?yàn)橹挥羞@樣的試錯(cuò),才能取得今天的成就。
現(xiàn)在,語(yǔ)音識(shí)別和翻譯已經(jīng)做得很好了,但是很多不在我們機(jī)器學(xué)習(xí)研究領(lǐng)域的人仍然錯(cuò)誤地認(rèn)為語(yǔ)音識(shí)別和翻譯是通過(guò)理解自然語(yǔ)言的計(jì)算機(jī)來(lái)實(shí)現(xiàn)的,而這實(shí)際上是通過(guò)數(shù)學(xué)和統(tǒng)計(jì)學(xué)來(lái)實(shí)現(xiàn)的。
從規(guī)則到統(tǒng)計(jì)的進(jìn)步是人類(lèi)對(duì)事物理解的突破。統(tǒng)計(jì)語(yǔ)言模型的建立是當(dāng)今自然語(yǔ)言處理的基礎(chǔ)和關(guān)鍵,但許多事物都會(huì)有其固有的缺陷,無(wú)法改變。
數(shù)的關(guān)系,公式的計(jì)算,n元模型在語(yǔ)言模型中的定位,為什么馬爾可夫假設(shè)中n的值這么小,涉及的知識(shí)太多,我這里不能一一回答。我只想說(shuō),純自然語(yǔ)言處理不像以前那么混亂,現(xiàn)在比以前好多了。困難不在于它本身,而在于它涉及太多的知識(shí)點(diǎn)。。。。
Java應(yīng)用于哪些方面?
Java最大的特點(diǎn)是跨平臺(tái),無(wú)論操作系統(tǒng)和硬件環(huán)境如何,都可以一次編寫(xiě),到處運(yùn)行。
Java程序員可以轉(zhuǎn)換到人工智能領(lǐng)域嗎?
首先,你需要數(shù)學(xué)基礎(chǔ):高等數(shù)學(xué)、線性代數(shù)、概率論、數(shù)理統(tǒng)計(jì)與隨機(jī)過(guò)程、離散數(shù)學(xué)、數(shù)值分析
其次,你需要算法的積累:人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、,遺傳算法和其他算法;當(dāng)然,在各個(gè)領(lǐng)域也需要算法,比如SLA研究,如果你想讓機(jī)器人在定位環(huán)境M中導(dǎo)航和建立自己的地圖,總之,很多算法需要時(shí)間積累;
那么,你至少需要掌握一種編程語(yǔ)言。畢竟,算法的實(shí)現(xiàn)還需要編程;如果你深入到硬件,一些基礎(chǔ)的電氣課程是必不可少的;
人工智能一般需要研究生來(lái)學(xué)習(xí),這門(mén)課程只是簡(jiǎn)單的一瞥。畢竟,必修的基礎(chǔ)課太多了。