SEO 百度的中文分詞匹配技術(shù)
目的是探測一下百度的中文分詞匹配技術(shù),百度對于搜索結(jié)果采用的是與邏輯,而且這個與邏輯在排名中應(yīng)該有很高分值,由于是實驗,為了加快收錄,以取得更快的實驗結(jié)果,我們對測試的三個頁面加了些隨機的文章,跟標(biāo)題
以下為引用的內(nèi)容:
記者:為什么對同一詞條,百度與其他搜索引擎出來的結(jié)果不一樣呢?李彥宏:比如,在百度,檢索詞越長,用戶找到的檢索數(shù)目就越少。因為,我們認為用戶檢索的所有詞語都應(yīng)該出現(xiàn),這樣才能確保檢索的精確性。但在谷歌或西方的搜索引擎,檢索詞越長,檢索到的信息就越多。它們認為,與檢索詞中任一詞語相關(guān)的信息都應(yīng)該出現(xiàn)。換句話說,百度采用的是與邏輯,而谷歌或西方的搜索引擎采用的則是或邏輯。對用戶來說,檢索結(jié)果數(shù)量的多少并沒有太大價值,最關(guān)鍵的是,他想要找的東西找到?jīng)]有。
實驗的第一個頁面標(biāo)題:李彥宏為什么吃飯?
實驗的第二個頁面標(biāo)題:李彥宏為什么吃飯還要拿筷子?
實驗的第三個頁面標(biāo)題:李彥宏為什么還要拿筷子吃飯?
實現(xiàn)前搜索結(jié)果:
測試一小時后就收錄了,當(dāng)然結(jié)果也出來了。
試驗后結(jié)果圖片:
李彥宏為什么吃飯還要拿筷子
李彥宏為什么吃飯還要
李彥宏為什么吃飯
李彥宏吃飯
從試驗后圖片1中的結(jié)果可以看出,百度對完全匹配的檢索詞給予很高的分值,即使檢索詞的排序不同,只要這些詞全部包含在頁面中,都是可以加分的,這同樣也能解析關(guān)鍵詞堆砌對百度有用,而對google無用,了解了這些,也對大家做長尾關(guān)鍵詞有個很好指導(dǎo),而從以上四張圖片中也驗證了李彥宏所說的話:檢索詞越長,檢索到的結(jié)果越少。大家有興趣的自己可以再對比下google的結(jié)果,這就不難解析,為什么搜索一些詞google的結(jié)果會多些了,兩者的差異:百度采用的是與邏輯,而谷歌或西方的搜索引擎采用的則是或邏輯。
此實驗并未考慮排名的其它因素(比如外鏈,網(wǎng)站權(quán)重,檢索詞出現(xiàn)的次數(shù)等),所以排名只能橫向?qū)Ρ?,就是看我的三個實驗頁面的結(jié)果進行對比。(現(xiàn)在大家應(yīng)該知道李彥宏吃飯為什么用筷子了吧?。┮陨现皇莻€人看法,也非常歡迎大家有不同的看法一起交流。
原文鏈接地址: http://www.1860z.com/1109.html 作者:葉松