卖逼视频免费看片|狼人就干网中文字慕|成人av影院导航|人妻少妇精品无码专区二区妖婧|亚洲丝袜视频玖玖|一区二区免费中文|日本高清无码一区|国产91无码小说|国产黄片子视频91sese日韩|免费高清无码成人网站入口

企業(yè)網(wǎng)站URL如何規(guī)劃才算完美

企業(yè)網(wǎng)站URL 如何規(guī)劃才算完美網(wǎng)站URL 的規(guī)范對(duì)SEO 來說是非常重要的,如果一個(gè)網(wǎng)站的連接都是亂七八糟的,搜索引擎怎么會(huì)喜歡你的網(wǎng)站呢?通常我們都知道網(wǎng)站的URL 有動(dòng)態(tài)連接和靜態(tài)連接,那么一般

企業(yè)網(wǎng)站URL 如何規(guī)劃才算完美

網(wǎng)站URL 的規(guī)范對(duì)SEO 來說是非常重要的,如果一個(gè)網(wǎng)站的連接都是亂七八糟的,搜索引擎怎么會(huì)喜歡你的網(wǎng)站呢?

通常我們都知道網(wǎng)站的URL 有動(dòng)態(tài)連接和靜態(tài)連接,那么一般情況下我們?cè)诮ㄔO(shè)網(wǎng)站的時(shí)候會(huì)把動(dòng)態(tài)連接轉(zhuǎn)化成靜態(tài)鏈接,或者偽靜態(tài),這樣做是為了讓搜索引擎更容易的抓去內(nèi)容和在網(wǎng)站上爬行,那么為什么不建議用動(dòng)態(tài)鏈接呢?其實(shí)我們不應(yīng)該有連接的歧視,其實(shí)動(dòng)態(tài)連接和靜態(tài)連接是一樣的,只是動(dòng)態(tài)連接因?yàn)閰?shù)太多,很多時(shí)候參數(shù)越多搜索引擎就會(huì)爬進(jìn)去之后一直循環(huán)爬不出來,這就是動(dòng)態(tài)連接的缺點(diǎn),所以我們一般要求轉(zhuǎn)化成靜態(tài)鏈接或者偽靜態(tài)。我來局一個(gè)例子,這是以前在國(guó)平老師的博客里面看到的,有一個(gè)叫做無限空間,也可以稱為無限循環(huán),這樣的連接有動(dòng)態(tài)連接,也有靜態(tài)連接,動(dòng)態(tài)連接比較常見,而靜態(tài)連接一般出現(xiàn)在比較大型的網(wǎng)站上面,比如網(wǎng)站上面的日歷,我們發(fā)現(xiàn)這個(gè)日歷是不是可以無限點(diǎn)擊?是的日歷可以無限點(diǎn)擊,那么是不是代表這個(gè)日歷有無數(shù)個(gè)頁(yè)面呢?這個(gè)稱為無限循環(huán)。

下面引用下國(guó)平老師的文章內(nèi)容:

如很多博客上都會(huì)有一個(gè)日歷,順著這個(gè)日歷的日期一直往下點(diǎn),永遠(yuǎn)都有鏈接供你點(diǎn)擊的,因?yàn)闀r(shí)間是無限的。

其實(shí)還有更多的“無限空間”的例子,只是“無限空間”這個(gè)名詞沒怎么翻譯好,翻譯做“無限循環(huán)”就容易理解多了。 舉一個(gè)例子:

京東商城筆記本分類頁(yè)面:

當(dāng)點(diǎn)擊“惠普” “11英寸”這2個(gè)條件后能出來一個(gè)頁(yè)面,點(diǎn)擊“聯(lián)想” “14英寸” “獨(dú)立顯卡”也能出來一個(gè)頁(yè)面。那總共能出來的頁(yè)面有多少呢?

這個(gè)頁(yè)面中,品牌有18個(gè)分類、價(jià)格9個(gè)分類、尺寸7個(gè)分類、平臺(tái)3個(gè)分類、顯卡2個(gè)分類。 那么可以組合成的URL 個(gè)數(shù)為:

按1個(gè)條件篩選: 18 9 7 3 2 = 39 。

按2個(gè)條件篩選:18×9 18×7 18×3 18×2 9×7 9×3 9×2 7×3 7×2 3×2=527 。 按3個(gè)條件篩選:18×9×7 18×9×3 18×9×2 18×7×3 18×7×2 18×3×2 9×7×3 9×7×2 9×3×2 7×3×2=3093。

按4個(gè)條件篩選:18×9×7×3 18×9×7×2 18×7×3×2 18×9×3×2 9×7×3×2=7776。 按5個(gè)條件篩選:18×9×7×3×2=6804。

總共可以組合出的URL 數(shù)量為:39 527 3093 7776 6804=18239 個(gè)。

筆記本分類里總共才 624個(gè)商品,要放在18239個(gè)頁(yè)面中,而有的頁(yè)面,一個(gè)頁(yè)面就能放32個(gè)產(chǎn)品。勢(shì)必造成大量的頁(yè)面是沒有商品的。如點(diǎn)擊這幾個(gè)篩選條件后,就沒有匹配的商品出來了:

這樣的結(jié)果,就是造成大量重復(fù)的內(nèi)容以及消耗爬蟲很多不必要的時(shí)間,這也可以認(rèn)為是“無限空間”。 這類情況非常常見。如上面舉的京東商城的例子還是不怎么嚴(yán)重的,有的網(wǎng)站能組合出幾億甚至無窮無盡個(gè)URL 出來。我在國(guó)內(nèi)和國(guó)外看過那么多同類的網(wǎng)站,居然發(fā)現(xiàn)迄今為止只有兩家網(wǎng)站注意到了這個(gè)問題。究其原因,還是因?yàn)楹芏郤EO 人員不太重視數(shù)據(jù),這種問題稍微分析爬蟲的日志就可以看出來的。直到現(xiàn)在,還有一些SEOer 認(rèn)為把這些以前是動(dòng)態(tài)的頁(yè)面靜態(tài)化是個(gè)有積極意義的事情,沒看到不好的一面就是這樣的動(dòng)作制造出了大量重復(fù)的頁(yè)面,向來就是一個(gè)在SEO 方面不好的改動(dòng)。

,

另外在講一下URL 的目錄深度和蜘蛛是如何抓取比如URL 為www.xafeidu.com 的。URL 的深度我就不多講了深度最好不要超過三級(jí),因?yàn)樗阉饕娴闹┲朐谂佬械臅r(shí)候爬到一個(gè)URL 會(huì)先保存下來,等所有蜘蛛爬完然后優(yōu)先的順序就是選擇最短的URL 進(jìn)行抓取,所以在保存下來的URL 并不能每個(gè)都抓取完成,很多目錄太深的URL 都抓取不到,上面有講到過URL 抓去會(huì)有很多重復(fù),在這里如果重復(fù)URL 太多不同蜘蛛都抓取了重復(fù)的頁(yè)面也就都會(huì)保存下來,保存下來的連接又會(huì)進(jìn)行一次篩選,那么相同也頁(yè)面太多也就浪費(fèi)了時(shí)間,導(dǎo)致很多頁(yè)面都沒有抓取。

標(biāo)簽: