SEO Baiduspider常見問題解答

2020-06-28

1399

什么是Baiduspider？Baiduspider是百度搜索引擎的一個自動程序，它的作用是訪問互聯(lián)網(wǎng)上的網(wǎng)頁，建立索引數(shù)據(jù)庫，使用戶能在百度搜索引擎中搜索到您網(wǎng)站上的網(wǎng)頁。 Baid

什么是Baiduspider？Baiduspider是百度搜索引擎的一個自動程序，它的作用是訪問互聯(lián)網(wǎng)上的網(wǎng)頁，建立索引數(shù)據(jù)庫，使用戶能在百度搜索引擎中搜索到您網(wǎng)站上的網(wǎng)頁。 Baiduspider的user-agent是什么？百度各個產(chǎn)品使用不同的user-agent：產(chǎn)品名稱對應(yīng)user-agent 無線搜索 Baiduspider-mobile 圖片搜索 Baiduspider-image 視頻搜索 Baiduspider-video 新聞搜索 Baiduspider-news 百度搜藏 Baiduspider-favo 百度聯(lián)盟 Baiduspider-cpro 百度推廣 Baiduspider-sfkr 網(wǎng)頁以及其他搜索 Baiduspider Baiduspider對一個網(wǎng)站服務(wù)器造成的訪問壓力如何？Baiduspider會自動根據(jù)服務(wù)器的負載能力調(diào)節(jié)訪問密度。在連續(xù)訪問一段時間后，Baiduspider會暫停一會，以防止增大服務(wù)器的訪問壓力。所以在一般情況下，Baiduspider對您網(wǎng)站的服務(wù)器不會造成過大壓力。為什么Baiduspider不停的抓取我的網(wǎng)站？對于您網(wǎng)站上新產(chǎn)生的或者持續(xù)更新的頁面，Baiduspider會持續(xù)抓取。此外，您也可以檢查網(wǎng)站訪問日志中Baiduspider的訪問是否正常，以防止有人惡意冒充Baiduspider來頻繁抓取您的網(wǎng)站。如果您發(fā)現(xiàn)Baiduspider非正常抓取您的網(wǎng)站，請通過投訴平臺反饋給我們，并請盡量給出Baiduspider對貴站的訪問日志，以便于我們跟蹤處理。如何判斷是否冒充Baiduspider的抓??？您可以使用host ip命令反解ip來判斷Baiduspider的抓取是否冒充。Baiduspider的hostname以*.baidu.com的格式命名，非*.baidu.com即為冒充。

$ host 123.125.66.120 120.66.125.123.in-addr.arpa domain name pointer baiduspider-123-125-66-120.crawl.baidu.com.

我不想我的網(wǎng)站被Baiduspider訪問，我該怎么做？Baiduspider遵守互聯(lián)網(wǎng)robots協(xié)議。您可以利用robots.txt文件完全禁止Baiduspider訪問您的網(wǎng)站，或者禁止Baiduspider訪問您網(wǎng)站上的部分文件。注意：禁止Baiduspider訪問您的網(wǎng)站，將使您的網(wǎng)站上的網(wǎng)頁，在百度搜索引擎以及所有百度提供搜索引擎服務(wù)的搜索引擎中無法被搜索到。關(guān)于robots.txt的寫作方法，請參看我們的介紹：robots.txt寫作方法

您可以根據(jù)各產(chǎn)品不同的user-agent設(shè)置不同的抓取規(guī)則，如果您想完全禁止百度所有的產(chǎn)品收錄，可以直接對Baiduspider設(shè)置禁止抓取。以下robots實現(xiàn)禁止所有來自百度的抓取： User-agent: BaiduspiderDisallow: /以下robots實現(xiàn)僅禁止來自百度視頻搜索的抓?。?User-agent: Baiduspider-videoDisallow: /以下robots實現(xiàn)禁止所有來自百度的抓取但允許圖片搜索抓取/image/目錄： User-agent: BaiduspiderDisallow: /

User-agent: Baiduspider-imageAllow: /image/

請注意：Baiduspider-cpro和Baiduspider-sfkr抓取的網(wǎng)頁并不會建入索引，只是執(zhí)行與客戶約定的操作，所以不遵守robots協(xié)議，如果Baiduspider-cpro和Baiduspider-sfkr給您造成了困擾，Baiduspider-cpro請聯(lián)系union1@baidu.com，Baiduspider-sfkr請聯(lián)系help@baidu.com。為什么我的網(wǎng)站已經(jīng)加了robots.txt，還能在百度搜索出來？因為搜索引擎索引數(shù)據(jù)庫的更新需要時間。雖然Baiduspider已經(jīng)停止訪問您網(wǎng)站上的網(wǎng)頁，但百度搜索引擎數(shù)據(jù)庫中已經(jīng)建立的網(wǎng)頁索引信息，可能需要數(shù)月時間才會清除。另外也請檢查您的robots配置是否正確。如果您的拒絕被收錄需求非常急迫，也可以通過投訴平臺反饋請求處理。我希望我的網(wǎng)站內(nèi)容被百度索引但不被保存快照，我該怎么做？Baiduspider遵守互聯(lián)網(wǎng)meta robots協(xié)議。您可以利用網(wǎng)頁meta的設(shè)置，使百度顯示只對該網(wǎng)頁建索引，但并不在搜索結(jié)果中顯示該網(wǎng)頁的快照。和robots的更新一樣，因為搜索引擎索引數(shù)據(jù)庫的更新需要時間，所以雖然您已經(jīng)在網(wǎng)頁中通過meta禁止了百度在搜索結(jié)果中顯示該網(wǎng)頁的快照，但百度搜索引擎數(shù)據(jù)庫中如果已經(jīng)建立了網(wǎng)頁索引信息，可能需要二至四周才會在線上生效。 Baiduspider多長時間之后會重新抓取我的網(wǎng)頁？百度搜索引擎每周更新，網(wǎng)頁視重要性有不同的更新率，頻率在幾天至一月之間，Baiduspider會重新訪問和更新一個網(wǎng)頁。 Baiduspider抓取造成的帶寬堵塞？ Baiduspider的正常抓取并不會造成您網(wǎng)站的帶寬堵塞，造成此現(xiàn)象可能是由于有人冒充Baiduspider惡意抓取。如果您發(fā)現(xiàn)有名為Baiduspider的agent抓取并且造成帶寬堵塞，請盡快和我們聯(lián)系。您可以將信息反饋至投訴平臺，如果能夠提供您網(wǎng)站該時段的訪問日志將更加有利于我們的分析。

卖逼视频免费看片|狼人就干网中文字慕|成人av影院导航|人妻少妇精品无码专区二区妖婧|亚洲丝袜视频玖玖|一区二区免费中文|日本高清无码一区|国产91无码小说|国产黄片子视频91sese日韩|免费高清无码成人网站入口

相關(guān)推薦