<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    百度spider介紹

    作者:9527 瀏覽:249 發布時間:2017-11-29
    分享 評論 0

      1. 什么是Baiduspider


      Baiduspider是百度搜索引擎的一個自動程序,它的作用是訪問互聯網上的網頁,建立索引數據庫,使用戶能在百度搜索引擎中搜索到您網站上的網頁。


      2. Baiduspider的user-agent是什么?


      百度各個產品使用不同的user-agent:


      產品名稱


      對應user-agent


      無線搜索


      Baiduspider


      圖片搜索


      Baiduspider-image


      視頻搜索


      Baiduspider-video


      新聞搜索


      Baiduspider-news


      百度搜藏


      Baiduspider-favo


      百度聯盟


      Baiduspider-cpro


      商務搜索


      Baiduspider-ads


      網頁以及其他搜索


      Baiduspider


      3. Baiduspider對一個網站服務器造成的訪問壓力如何?


      為 了達到對目標資源較好的檢索效果,Baiduspider需要對您的網站保持一定量的抓取。我們盡量不給網站帶來不合理的負擔,并會根據服務器承 受能 力,網站質量,網站更新等綜合因素來進行調整。如果您覺得baiduspider的訪問行為有任何不合理的情況,您可以反饋至反饋中心。


      4. 為什么Baiduspider不停的抓取我的網站?


      對 于您網站上新產生的或者持續更新的頁面,Baiduspider會持續抓取。此外,您也可以檢查網站訪問日志中Baiduspider的訪問是否正常,以 防止有人惡意冒充Baiduspider來頻繁抓取您的網站。 如果您發現Baiduspider非正常抓取您的網站,請通過反饋中心反饋給我們,并請盡量給出Baiduspider對貴站的訪問日志,以便于我們跟蹤處理。


      5. 如何判斷是否冒充Baiduspider的抓取?


      建議您使用DNS反查方式來確定抓取來源的ip是否屬于百度,根據平臺不同驗證方法不同,如linux/windows/os三種平臺下的驗證方法分別如下:


      5.1 在 linux平臺下,您可以使用host ip命令反解ip來判斷是否來自Baiduspider的抓取。Baiduspider的hostname 以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。


      $ host 123.125.66.120


      120.66.125.123.in-addr.arpa domain name pointer


      baiduspider-123-125-66-120.crawl.baidu.com.


      host 119.63.195.254


      254.195.63.119.in-addr.arpa domain name pointer


      BaiduMobaider-119-63-195-254.crawl.baidu.jp.


      5.2 在 windows平臺或者IBM OS/2平臺下,您可以使用nslookup ip命令反解ip來 判斷是否來自Baiduspider的抓取。打開命令 處理器 輸入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 來判斷是否來自Baiduspider的抓 取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名, 非 *.baidu.com 或 *.baidu.jp 即為冒充。


      5.3 在 mac os平臺下,您可以使用dig 命令反解ip來 判斷是否來自Baiduspider的抓取。打開命令處理器 輸入 dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip,來判斷是否來自Baiduspider的抓取,Baiduspider的 hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒 充。


      6. 我不想我的網站被Baiduspider訪問,我該怎么做?


      Baiduspider遵 守互聯網robots協議。您可以利用robots.txt文件完全禁止Baiduspider訪問您的網站,或者禁止 Baiduspider訪問您網 站上的部分文件。 注意:禁止Baiduspider訪問您的網站,將使您的網站上的網頁,在百度搜索引擎以及所有百度提供搜索引擎服務的搜索引擎中無法 被搜索到。關于 robots.txt的寫作方法,請參看我們的介紹:robots.txt寫作方法


      您可以根據各產品不同的user-agent設置不同的抓取規則,如果您想完全禁止百度所有的產品收錄,可以直接對Baiduspider設置禁止抓取。


      以下robots實現禁止所有來自百度的抓取:


      User-agent: Baiduspider


      Disallow: /


      以下robots實現禁止所有來自百度的抓取但允許圖片搜索抓取/image/目錄:


      User-agent: Baiduspider


      Disallow: /


      User-agent: Baiduspider-image


      Allow: /image/


      請注意:Baiduspider-cpro抓取的網頁并不會建入索引,只是執行與客戶約定的操作,所以不遵守robots協議,如果Baiduspider-cpro給您造成了困擾,請聯系union1@baidu.com。


      Baiduspider-ads抓取的網頁并不會建入索引,只是執行與客戶約定的操作,所以不遵守robots協議,如果Baiduspider-ads給您造成了困擾,請聯系您的客戶服務專員。


      7. 為什么我的網站已經加了robots.txt,還能在百度搜索出來?


      因為搜索引擎索引數據庫的更新需要時間。雖然Baiduspider已經停止訪問您網站上的網頁,但百度搜索引擎數據庫中已經建立的網頁索引信息,可能需要數月時間才會清除。另外也請檢查您的robots配置是否正確。


      如果您的拒絕被收錄需求非常急迫,也可以通過反饋中心反饋請求處理。


      8. 我希望我的網站內容被百度索引但不被保存快照,我該怎么做?


      Baiduspider遵守互聯網meta robots協議。您可以利用網頁meta的設置,使百度顯示只對該網頁建索引,但并不在搜索結果中顯示該網頁的快照。


      和robots的更新一樣,因為搜索引擎索引數據庫的更新需要時間,所以雖然您已經在網頁中通過meta禁止了百度在搜索結果中顯示該網頁的快照,但百度搜索引擎數據庫中如果已經建立了網頁索引信息,可能需要二至四周才會在線上生效。


      9. Baiduspider抓取造成的帶寬堵塞?


      Baiduspider的正常抓取并不會造成您網站的帶寬堵塞,造成此現象可能是由于有人冒充Baiduspider惡意抓取。如果您發現有名為Baiduspider的agent抓取并且造成帶寬堵塞,請盡快和我們聯系。您可以將信息反饋至反饋中心,如果能夠提供您網站該時段的訪問日志將更加有利于我們的分析。


    国产免费久久精品丫丫| 国产精品福利久久| 久久精品噜噜噜成人av| 久久久99精品成人片中文字幕| 日韩影院一级在线| 国产福利vr专区精品| 精品人妻少妇一区二区三区不卡 | 麻豆国产精品免费视频| 亚洲综合国产精品| 国产精品天干天干综合网| 大陆精大陆国产国语精品| 国内精品久久久久国产盗摄| 日韩一区二区超清视频| 日韩在线不卡免费视频一区| 国产精品∧v在线观看| 亚洲youwu永久无码精品| 模特私拍国产精品久久| 国产精品夜间视频香蕉| 国产精品大片天天看片| 亚洲一区精品视频在线| 91精品国产色综合久久不卡蜜| 99精品一区二区免费视频| 久久精品毛片免费观看| 91精品福利视频| 四虎精品视频在线永久免费观看| 久久久久久精品成人免费图片| 亚洲视频国产精品| 亚洲欧洲精品国产区| 久久人人做人人玩人精品| 97精品伊人久久大香线蕉app| 国产精品福利在线| 久久水蜜桃亚洲AV无码精品| 成人精品一区二区三区校园激情| 亚洲国产精品18久久久久久| 亚洲国产日产无码精品| 91精品视频免费| 人妻少妇精品无码专区| 国语自产精品视频在线看| 精品伊人久久久久网站| 国产模特众筹精品视频| 中文字幕日韩专区|