<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    巧用robots避免蜘蛛黑洞

    作者:月光邊境 瀏覽:166 發(fā)布時(shí)間:2017-07-28
    分享 評論 0

    對于百度搜索引擎來說,蜘蛛黑洞特指網(wǎng)站通過極低的成本制造出大量參數(shù)過多,及內(nèi)容雷同但具體參數(shù)不同的動(dòng)態(tài)URL ,就像一個(gè)無限循環(huán)的“黑洞”將spider困住,Baiduspider浪費(fèi)了大量資源抓取的卻是無效網(wǎng)頁。

      比如很多網(wǎng)站都有篩選功能,通過篩選功能產(chǎn)生的網(wǎng)頁經(jīng)常會(huì)被搜索引擎大量抓取,而這其中很大一部分檢索價(jià)值不高,如“500-1000之間價(jià)格的租房”,首先網(wǎng)站(包括現(xiàn)實(shí)中)上基本沒有相關(guān)資源,其次站內(nèi)用戶和搜索引擎用戶都沒有這種檢索習(xí)慣。這種網(wǎng)頁被搜索引擎大量抓取,只能是占用網(wǎng)站寶貴的抓取配額。那么該如何避免這種情況呢?

      我們以北京某團(tuán)購網(wǎng)站為例,看看該網(wǎng)站是如何利用robots巧妙避免這種蜘蛛黑洞的:

      對于普通的篩選結(jié)果頁,該網(wǎng)站選擇使用靜態(tài)鏈接,如:http://bj.XXXXX.com/category/zizhucan/weigongcun

      同樣是條件篩選結(jié)果頁,當(dāng)用戶選擇不同排序條件后,會(huì)生成帶有不同參數(shù)的動(dòng)態(tài)鏈接,而且即使是同一種排序條件(如:都是按銷量降序排列),生成的參數(shù)也都是不同的。如:http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek

      http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

      對于該團(tuán)購網(wǎng)來說,只讓搜索引擎抓取篩選結(jié)果頁就可以了,而各種帶參數(shù)的結(jié)果排序頁面則通過robots規(guī)則拒絕提供給搜索引擎。

      robots.txt的文件用法中有這樣一條規(guī)則:Disallow: /*?* ,即禁止搜索引擎訪問網(wǎng)站中所有的動(dòng)態(tài)頁面。該網(wǎng)站恰是通過這種方式,對Baiduspider優(yōu)先展示高質(zhì)量頁面、屏蔽了低質(zhì)量頁面,為Baiduspider提供了更友好的網(wǎng)站結(jié)構(gòu),避免了黑洞的形成。


    久久ww精品w免费人成| 国产精品兄妹在线观看麻豆 | 在线观看91精品国产不卡免费| 久久精品国产99国产精品亚洲| 久久99精品久久久久麻豆| 亚洲码国产精品高潮在线| 久久久人妻精品无码一区| 亚洲人成国产精品无码| 精品一区二区三区四区电影| 日韩精品一区二区三区老鸭窝| 内射一区二区精品视频在线观看 | 在线观看国产精品普通话对白精品| 国产精品爱搞视频网站 | 亚洲国产精品久久久天堂| 中文精品久久久久人妻不卡 | 精品蜜臀久久久久99网站| 久久99热只有频精品8| 亚洲国产精品第一区二区| 亚洲国产精品久久久天堂| 日韩精品免费视频| 柠檬福利精品视频导航| 亚洲精品无码午夜福利中文字幕 | 国产国产成人精品久久| 久久精品国产AV一区二区三区| 亚洲精品91在线| 精品亚洲国产成人| 日产精品一二三四区国产| 久久久久久精品成人免费图片 | 亚洲欧洲中文日韩久久AV乱码| 国产精品不卡高清在线观看| 国产成人精品视频一区| 国产伦精品一区二区三区无广告 | 亚洲国产精品嫩草影院在线观看| 久久青青草原国产精品免费| 亚洲AV永久无码精品一百度影院| 亚洲AV无码久久精品蜜桃| 久久国产精品视频一区| 久久久精品中文字幕麻豆发布| 一本一道久久精品综合| 99这里只精品热在线获取| 亚洲va精品中文字幕|