<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    解析篇——VIP大講堂(上海站)QA集錦

    作者:月光邊境 瀏覽:136 發(fā)布時(shí)間:2018-05-28
    分享 評(píng)論 0

    上周為站長朋友們獻(xiàn)出了VIP大講堂上海站中關(guān)于SPIDE抓取建庫方面的QA內(nèi)容,本周繼續(xù)將解析方面的QA內(nèi)容奉上。

      問:我們的頁面本身就很大,會(huì)不會(huì)解析不出來?

      答:頁面本身很大倒沒問題,趕集、安居客這些量都很大,沒有問題。我剛才說的例子,你每次都follow出來新鏈接,隨機(jī)把后面的參數(shù)去掉都不影響這個(gè)網(wǎng)頁的正常訪問,這種肯定有問題的。

      問:剛才說對(duì)URL的長度有要求,那對(duì)每一段、就是目錄名的長度有沒有要求

      答:沒有要求,我們是要求url從www開始到結(jié)束,總長度不超過1024個(gè)字節(jié)。

      問:站內(nèi)重復(fù)內(nèi)容是怎么判斷的?文本內(nèi)容一樣結(jié)構(gòu)不一樣,算不算重復(fù)?

      答:算重復(fù)

      問:假設(shè)是整個(gè)頁面全是Flash,如果我把一些欄目或者最新的內(nèi)容隱藏掉,不影響美觀隱藏掉,如果用hidden屬性能不能提取出來?CSS可不可以?

      答:hidden可以提出來,但如果是注釋就不會(huì)管。CSS不可以。

      問:頁面大小不超過1兆,是指頁面壓縮以前還是以后。

      答:指頁面壓縮以后,不要超過1兆

      問:我網(wǎng)站的信息已經(jīng)過時(shí)了,但網(wǎng)頁返回的是200,會(huì)受懲罰?為什么呀?

      答:用戶在搜索結(jié)果里點(diǎn)了你的結(jié)果,導(dǎo)流導(dǎo)到你的網(wǎng)站,但沒什么可看的,對(duì)用戶沒有用,百度當(dāng)然不喜歡。

      問:現(xiàn)在我們很多網(wǎng)站,為了讓用戶覺得有意思,內(nèi)容沒了就放一張圖片,寫一些有意思的話,什么“工程師去哪啦”之類的,對(duì)百度友好不?

      答:最好不要用,我知道站點(diǎn)是想讓百度當(dāng)內(nèi)容死鏈來識(shí)別,但內(nèi)容死鏈識(shí)別起來是有準(zhǔn)確率和召回率風(fēng)險(xiǎn)的。

      問:我們團(tuán)購網(wǎng)站的確會(huì)有過期團(tuán)購的頁面,會(huì)受懲罰嗎

      答:如果量特別大、點(diǎn)擊量很大的話肯定會(huì)有懲罰的。有些可以當(dāng)內(nèi)容死鏈被分析出來,如果分析不出來,會(huì)被一些其他的策略挖出來,會(huì)有這樣的問題。

      問:剛才說資訊內(nèi)容頁面,上面有個(gè)發(fā)布時(shí)間好,那如果頁面上沒有時(shí)間呢?

      答:那我們往往是按當(dāng)時(shí)抓取的時(shí)間來做判定。

      問:評(píng)論里面時(shí)間重要嗎。

      答:百度更重視主體內(nèi)容的時(shí)間,評(píng)論不算主體內(nèi)容。

      問:我們是個(gè)平臺(tái),很多產(chǎn)品其實(shí)只是一個(gè)型號(hào)變更了,其實(shí)顏色都是一模一樣的,對(duì)蜘蛛而言僅僅只是幾個(gè)字符,會(huì)被識(shí)別為重復(fù)嗎

      答:如果是一個(gè)產(chǎn)品的結(jié)構(gòu)化信息的話,應(yīng)該不會(huì)被認(rèn)為是重復(fù)。如果你是簡單內(nèi)容摘要的方式進(jìn)行介紹的話,可能會(huì)存在重復(fù)問題。

      問:靜態(tài)URL和動(dòng)態(tài)URL區(qū)別大嗎?

      答:不大,我們現(xiàn)在認(rèn)為靜態(tài)和動(dòng)態(tài)都一樣的,因?yàn)閺膗rl上面他能夠識(shí)別出來,但是抓取回來的東西不太一樣。所以現(xiàn)在認(rèn)為無論你是靜態(tài)還是動(dòng)態(tài),我們都認(rèn)為同樣都是url來對(duì)待。


    久久精品*5在热| 久久93精品国产91久久综合| 97久久超碰成人精品网站| 99精品中文字幕| 国产AV国片精品有毛| 9i9精品国产免费久久| 日韩在线视精品在亚洲| www.日韩三级www.日日爱| 精品伊人久久大香线蕉网站| 国产精品一区视频| 91精品国产综合久久四虎久久无码一级 | 久久99精品国产麻豆婷婷| 国产亚洲日韩在线a不卡| 日韩成人在线视频| 国产在线观看91精品一区| 在线观看精品国产福利片87| 大伊香蕉在线精品视频人碰人| 精品久久久久久久久亚洲偷窥女厕 | 日韩在线视频二区| 亚洲人精品午夜射精日韩| 国产日韩高清一区二区三区| 国产精品熟女视频一区二区| 午夜人屠h精品全集| 久久精品国产亚洲AV未满十八| 亚洲综合一区国产精品| 国产精品久久久久久五月尺| 国产精品大全国产精品| 97精品人妻系列无码人妻| 2020久久精品国产免费| 国产精品自在拍在线拍| 国产精品久久久久免费a∨| 亚洲国产aⅴ成人精品无吗 | 国产精品久久久久国产精品三级| 国产精品模特hd在线| 日本精品一区二区三区视频 | 一本久久a久久精品亚洲| 曰韩精品无码一区二区三区 | 尤物国产精品福利三区| 国产精品亚洲专区在线播放| 国产日韩精品一区二区在线观看播放| 国产大片91精品免费看3|