百度收錄可能遇到的情況




一、網站改版了還收錄舊的URL地址
很多站長網站改版了啟用了新的URL結構,也在站長平臺進行了改版提交,但是還是出現收錄舊的URL,遇到這個問題首先我們還是從站點自身的問題找起:
1.是否已經去除所有舊地址入口?
這是個嚴肅的問題,很多朋友因為站點大、結構復雜、改版不徹底導致并沒有去除所有入口頁面,導致新內容產生的同時在一些角落里還是產生了老的入口,只要鏈接地址還是老的就有可能被收錄。所以要改版要換URL必須徹頭徹尾的把所有鏈接替換為新的URL。為了加速生效新的鏈接除了站點自身鏈接外盡可能修改一下外部的鏈接,例如友情鏈接。
2.老的URL是否做了301到新的URL上?
老的URL是否真的是301到新的URL上面?我也遇到一些奇葩的朋友使用js之類的技術,看起來好像也是跳轉,也像那么回事,但其實根本不是一回事!
3. 關于百度方面
在做好1和2的基礎上,即使百度收錄了舊的鏈接,也不必擔心,因為百度對跳轉屬性的站點和鏈接識別和確認需要一定的時間,而且只要是穩定的跳轉,最終都會轉換成新鏈接的流量,當然記得通過網站改版工具及時提交改版規則。
二、測試網址無緣無故就被收錄了導致了正式網址不被收錄
建議大家以后測試的時候盡量環境保證本地或者在特定測試環境下才能訪問,否則現在的各種瀏覽器可能會把地址透露出去,也有不小心把地址拿去搜索等渠道導致被搜索引擎收錄那么對你的站點上線影響還是蠻大的。
1.沒有關閉測試服務器
上面普及知識有提到過,大家換IP或者換URL地址的時候因為老的服務器沒有關閉,而搜索引擎緩存了IP,導致搜索引擎還是可以訪問到這些頁面;
2.沒有刪除IIS綁定
還有一些朋友換了IP地址,但是并沒有在老的IP上的網頁服務器上刪除網站綁定,導致搜索引擎帶HOST頭訪問該IP的時候能夠訪問到舊的內容;
一般情況下搜索引擎緩存的時候較長,或者因cdn等因素導致IP同步失敗的都會導致上述情況發生,更換ip以后,可以通過抓取診斷工具測試一下百度是否能夠正確抓取,如果解析到的ip有誤,可點擊抓取診斷詳情中的“報錯”,通知百度更新您站點的ip。
三、換IP后導致百度不收錄
上面提到搜索引擎會緩存IP,百度在換IP的時候也說過盡量保證老服務器一段時間內可以訪問,為什么要這樣?因為服務器真的需要時間去同步內容同步IP,而且直接斷了老的服務器很容易導致短時間突發404,因此會給站點造成不可預估的問題;
換IP后不收錄原因也是這樣,因為換了新服務器數據遷移后導致老服務器的內容并沒有更新,所以這個時候其實是百度根本抓取不到你的更新。因此需要通過上面的方式盡快告訴百度,您站點ip的變動,減少站點流量損失。