果***果
一、搜索引摯搜索抓取問題 搜索引摯每天要處理的抓取任務是數以億計的,更何況在24小時內要爬行整個互聯網的大大小小的網站,難免不會產生一些錯誤的。那么當網站快照出現兩個內容標題一樣,新舊程度不一樣的快照時,筆者認為這有可能是因為搜索引摯更新數據庫時,沒有把舊的頁面給刪除造成的。當蜘蛛再次爬行網站內容時,抓取了新內容自然都會返回新的快照,而這個新的快照中肯定要替代原本存于數據庫的那個快照,但是有時候由于數據處理的工作量特別大,難免不會出現一些錯誤,如筆者的小站的快照個人認為主要是搜索引摯在新快照覆蓋舊快照的問題上沒處理好,而使得原來要覆蓋舊快照的工作沒做,直接把新快照當成是一種新的獨立頁面,而舊的快照同樣也有效的存在數據庫中,當咱們用SITE查詢時,自然會返回兩個快照了。 二、首頁有多個網址路徑 眾所周知,一個網站中首頁都會存有兩個或兩個以上不同的路徑,而目標指向卻是同一個頁面。首頁出現多個網址路徑的機率很大。一般網站中的首頁默認URL地址是直接利用域名來顯示的,而筆者的網站是通過后臺生成靜態頁面的,剛開始是用http://域名.org/index.html來做首頁默認地址的,但是對于搜索引摯來說,帶INDEX.HTML和不帶的,兩個會區分成不同的地址,而搜索引摯顯示的時候,不管是帶不帶INDEX.HTML的,都會直接顯示出域名,自然就會出現上圖所示的那樣子了。所以,正常情況下,URL盡量要有唯一性,要不然網站就會出現跟筆者的小站一樣的情況了。這個可以在空間后臺的首頁默認文檔中把自己的默認首頁設置好就可以了。 三、網站空間雙IP的影響 網站有兩個不同的IP同時指向一個網站,那么在更新網站快照時,搜索引摯就會把網站分化成兩個快照,當然,有可能是空間自帶兩個IP的原因,但是搜索引摯怎么區分這個哪個IP是有網站呢?其實很簡單,通過分析域名的綁定情況來判斷,就像你用站長工具查詢網站時,都會顯示出網站所綁定的IP是哪個,而這樣的話,就會出現一個IP是沒有綁定的,卻也同樣存在網站,所以,搜索引摯就會給予綁定域名的那個IP顯示正常內容,而沒綁定的卻可以訪問的那個IP自然就直接顯示URL地址了。而這一點,是筆者根據一個老前輩的指導所分析出來的,筆者覺得雙IP對網站快照并不是什么好事,而且很容易因為雙IP給網站帶來的負面影響。
麗麗
百度在一定時間內要更新快照,而這次可能是忘了把上次的快照替換掉,所以就出現了2個快照