我們在百度或者其它搜索引擎上輸入一個關鍵詞,點擊查詢,搜索引擎會從先到后列出大量的結果,看到這些結果,我們常會有疑問:這些結果是怎么來的呢?排序的標準又是什么呢?這個看似簡單的問題,卻是搜索引擎研究的核心難題之一。
為了解答這個疑問,特意寫了這篇文章,為大家介紹一下百度搜索結果展示的基本工作原理:
一、頁面抓取原理
搜索引擎在抓取到我們網站的前提是必須要有渠道,當你新建一個域名,新建了一個普通頁面,頁面沒有經過任何人的訪問,也沒有任何地方出現過你的頁面,那么搜索引擎是無法正確的抓取到你的頁面的,有些頁面或網站之所以什么都沒有操作,搜索引擎也一樣可以抓取和收錄,其原因主要是通過以下幾個渠道:
1、鏈接渠道
我們做外鏈的主要目的是什么,是傳遞權重還是能夠更好的讓搜索引擎通過這個鏈接來抓取我們的站點?這是大家都在考慮的一個問題,其實更重要的是讓搜索引擎能夠通過此鏈接正確的抓取到我們的網站,這也是SEOER都在說,現在新站建議做外鏈,老站就沒必要的原因之一。
2、提交渠道
80%的站點在建立以后會手動提交到搜索引擎,這是搜索引擎在收錄到更多站點的一個重點渠道,當搜索引擎不知道你的站點存在的時候,你提交了你的站點,這就是直接告訴了搜索引擎,你的站點是存在的,值得搜索引擎的收錄。
3、瀏覽器渠道
百度曾報道,360瀏覽器可根據用戶流量的網頁進行收集和抓取,也就是說,當用戶使用了360瀏覽器瀏覽了某一個未被360搜索引擎發現的站點,那么360瀏覽器將會記錄這個網站,然后將這個網站放到搜索引擎去處理,同樣,我想百度瀏覽器也會做類似的事情吧。
二、文章收錄原理
一些SEO初學者,剛接觸百度收錄的時候,總會問:為什么同時發布兩篇文章,一篇被收錄,還有一篇未收錄?為何我在大型網站發布的軟文未收錄?等等收錄問題,其實百度對網站文章收錄這一點看的相對嚴格,所以我們在這一點不能掉以輕心。
當然,收錄的原則也沒有想象中那么復雜,如果你的網站能夠健康的打開,收錄基本不是問題,只是時間問題,對于百度搜索引擎的收錄工作原理主要有以下3個:
1、對比
當搜索引擎在抓取到你網站的文章頁面的時候,會識別你的每一個內頁的相同區與不同區,也就是說,你網站的不同區將會被定義為主題內容區域,然后拿著你的主題內容與其他網站的主題內容進行對比,分出你頁面主題內容的原創度。
2、分類
通過對你的站點進行對比后,可以直接對你的內容進行分類,如同博客的一篇關于SEO相關的文章,搜索引擎可直接通過對比來判斷,你的網站屬于那種類型,是否適合你的站點。
3、用戶得分
分類之后,并不是代表搜索引擎就一定會收錄你的文章,主要還是要依靠用戶的得分,用戶的點擊率、停留時間判斷出此文的價值。
通過以上幾點的算法,當文章的綜合價值達到搜索引擎的標準值的時候,搜索引擎將會對其網站頁面進行收錄。
三、頁面過濾原理
很多網站頁面被百度收錄之后,百度認為該頁面對用戶沒有太大的價值,或者是質量度比較低的頁面,百度必然就會過濾掉,這也是用戶體驗好的一種表現。
很多站點以優化為目的,絲毫不考慮用戶的體驗,例如一些橋頁、跳轉頁面這些就是典型,百度的k站就是一種過濾頁面的表現,把那些作弊的站點的頁面全部的過濾掉。
很多人抱怨百度多次的k站事件,尤其是那些屌絲站長們整天在論壇抱怨這個抱怨那個,為什么k你的站,很顯然你的站點真的是以用戶體驗為核心運營站嗎?
做SEO的人大多都是為了優化而運營站點,每天寫的站內的更新、做外鏈肯定一部分是為了優化而優化,百度k你的站是犧牲少部分人的利益,更多的用戶是從中獲益的,要知道每天有上億人在使用百度,如果搜索出來的信息是你為了優化而運營的站點,低質量的頁面,那百度是拿自己未來的前途給你優化站點做鋪墊的,所以過濾頁面這方面百度非常的嚴格。
四、頁面信息展示原理
一旦搜索引擎抓取到頁面,并且進行了收錄和過濾后,接下來就需要給用戶展示信息了,對此,搜索引擎也需要經過以下2個主要步驟:
1、建立索引
經過了收錄頁面以及過濾頁面的工作之后,百度會對這些頁面逐一進行標記和識別,并將這信息進行儲存為結構化的數據,儲存到百度的搜索的服務器中,這些儲存的數據有網頁的信息、網頁的標題關鍵詞頁面描述等標簽、網頁外鏈及描述、抓取記錄。
還會將網頁中的關鍵詞信息進行識別和儲存,以便與用戶搜索的內容進行匹配,建立完善的索引數據庫,方便呈現出最佳的顯示信息。
2、顯示信息
用戶輸入的關鍵詞,百度會對其進行一系列復雜的分析,并根據分析的結論在索引庫中尋找與之最為匹配的一系列網頁,按照用戶輸入的關鍵詞所體現的需求強弱和網頁的優劣進行打分,并按照最終的分數進行排列,展現給用戶,一般顯示出的最佳信息,需要關鍵詞匹配最高的相關頁面。
五、關鍵詞排名原理
搜索引擎的排名原理是大家最最關心的話題,搜索引擎的排名原理是通過多方面來給出的,不是單一的站內優化做的多好,也不是單一的點擊率有多高,而是根據網站的綜合得分得出排名,這主要由以下幾個點:
1、點擊率
從百度站長平臺的關鍵詞工具可以看出,當你的網站排名在50頁之前的時候,點擊率對你的網站有直接影響,這也就是很多網絡公司接SEO的單,要求你網站的排名必須是多少的原因之一。
2、體驗度
頁面的體驗度是更具用戶的需求來定義的,當用戶的重點需求在圖片的時候,那么頁面的體驗度最核心問題就在圖片上面,但是這種簡單的需求,基本的網站均可滿足,重點還需要在簡單的需求滿足的情況下,在滿足其他附加需求。
那么,搜索引擎為何能夠知道用戶的需求呢?主要原因還是用戶在搜索框搜索的內容均被搜索引擎所記錄。
當然,遇到同樣是圖片的站點,排名的好壞還有更多的算法,比如用戶在瀏覽你的圖片僅用1秒,而瀏覽競爭對手的圖片用了30秒,這就意味著競爭對手的內容比你做的好,停留時間、PV、跳出率成功了搜索引擎重點考核數據。
3、信用度
信用度的積累可直接讓搜索引擎忽略很多細節問題,直接給與排名,這就是我們經常在大站發布的外鏈軟件很容易就獲得排名的原理了,一個大型網站,經過與搜索引擎的磨合,早已被搜索引擎加入到了信任用戶,所以,后期的軟文可以直接讓搜索引擎給他一個優勢排名。
評論(0人參與,0條評論)
發布評論
最新評論