網頁抓取
作者:重慶小面
瀏覽:851次
發布時間:2017-06-20




這里說的網頁抓取主要指搜索引擎對網頁的抓取,搜索引擎蜘蛛爬行到網頁讀取網頁內容下載存儲到搜索引擎數據庫額過程就叫網頁抓取,過程有三個方面:
1、搜集新出現的網頁;
2、搜集那些在上次搜集后有改變的網頁;
3、發現自從上次搜集后已經不再存了的網頁,并從庫中刪除。