<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    搜索引擎檢索系統概述

    作者:月光邊境 瀏覽:172 發布時間:2017-05-05
    分享 評論 0

    前面簡要介紹過了搜索引擎的索引系統,實際上在建立倒排索引的最后還需要有一個入庫寫庫的過程,而為了提高效率這個過程還需要將全部term以及偏移量保存在文件頭部,并且對數據進行壓縮,這涉及到的過于技術化在此就不多提了。今天簡要給大家介紹一下索引之后的檢索系統。

      檢索系統主要包含了五個部分,如下圖所示:

      

     ?。?)Query串切詞分詞即將用戶的查詢詞進行分詞,對之后的查詢做準備,以“10號線地鐵故障”為例,可能的分詞如下(同義詞問題暫時略過):

      10 0x123abc

      號 0x13445d

      線 0x234d

      地鐵 0x145cf

      故障 0x354df

     ?。?)查出含每個term的文檔集合,即找出待選集合,如下:

      0x123abc 1 2 3 4 7 9…..

      0x13445d 2 5 8 9 10 11……

      ……

      ……

     ?。?)求交,上述求交,文檔2和文檔9可能是我們需要找的,整個求交過程實際上關系著整個系統的性能,這里面包含了使用緩存等等手段進行性能優化;

     ?。?)各種過濾,舉例可能包含過濾掉死鏈、重復數據、色情、垃圾結果以及你懂的;

      (5)最終排序,將最能滿足用戶需求的結果排序在最前,可能包括的有用信息如:網站的整體評價、網頁質量、內容質量、資源質量、匹配程度、分散度、時效性等等,之后會詳細給大家介紹。


    国产AV午夜精品一区二区三| 亚洲精品日韩一区二区小说 | 国产精品久久久久9999高清| 久久久久国产精品免费免费不卡| 99精品国产自在现线观看| 日韩视频在线观看| 国产精品久久久久久久久99热| 久久亚洲精品无码gv| 99久久人妻无码精品系列 | 无码日韩人妻AV一区免费l| 9999国产精品欧美久久久久久| 精品国产成人亚洲午夜福利| 精品久久久久久无码专区| 久视频精品免费观看99| 久久99精品久久久久久hb无码| 无码精品A∨在线观看| 久久久久亚洲精品美女| 国产国拍亚洲精品mv在线观看 | 精品日产一区二区三区手机| 思99热精品久久只有精品| 国产午夜精品一区二区三区小说| 国产精品永久久久久久久久久| 国产AV国片精品一区二区 | 久久精品国产亚洲AV香蕉| 麻豆亚洲AV永久无码精品久久| 久久精品国产一区二区三| 久久国产精品电影| 无码精品日韩中文字幕| 日韩精品人妻系列无码专区| 久久久免费精品re6| 97精品伊人久久久大香线焦| 久久99国产综合精品女同| 亚洲精品国产第1页| 久久精品国产四虎| 91麻豆精品国产一级| 精品日产a一卡2卡三卡4卡乱| 99视频在线精品免费观看6| 精品人妻少妇一区二区三区不卡| 国内精品国语自产拍在线观看91| 久久精品女人天堂AV| 国产精品亚洲专一区二区三区|