国产国语老龄妇女a片,亚洲av无码乱码在线观看性色,中文字幕丰满乱孑伦无码专区,69久久夜色精品国产69

關于頁面價值的事情

來源:本站日期:2017-7-10

搜索引擎每天處理著數以億計的查詢請求,每個查詢請求都代表了一個用戶對于某種資源的特定需求。多數時候,通過查詢返回的網頁結果,這些需求被滿足了,我們可以認為結果中的某些頁面對特定用戶的特定需求產生了價值。那么對于搜索引擎而言,頁面的價值是指什...

   一、什么頁面價值

  前面我們說了,某個頁面滿足了某一用戶的特定需求,就體現了這個頁面對用戶的價值。那么對搜索引擎而言,價值體現在哪些方面呢?一個簡單的推論,所有可能會對用戶產生價值的頁面都是對搜索引擎有價值的,將這些頁面建入搜索引擎的索引中能夠滿足最終檢索到它們用戶的需求,我們稱這種價值為檢索價值。只要是能解決某個用戶信息需求的,并且是可以通過某些正常檢索需求到達的,那么就是有檢索價值的。

  小學生張三喜歡在qzone上寫日記,寫他前天吃了什么,今天玩了什么。這些內容,是有價值的。它們對張三的家長、同學、老師,以及其他小學生,和對小學生日記感興趣的人來說,都是有價值的。對于這個信息體來說,“張三”這個名字是檢索的“key”。

  有一些信息單元,只有“瀏覽”價值,而沒有到達該信息的檢索途徑,那么該資源可能是有價值的,但檢索價值就很低。比如一張百度大廈附近的地圖,從瀏覽角度,是有價值的;但是如果沒有任何周邊文字說明(或者link的anchortext),只有一張光禿禿的地圖,就沒有檢索價值。當然,如果圖片的內容識別技術,有朝一日能自動識別出這個是“百度大廈附近地圖”,或者能夠自動分析出地圖內的各種大廈、街道、餐館等的名稱,那么這張圖一樣變得有檢索價值了。

  二、為什么要研究頁面價值

  首先,互聯網上的頁面是無窮盡的,而搜索引擎的硬件資源是有限的,想用有限的資源去覆蓋無窮盡的互聯網,我們就需要對頁面價值做出判斷,不收錄那些無檢索價值的頁面,少收錄那些檢索價值低的頁面。這是頁面價值在收錄控制方面的應用。

  第二,搜索引擎spider的抓取能力是有限的,出于訪問友好性的考慮,對于一個網站或一個IP抓取速率需要有一個抓取速率的上限。在這一限制下,抓取或頁面更新就需要有一個先后順序,而這一排序的主要參考依據就是頁面價值,或者說對頁面價值的預測(未抓取時)。這是頁面價值在spider調度方面的應用。

  第三,對于某些頁面,頁面內容發生變化,導致它的檢索價值從有到無,典型的就是變為“死鏈”,或者“被黑”。對于這些頁面,好的搜索引擎會在第一時間將其排除出索引,或在檢索時對其進行屏蔽,以保證返回給用戶的結果是更多檢索價值高的“好頁面”。對于另一些頁面,它不僅具有很高的檢索價值,而且有很強的“時效性”,能夠第一時間讓用戶檢索到這些頁面對搜索體驗有很大的提升。對搜索引擎而言,越快的收錄和索引頁面意味著越多的額外資源開銷,以多快的速度收錄和以多短的周期更新索引,需要通過頁面價值的分析來指導。這兩方面是頁面價值在死鏈率和時效性兩大搜索引擎指標提升上的應用。

0
首頁
報價
案例
聯系