国产国语老龄妇女a片,亚洲av无码乱码在线观看性色,中文字幕丰满乱孑伦无码专区,69久久夜色精品国产69

關于網絡內容評分模板

來源:本站日期:2017-7-13

我們可以看到目前很多的網站都會有內容評分,無論是電子商務、信息分享還是內容下載。內容的評分主要分為兩類,一類是用戶對內容的評分,主要針對用戶的使用感受,如電子商務網站的商品評分,內容分享網站的內容評分等,這個也是目前最普遍的評分模式,而內容...

   內容評分實例

 
  介紹應用的案例前,先要說明下應用的環境和具體的需求:假設有一個內容分享網站,需要將網站中的內容進行評分,以5分制的形式展現,即每個內容的評分只可能出現1-5這5個分值,目的是展現出網站中每個內容的熱門程度,為用戶的選擇和閱讀提供參考。
 
  這是一個最簡單的內容評分的應用,上面已經非常明確的說明了評分的目的——區分內容的熱門度,以及最終的數據展現——以5分制的形式展現。對于這樣一個明確了的數據需求,我們就可以選擇指標、搭建模型、并最終輸出結果。
 
  1、選擇指標
 
  評價內容的熱門度,貌似挺簡單的,直接用內容瀏覽量(PV)作為評定指標不就行了?確實,PV是個不錯的選擇,也是最簡單的一種選擇,但其實還有更好的選擇,訪問數(Visits),訪問用戶數(UV),這兩個指標能剔除同一個用戶短時間內連續刷新同一內容的情況,所以我們不妨選擇訪問用戶數UV來作為評價指標。
 
  2、構建評分模型
 
  現在才是文章的關鍵內容,需要對內容的熱門程度進行評價首先要消除指標的度量單位,并把分值的分布區間控制在要求的范圍內—1-5分。
 
  消除度量單位?也許你已經想到了,還是數據的標準化,這篇文章中的方法已經在多處使用,可以說是很多數據分析和數據挖掘的基礎步驟。
 
  Min-Max歸一化評分
 
  Min-Max是最常用的數據歸一化方法(詳見數據標準化這篇文章的描述),處理后的數據分布在[0,1]的區間內,接下來只要把0-1的數值轉化1-5這5個分值就行。很簡單,先乘以4使數據落在[0,4]的分布區間,四舍五入,是不是只剩下0-4這5分分值了,再加1就可以得到我們想要的結果了。我們來看看處理后的各分值內容分布情況的示例:
 
 Min-Max的評分結果的每個分值的內容數量分布是不可控的,一般會跟網站中熱門內容和冷門內容的比例直接相關,所以當某些網站的熱門內容只占網站所有內容的20%,并且這些內容的訪問量異常高,占據了所有網站訪問量的80%,也就是我們平常說的符合二八法則。那么可能出現的情況就是大部分的內容評分集中在1分,小部分集中在5分,而中間的2、3、4分的內容分布非常少,其實上圖就有點偏向這個趨勢,但其實很多時候我們期望的內容分布可以偏向正態,也就是大部分內容能分布在中間分值,兩端分值的內容數據相對較少
0
首頁
報價
案例
聯系