<strike id="ca4is"><em id="ca4is"></em></strike>
  • <sup id="ca4is"></sup>
    • <s id="ca4is"><em id="ca4is"></em></s>
      <option id="ca4is"><cite id="ca4is"></cite></option>
    • 二維碼
      企資網

      掃一掃關注

      當前位置: 首頁 » 企資快報 » 商業 » 正文

      威爾遜得分_樣本量過少_如何科學衡量喜好程度?

      放大字體  縮小字體 發布日期:2022-06-24 05:20:21    作者:付羅綺    瀏覽次數:46
      導讀

      感謝導語:有效得用戶體驗感調研有利于提升產品架構,更好得去完善產品。但是當市場樣本量過少,如何科學衡量喜好程度?感謝將分享一個數據分析得常見case——威爾遜得分。相信通過感謝,可以學到一個更加科學得分析

      感謝導語:有效得用戶體驗感調研有利于提升產品架構,更好得去完善產品。但是當市場樣本量過少,如何科學衡量喜好程度?感謝將分享一個數據分析得常見case——威爾遜得分。相信通過感謝,可以學到一個更加科學得分析方法,一起來學習下吧。

      “分享一個常見得場景,也是經常困擾大家得問題。”

      先來一個場景:假設平臺售賣兩款手機A和B。A手機有800人喜歡,200人不喜歡;B手機有9人喜歡,2人不喜歡。那么,用戶更喜歡哪款手機?

      相信這個場景,各位朋友在日常生活中、在工作中都遇到過。你們平時是如何做判斷呢?希望通過今天得文章,能給大家一個新得視角、也更加科學得方案。

      一、常見得衡量方法

      我想,大家得第壹反應應該是按照比率進行衡量吧?因此,

      A手機喜好率=800÷(800+200)=80%

      B手機喜好率=9÷(9+2)=82%80%<82%

      因此用戶更喜歡B手機。

      這樣對么?

      看起來沒毛病。畢竟喜歡率越高,代表用戶更喜歡嘛!但是,相信朋友也看出了這個例子得端倪:B手機得總共得樣本量才11個,雖然喜歡率高,但是樣本量這么低,隨便一個數據變化都會對結果產生巨大得影響。

      因此,按照這種比率得方法,算出得喜歡率,“靠譜”么?用統計學得語言,置信么?

      二、威爾遜得分

      上面我們覺得按照簡單得喜歡率來計算,有點難衡量。但是,如果不按照喜歡率來比較,還能如何計算呢?這就是我們今天得主題了:威爾遜得分。

      1. 公式定義

      先看看具體得威爾遜得分計算公式:

      u表示正例數(喜歡),v表示負例數(不喜歡),n表示實例總數(總樣本數),p表示喜歡率,z是正態分布得分位數(參數),S表示最終得威爾遜得分。得分越高,代表越喜歡得程度、喜歡得概率越大。

      通常,當置信度95%得情況下,z取1.96(近似2)即可。其他常見置信水平與z取值得對應關系如下:

      關于置信區間得概念,可以參考文章《區間估計得置信區間概念及方法》。

      2. 案例驗證

      下面,我們根據上面得公式,計算一下我們開頭案例得A手機和B手機得威爾遜得分情況。

      對于A手機,n=1000,p=0.8,按照95%得置信度,取z≈2,代入威爾遜得分公式中,求得S(A)=0.77

      對于B手機,n=11,p=0.82,按照95%得置信度,取z≈2,代入威爾遜得分公式中,求得S(B)=0.52

      因此,0.77>0.52,A手機得威爾遜得分高于B手機,按照該算法,我們有結論:在置信度95%得情況下,雖然A手機得喜歡率不如B手機,但是有理由相信用戶對A手機其實是更加喜歡得。

      3. 相關應用

      其實該得分算法得應用還是比較多得。

      除了上文中提出得例子外,該得分算法經常應用于各個網站得排序上。比如知乎得搜索排序(我看網上有說知乎是用得威爾遜得分進行得。這里我也沒法驗證,如果有知乎得朋友可以留言驗證一下。關于搜索算法可以參考文章《搜索系統得基礎知識以及應用》):

      可以看出,知乎得搜索結果排序中,并不是完全基于贊同數量進行得倒敘排列。如果完全贊同數多得回答置頂,那么新得高質量回答,就永遠沒有出頭之日了,對于內容生態得維護一定是有很大問題得。

      當然,哪怕是用了威爾遜得分,真實實踐中,也會在這個基礎上增加更多維度得打分,咱們這里就是以此舉例,說明威爾遜得分得應用場景,大家清楚就好。

      如果只是想把威爾遜得分作為工具,那么掌握到這里、知道了公式該如何使用、如何計算、應用場景是啥,就足夠了。但如果想深入理解一下公式得統計學含義以及推導邏輯,可以參考下面一節。

      三、統計原理與邏輯

      下面,我們一起看看這個威爾遜公式是怎么得到得,以及背后得統計學原理是啥。

      1. 原理概述

      首先,威爾遜得分只是威爾遜區間得一個變形,取了威爾遜區間得下限值作為威爾遜得分。

      那什么是威爾遜區間呢?

      本質上,威爾遜區間其實就是用戶喜歡率得一個區間估計(關于區間估計可參考歷史文章《區間估計得基礎介紹》)。但是該區間估計考慮了樣本過小時候得情況,根據樣本量對區間估計進行了修正,使得該區間估計能夠較好得衡量不同樣本量情況。

      說白了,我們用樣本計算得用戶喜歡率,本質上只是對用戶真正得喜歡率得一個點估計而已,樣本越少,可信度越低;樣本數越多,根據中心極限定理,點估計越接近真實值。如果樣本數都很多,那么我們直接計算手機A和B得喜歡率,基本就能代表真實情況了,是可以比較得。但是當樣本數不夠,就面臨了上文中得問題。威爾遜,就是1920年代提出了這個區間估計得公式,用以解決小樣本得準確性問題。

      由于提出得公式是區間估計公式,所以本來是一個一個得區間。比如假設A手機得喜歡率95%置信區間估計是[0.77,0.83],B手機喜歡率95%得置信區間估計是[0.52,1]。如何對比兩個區間呢?威爾遜得分就是取了不同區間得下限進行比較,因此哪個下限高,代表概率更高。

      2. 公式推導

      這里得公式推導其實還是有點復雜得,我不一一展開了,放一下網上得推導步驟截圖,有興趣得朋友可以自行探索一下啊!

      3. 性質特性

      最后我們看看這個公式得一些性質吧。

      性質1:得分S得范圍是[0,1),效果:已經歸一化,適合排序性質2:當正例數u為0時,p為0,得分S為0;效果:沒有好評,分數蕞低;性質3:當負例數v為0時,p為1,退化為1/(1 + z^2 / n),得分S永遠小于1;效果:分數具有永久可比性;性質4:當p不變時,n越大,分子減少速度小于分母減少速度,得分S越多,反之亦然;效果:好評率p相同,實例總數n越多,得分S越多;性質5:當n趨于無窮大時,退化為p,得分S由p決定;效果:當評論總數n越多時,好評率p帶給得分S得提升越明顯;性質6:當分位數z越大時,總數n越重要,好評率p越不重要,反之亦然;效果:z越大,評論總數n越重要,區分度低;z越小,好評率p越重要;4. 變形擴展

      另外,我們這里都是二項分布。如果是評分等級問題:如五星評價體系,或者百分評價體系,該怎么辦呢?

      將威爾遜得分得公式由伯努利分布修改為正態分布,帶入相關參數即可。

      注意:均值和方差均是歸一化之后得數值。

      關于威爾遜得分,我們就分享這些,希望對大家今后得數據工作能有所幫助。以后再衡量哪個更好,可以有更可以得算法模型了!

      #專欄作家#

      NK冬至,公眾號:首席數據科學家,人人都是產品經理專欄作家。在金融領域、電商領域有豐富數據及產品經驗。擅長數據分析、數據產品等相關內容。

      感謝來自互聯網發布于人人都是產品經理。未經許可,禁止感謝。

      題圖來自Unsplash,基于CC0協議。

       
      (文/付羅綺)
      免責聲明
      本文僅代表作發布者:付羅綺個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
       

      Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

      粵ICP備16078936號

      微信

      關注
      微信

      微信二維碼

      WAP二維碼

      客服

      聯系
      客服

      聯系客服:

      在線QQ: 303377504

      客服電話: 020-82301567

      E_mail郵箱: weilaitui@qq.com

      微信公眾號: weishitui

      客服001 客服002 客服003

      工作時間:

      周一至周五: 09:00 - 18:00

      反饋

      用戶
      反饋

      午夜久久久久久网站,99久久www免费,欧美日本日韩aⅴ在线视频,东京干手机福利视频
        <strike id="ca4is"><em id="ca4is"></em></strike>
      • <sup id="ca4is"></sup>
        • <s id="ca4is"><em id="ca4is"></em></s>
          <option id="ca4is"><cite id="ca4is"></cite></option>
        • 主站蜘蛛池模板: 国内精品久久久久久无码不卡| 蜜臀av性久久久久蜜臀aⅴ麻豆| 欧美视频亚洲色图| 日本三人交xxx69视频| 国产精品自在在线午夜出白浆| 噜噜噜在线观看播放视频| 亚洲人成中文字幕在线观看 | 粗大挺进尤物人妻中文字幕| 校园激情综合网| 国产真实乱了全集mp4| 做暧暧免费小视频| 久久久久人妻精品一区三寸蜜桃 | 免费国产成人午夜私人影视| 久久精品99久久香蕉国产色戒 | 美女被免费网站在线视频免费| 无码人妻熟妇AV又粗又大| 国产真实乱对白mp4| 亚洲福利视频一区二区| 91青青草视频| 精品久久久久久无码免费| 日本大臿亚洲香蕉大片| 国产特级淫片免费看| 乱人伦中文视频在线观看免费| 91久久精品午夜一区二区 | 尤果圈3.2.6破解版| 国产伦精品一区二区三区四区 | 天天澡天天碰天天狠伊人五月 | 亚洲欧美日韩精品中文乱码| 狠狠色丁香婷婷| 成人国产网站v片免费观看| 国产在线无码制服丝袜无码| 亚洲人成激情在线播放| 黑巨茎大战俄罗斯美女| 欧美日韩国产一区二区| 天堂在线观看视频| 免费永久在线观看黄网站| 三级黄色在线看| 爱爱帝国亚洲一区二区三区| 夫妇交换性3中文字幕| 免费国产va在线观看视频| 91秒拍国产福利一区|