介绍
wilson-rate 是一个用于计算二分类样本中正类占比的 npm 包,可以基于一定置信度得到该占比的置信区间。该包基于 Wilson Score interval 算法实现,常用于用户评价中的好评率计算。
安装
通过 npm 可以简单地安装该包:
npm install wilson-rate
使用
该包的使用非常简单。首先,你需要导入该包:
const wilsonRate = require('wilson-rate');
然后,调用 wilsonRate(positive, total, confidence)
函数即可得到正类占比以及置信区间:
const data = wilsonRate(100, 500, 0.95); console.log(`正类占比为 ${data.rate},置信区间为 (${data.lower}, ${data.upper})`);
其中,positive
表示正类数量,total
表示样本总量,confidence
表示置信度。该函数的返回值是一个对象,包含 rate
、 lower
和 upper
三个属性,分别表示正类占比、置信区间下界和置信区间上界。
如果你需要进行多次计算,建议将置信度提前计算好,避免重复计算,提升性能:
const wilsonScore = require('wilson-score'); const confidence = wilsonScore(0.95); const data1 = wilsonRate(20, 100, confidence); const data2 = wilsonRate(30, 100, confidence); console.log(`正类占比为 ${data1.rate},置信区间为 (${data1.lower}, ${data1.upper})`); console.log(`正类占比为 ${data2.rate},置信区间为 (${data2.lower}, ${data2.upper})`);
示例
下面给出一个使用 wilson-rate
计算好评率的简单示例。
HTML 代码
-- -------------------- ---- ------- --------- ----- ------ ------ -------------------- ------- ------ ----- -------------- -------------------------------- ------ ------ ------------------------- ------ ------------- ------------ ---------- ----------------- ------ --------------------------- ------ ------------- --------------- ------------- ----------------- ------- ---------------------------- ------- -- ---------------- ------ ------- -------------------------------------------------------------------------------- -------- ----- ---- - ------------------------------- ----- ------ - ---------------------------------- ----- ---------- - ----------------- ------------------------------- ------- -- - ----------------------- ----- ----- - ------------------------------------------------- ----- -------- - ---------------------------------------------------- ----- ---- - -------------------- ------ ------------ ---------------- - ----- ----------------------------- -------------------------- ---------------------------- --- --------- ------- -------
效果
总结
wilson-rate
是一个十分实用的 npm 包,可用于计算样本中正类占比的置信区间,是前端开发者进行用户评价数据分析的一项必备工具,也是学习计算机科学中置信区间算法的好例子。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/6006710f8dd3466f61ffe2a5