关于混淆矩阵关于混淆矩阵
, 关于混淆矩阵
混淆矩阵是用来反映某一个分类模型的分类结果的,其中行代表的是真实的类,列代表的是模型的分类。
如下图,模型(a)中
数据集的真实情况是:
a类有100个,b类有60个,c类有40个。
模型的结果为:
被分为a类的有120个,被分为b类的有60个,被分为c类的有20个。 每个行列的含义是:
第一行:a类的100个实例中,有88个被分为a类,有10个被分为b类,
2个被分为c类。 有
第二行:b类的60个实例中,有14个被分为a类,有40个被分为b类,
6个被分为c类。 有
其余的以...
关于混淆矩阵
, 关于混淆矩阵
混淆矩阵是用来反映某一个分类模型的分类结果的,其中行代表的是真实的类,列代表的是模型的分类。
如下图,模型(a)中
数据集的真实情况是:
a类有100个,b类有60个,c类有40个。
模型的结果为:
被分为a类的有120个,被分为b类的有60个,被分为c类的有20个。 每个行列的含义是:
第一行:a类的100个实例中,有88个被分为a类,有10个被分为b类,
2个被分为c类。 有
第二行:b类的60个实例中,有14个被分为a类,有40个被分为b类,
6个被分为c类。 有
其余的以此类推。
这样一来每个混淆矩阵的主对角线就是被正确分类的实例,如88,40,12。
例如下面的题:
共和党 民主党 无党派 共和党 42 2 1 民主党 5 40 3 无党派 0 3 4 (1) 分类的正确率和错误率分别是多少?
正确率:(42+40+4)/(42+2+1+5+40+3+0+3+4)=86 / 100 = 86%
错误率:1-86%=14%
(2) 参议院中分别有几名民主党、几名共和党,几名无党派议员?
5+40+3=48 民主:
共和:42+2+1=45
无党:0+3+4=7
(3) 有几名共和党人士被分类到民主党,有几名无党派人士被分类到共和党?
2个(第“共和党”行第“民主党”列)。
0个(第“无党派”行第“共和党”列)。
, 关于lift值
lift值的应用:举例来说,如果一个公司对某一个群体进行发传单宣传。假
,其中响应(做出回应)的人有1000人,现在构造一个模型,这设有10000人
个模型的执行结果是,选出来4000人,这4000人中有800人是响应(做出回应)的。这样:
最初的比例是:1000 / 10000 = 0.1
模型计算后的比例为:800 / 4000 = 0.5
那么lift值为:lift = 0.5 / 0.1 = 5
Lift值是衡量模型好坏的一个指标,其含义是人群响应比提高的倍数。 例如下面的题:
考虑下面混淆矩阵,分别计算模型X与模型Y的Lift,比较哪个模型更好,为什么,
模型X 计算接受 计算拒绝 模型Y 计算接受 计算拒绝 接受 46 54 接受 45 55 拒绝 2245 7655 拒绝 1955 7945
思考方向:Lift的值是“模型计算后的响应比例”和“计算前的响应比例”
的比值,所以只要计算前后的响应比例就可以了。
解:
对于模型X:
计算前的响应比例是:(46+54)/(46+54+2245+7655)=100 / 10000 = 0.01 计算后的响应比例为:46 /(2245+46)= 0.0200786 = 0.02(使用的是计算接受的
一列)
lift值为:Lift(X)=0.02 / 0.01 = 2
同理,对于模型Y的Lift值为:
Lift(Y) = [45 / (45+1955)] / [(45+55) / (45+55+1955+7945)]
= 0.0225 / 0.01
= 2.25
因为Lift(X) < Lift(Y)
所以模型Y比模型X好。
本文档为【关于混淆矩阵】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。