为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

关于混淆矩阵

2017-09-26 3页 doc 24KB 44阅读

用户头像

is_954223

暂无简介

举报
关于混淆矩阵关于混淆矩阵 , 关于混淆矩阵 混淆矩阵是用来反映某一个分类模型的分类结果的,其中行代表的是真实的类,列代表的是模型的分类。 如下图,模型(a)中 数据集的真实情况是: a类有100个,b类有60个,c类有40个。 模型的结果为: 被分为a类的有120个,被分为b类的有60个,被分为c类的有20个。 每个行列的含义是: 第一行:a类的100个实例中,有88个被分为a类,有10个被分为b类, 2个被分为c类。 有 第二行:b类的60个实例中,有14个被分为a类,有40个被分为b类, 6个被分为c类。 有 其余的以...
关于混淆矩阵
关于混淆矩阵 , 关于混淆矩阵 混淆矩阵是用来反映某一个分类模型的分类结果的,其中行代表的是真实的类,列代表的是模型的分类。 如下图,模型(a)中 数据集的真实情况是: a类有100个,b类有60个,c类有40个。 模型的结果为: 被分为a类的有120个,被分为b类的有60个,被分为c类的有20个。 每个行列的含义是: 第一行:a类的100个实例中,有88个被分为a类,有10个被分为b类, 2个被分为c类。 有 第二行:b类的60个实例中,有14个被分为a类,有40个被分为b类, 6个被分为c类。 有 其余的以此类推。 这样一来每个混淆矩阵的主对角线就是被正确分类的实例,如88,40,12。 例如下面的题: 共和党 民主党 无党派 共和党 42 2 1 民主党 5 40 3 无党派 0 3 4 (1) 分类的正确率和错误率分别是多少? 正确率:(42+40+4)/(42+2+1+5+40+3+0+3+4)=86 / 100 = 86% 错误率:1-86%=14% (2) 参议院中分别有几名民主党、几名共和党,几名无党派议员? 5+40+3=48 民主: 共和:42+2+1=45 无党:0+3+4=7 (3) 有几名共和党人士被分类到民主党,有几名无党派人士被分类到共和党? 2个(第“共和党”行第“民主党”列)。 0个(第“无党派”行第“共和党”列)。 , 关于lift值 lift值的应用:举例来说,如果一个公司对某一个群体进行发传单宣传。假 ,其中响应(做出回应)的人有1000人,现在构造一个模型,这设有10000人 个模型的执行结果是,选出来4000人,这4000人中有800人是响应(做出回应)的。这样: 最初的比例是:1000 / 10000 = 0.1 模型计算后的比例为:800 / 4000 = 0.5 那么lift值为:lift = 0.5 / 0.1 = 5 Lift值是衡量模型好坏的一个指标,其含义是人群响应比提高的倍数。 例如下面的题: 考虑下面混淆矩阵,分别计算模型X与模型Y的Lift,比较哪个模型更好,为什么, 模型X 计算接受 计算拒绝 模型Y 计算接受 计算拒绝 接受 46 54 接受 45 55 拒绝 2245 7655 拒绝 1955 7945 思考方向:Lift的值是“模型计算后的响应比例”和“计算前的响应比例” 的比值,所以只要计算前后的响应比例就可以了。 解: 对于模型X: 计算前的响应比例是:(46+54)/(46+54+2245+7655)=100 / 10000 = 0.01 计算后的响应比例为:46 /(2245+46)= 0.0200786 = 0.02(使用的是计算接受的 一列) lift值为:Lift(X)=0.02 / 0.01 = 2 同理,对于模型Y的Lift值为: Lift(Y) = [45 / (45+1955)] / [(45+55) / (45+55+1955+7945)] = 0.0225 / 0.01 = 2.25 因为Lift(X) < Lift(Y) 所以模型Y比模型X好。
/
本文档为【关于混淆矩阵】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索