召回率 准确率 召回率f值 是什么指标

假设原始样本中有两类,其中:&
1:总共有 P个类别为1的样本,假设类别1为正例。&
2:总共有N个类别为0 的样本,假设类别0为负例。&
经过分类后:
3:有 TP个类别为1 的样本被系统正确判定为类别1,FN 个类别为1 的样本被系统误判定为类别 0,显然有P=TP+FN;&
4:有 FP 个类别为0 的样本被系统误判断定为类别1,TN 个类别为0 的样本被系统正确判为类别 0,显然有N=FP+TN;&
精确度(Precision):
P = TP/(TP+FP) ;&&反映了被分类器判定的正例中真正的正例样本的比重
准确率(Accuracy)
A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP + TN);&&&&反映了分类器统对整个样本的判定能力——能将正的判定为正,负的判定为负&
召回率(Recall),也称为 True Positive Rate:
R = TP/(TP+FN) = 1 - FN/T;&&反映了被正确判定的正例占总的正例的比重&
转移性(Specificity,不知道这个翻译对不对,这个指标用的也不多),也称为 True NegativeRate&
S = TN/(TN + FP) = 1 – FP/N;&&&明显的这个和召回率是对应的指标,只是用它在衡量类别0
的判定能力。&
F-measure or balanced F-score
F = 2 *&&召回率
*&&准确率/ (召回率+准确率);这就是传统上通常说的F1 measure,另外还有一些别的F
measure,可以参考下面的链接&
上面这些介绍可以参考:&
.cn/s/blog_01czyo.html
同时,也可以看看:
&&相关文章推荐
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:1757次
排名:千里之外
(2)(2)(1)(3)(4)(1)(1)
(window.slotbydup = window.slotbydup || []).push({
id: '4740881',
container: s,
size: '200,200',
display: 'inlay-fix'机器学习(5)
一直总是听说过这几个词,但是很容易记混,在这里记录一下。希望对大家理解有帮助。
首先来做一个总结:
精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。
召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。
用公式表达如下:
上面还是有点抽象,下面通过例子来解释一下上面说法:
准确率(P值)
假设我此时想吃香蕉,实验室里面每天都会安排10个水果,水果种类分别是6个香蕉,3个橘子,1个菠萝。哎,但是,实验室主任搞事情啊,为了提高我们吃水果的动力与趣味,告诉我们10个水果放在黑盒子中,每个人是看不到自己拿的什么,每次拿5个出来,哎,我去抽了,抽出了2个香蕉,2个橘子,1个菠萝。
下面我们来分别求求P值,R值,F值,哈哈!
按照一开始说的,精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。
这里我们的正样本就是我想吃的香蕉!
在预测结果中,有2个香蕉,总个数是我拿的5个,那么P值计算如下:
召回率(R值)
按照开始总结所说。
召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。
我们这里的正类是我想吃的香蕉,而在样本中的香蕉个数是6个,召回率的召回也可以这么理解,代表了,原始样本中正类召回了多少。R值计算如下:
分母已经变成了样本中香蕉的个数啦
可能很多人就会问了,有了召回率和准去率这俩个评价指标后,不就非常好了,为什么要有F值这个评价量的存在呢?
按照高中语文老师所说的,存在即合理的说法,既然F值存在了,那么一定有它存在的必要性,哈哈哈哈!
我们在评价的时候,当然是希望检索结果Precision越高越好,同时Recall也越高越好,但事实上这两者在某些情况下有矛盾的。
比如极端情况下,在我们这个例子中,我们只搜索出了一个结果,且是香蕉,那么Precision就是100%,但是Recall为1/6就很低;而如果我们抽取10个水果,那么比如Recall是100%,但是Precision为6/10,相对来说就会比较低。
因此P和R指标有时候会出现的矛盾的情况,这样就需要综合考虑他们,最常见的方法就是F-Measure,通过计算F值来评价一个指标!
我这里给出最常见的F1计算方法,如下:
F1 = (2*P*R)/(P+R)
F那么在我们这个例子中F1 = (2*2/5*2/6)/(2/5+2/6)(这里我就不算出来了,有这个形式,更加能体现公式特点!)
希望对大家理解有所帮助~
文章地址:
&&相关文章推荐
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:4091次
排名:千里之外
原创:12篇
(window.slotbydup = window.slotbydup || []).push({
id: '4740887',
container: s,
size: '250,250',
display: 'inlay-fix'博客访问: 130652
博文数量: 34
博客积分: 2015
博客等级: 大尉
技术积分: 327
注册时间:
IT168企业级官微
微信号:IT168qiye
系统架构师大会
微信号:SACC2013
分类: C/C++
正确率、召回率和F值是在鱼龙混杂的环境中,选出目标的重要评价指标。
&&&&&&& 不妨看看这些指标的定义先:
正确率 = 正确识别的个体总数 /& 识别出的个体总数
召回率 = 正确识别的个体总数 /& 测试集中存在的个体总数
F值& = 正确率 * 召回率 * 2 / (正确率 + 召回率)
&&&&&&& 不妨举这样一个例子:某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。Seaeagle撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标分别如下:
正确率 = 700 / (700 + 200 + 100) = 70%
召回率 = 700 / 1400 = 50%
F值 = 70% * 50% * 2 / (70% + 50%) = 58.3%
&&&&&&& 不妨看看如果Seaeagle把池子里的所有的鲤鱼、虾和鳖都一网打尽,这些指标又有何变化:
正确率 =&1400 / (1400 +&300 + 300) = 70%
召回率 =&1400 / 1400 = 100%
F值 = 70% * 100% * 2 / (70% + 100%) = 82.35%
&&&&&&& 由此可见,正确率是评估捕获的成果中目标成果所占得比例;召回率,顾名思义,就是从关注领域中,召回目标类别的比例;而F值,则是综合这二者指标的评估指标,用于综合反映整体的指标。
阅读(17237) | 评论(1) | 转发(1) |
相关热门文章
给主人留下些什么吧!~~
《召回率与准确率》:&&/?p=34
请登录后评论。【转】召回率&Recall、精确度Precision、准确率Accuracy、虚警、漏警等分类判定指标
&&根据自己的知识总结的,定义应该肯定对了,在某些表述方面可能有错误的地方。
假设原始样本中有两类,其中:&
1:总共有 P个类别为1的样本,假设类别1为正例。&
2:总共有N个类别为0 的样本,假设类别0为负例。&
经过分类后:3:有 TP个类别为1 的样本被系统正确判定为类别1,FN 个类别为1
的样本被系统误判定为类别 0,显然有P=TP+FN;&
4:有 FP 个类别为0 的样本被系统误判断定为类别1,TN 个类别为0 的样本被系统正确判为类别
0,显然有N=FP+TN;&
那么:精确度(Precision):
P = TP/(TP+FP) ;&
反映了被分类器判定的正例中真正的正例样本的比重(&
准确率(Accuracy)
A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP +
反映了分类器统对整个样本的判定能力——能将正的判定为正,负的判定为负&
召回率(Recall),也称为 True Positive Rate:
R = TP/(TP+FN) = 1 - FN/T;&
反映了被正确判定的正例占总的正例的比重&
转移性(Specificity,不知道这个翻译对不对,这个指标用的也不多),也称为 True
NegativeRate&
S = TN/(TN + FP) = 1 & FP/N;&&
明显的这个和召回率是对应的指标,只是用它在衡量类别0 的判定能力。&
F-measure or balanced F-score
F = 2 *& 召回率 *& 准确率/
(召回率+准确率);这就是传统上通常说的F1 measure,另外还有一些别的F
measure,可以参考下面的链接&
上面这些介绍可以参考:&
同时,也可以看看:
为什么会有这么多指标呢?&&&&&&&
这是因为模式分类和机器学习的需要。判断一个分类器对所用样本的分类能力或者在不同的应用场合时,需要有不同的指标。 当总共有个100
个样本(P+N=100)时,假如只有一个正例(P=1),那么只考虑精确度的话,不需要进行任何模型的训练,直接将所有测试样本判为正例,那么
99%,非常高了,但这并没有反映出模型真正的能力。另外在统计信号分析中,对不同类的判断结果的错误的惩罚是不一样的。举例而言,雷达收到100个来袭导弹的信号,其中只有
3个是真正的导弹信号,其余 97 个是敌方模拟的导弹信号。假如系统判断 98 个(97
个模拟信号加一个真正的导弹信号)信号都是模拟信号,那么Accuracy=98%,很高了,剩下两个是导弹信号,被截掉,这时Recall=2/3=66.67%,Precision=2/2=100%,Precision也很高。但剩下的那颗导弹就会造成灾害。&
因此在统计信号分析中,有另外两个指标来衡量分类器错误判断的后果:漏警概率(Missing
MA = FN/(TP + FN) = 1 & TP/T = 1 - R;&
反映有多少个正例被漏判了(我们这里就是真正的导弹信号被判断为模拟信号,可见MA此时为
33.33%,太高了)&
虚警概率(False Alarm)&
FA = FP / (TP + FP) = 1 &
P;反映被判为正例样本中,有多少个是负例。&
统计信号分析中,希望上述的两个错误概率尽量小。而对分类器的总的惩罚旧是上面两种错误分别加上惩罚因子的和:COST = Cma *MA
+ Cfa * FA。不同的场合、需要下,对不同的错误的惩罚也不一样的。像这里,我们自然希望对漏警的惩罚大,因此它的惩罚因子 Cma
& 个人观点:虽然上述指标之间可以互相转换,但在模式分类中,一般用 P、R、A 三个指标,不用MA和
FA。而且统计信号分析中,也很少看到用 R 的。如果有错误的地方,欢迎指出并改正
resource:&/lwhptl/item/c2da5a3c098e4ac6382ffa5f
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。1025人阅读
分类、推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure) /(F-score)
1、准确率与召回率(Precision & Recall)
准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中精度是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率;召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。
一般来说,Precision就是检索出来的条目(比如:文档、网页等)有多少是准确的,Recall就是所有准确的条目有多少被检索出来了。
正确率、召回率和 F 值是在鱼龙混杂的环境中,选出目标的重要评价指标。不妨看看这些指标的定义先:
& & 1.&正确率 = 提取出的正确信息条数 / &提取出的信息条数&& &&
& & 2. 召回率 = 提取出的正确信息条数 / &样本中的信息条数& &&
两者取值在0和1之间,数值越接近1,查准率或查全率就越高。&&&
& & 3. F值& = 正确率 * 召回率 * 2 / (正确率 + 召回率) (F 值即为正确率和召回率的调和平均值)
不妨举个例子:某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标分别如下:
正确率 = 700 / (700 + 200 + 100) = 70%
召回率 = 700 / 1400 = 50%
F值 = 70% * 50% * 2 / (70% + 50%) = 58.3%
不妨看看如果把池子里的所有的鲤鱼、虾和鳖都一网打尽,这些指标又有何变化:
正确率 =&1400 / (1400 +&300 + 300) = 70%
召回率 =&1400 / 1400 = 100%
F值 = 70% * 100% * 2 / (70% + 100%) = 82.35% & & & &
由此可见,正确率是评估捕获的成果中目标成果所占得比例;召回率,顾名思义,就是从关注领域中,召回目标类别的比例;而F值,则是综合这二者指标的评估指标,用于综合反映整体的指标。
当然希望检索结果Precision越高越好,同时Recall也越高越好,但事实上这两者在某些情况下有矛盾的。比如极端情况下,我们只搜索出了一个结果,且是准确的,那么Precision就是100%,但是Recall就很低;而如果我们把所有结果都返回,那么比如Recall是100%,但是Precision就会很低。因此在不同的场合中需要自己判断希望Precision比较高或是Recall比较高。如果是做实验研究,可以绘制Precision-Recall曲线来帮助分析。
2、综合评价指标(F-Measure)
P和R指标有时候会出现的矛盾的情况,这样就需要综合考虑他们,最常见的方法就是F-Measure(又称为F-Score)。
F-Measure是Precision和Recall加权调和平均:
当参数α=1时,就是最常见的F1,也即
可知F1综合了P和R的结果,当F1较高时则能说明试验方法比较有效。
准确率和召回率的取值范围都在[0,1],越高越好。
具体准确率和召回率的定义,见下图。
两者一般存在矛盾关系,不能都达到很高的值,所以定义F-score评价综合标准。
3、E值
E值表示查准率P和查全率R的加权平均值,当其中一个为0时,E值为1,其计算公式:
b越大,表示查准率的权重越大。
4、平均正确率(Average Precision, AP)
平均正确率表示不同查全率的点上的正确率的平均。
&&相关文章推荐
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:15931次
排名:千里之外
原创:18篇
转载:16篇
(3)(17)(9)(6)
(window.slotbydup = window.slotbydup || []).push({
id: '4740887',
container: s,
size: '250,250',
display: 'inlay-fix'

我要回帖

更多关于 python 准确率 召回率 的文章

 

随机推荐