博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
准确率和召回率
阅读量:6080 次
发布时间:2019-06-20

本文共 883 字,大约阅读时间需要 2 分钟。

hot3.png

在、推荐系统、信息检索、自然语言处理、多媒体视觉等领域,经常会用到准确率(precision)、召回率(recall)、F-measure、F1-score 来评价的准确性。

一、准确率和召回率(P&R)

以文本检索为例,先看下图

 

其中,黑框表示检索域,我们从中检索与目标文本相关性大的项。图中黄色部分(A+B)表示检索域中与目标文本先关性高的项,图中

A+C部分表示你的算法检索出的项。A、B、C的含义图中英文标出。

准确率:

召回率:

一般来说,准确率表示你的算法检索出来的有多少是正确的,召回率表示所有准确的条目中有多少被检索出来。

准确率和召回率的关系

通常,我们希望准确率和召回率均越高越好,但事实上这两者在某些情况下是矛盾的。比如我们只搜出了一个结果,此结果是正确的,求得precisin等于1。但是由于只搜出一个结果,recall值反而很低,接近于0。所以需要综合考量,下面介绍F-measure。

二、F-measure

F-measure又称F-score,其公式为:

其中F2值,更加注重召回率;F0.5值更加重视准确率。

当beta=1时,就是F1-score:

F-measure综合了precision和recall,其值越高,通常表示算法性能越好。

三、Average_precision(AP)

平均正确率(AP):对不同召回率点上的正确率进行平均。

(1)未插值的AP:某个查询Q共有6个相关结果,某系统排序返回的文档中,其中相关文档有5篇,其位置分别是第1,第2,第5,第10,第20位,则AP=(1/1+2/2+3/5+4/10+5/20+0)/6

(2)插值的AP:在召回率分别为0,0.1,0.2,...,1.0的十一个点上的正确率求平均,等价于11点平均。

(3)只对返回的相关文档进行计算的AP,AP=(1/1+2/2+3/5+4/10+5/20)/5,倾向于那些快速返回结果的系统,没有考虑召回率。

AP形式化公式请参考:

转载于:https://my.oschina.net/u/3305280/blog/852274

你可能感兴趣的文章
需求的陷阱
查看>>
系统架构简单图解
查看>>
浅谈加密技术
查看>>
centOS7下安装GUI图形界面
查看>>
一张图透析阿里云API应用创新大赛
查看>>
sql重复行求和
查看>>
Microsoft Dynamics CRM 2013 and 2011 Update Rollups and Service Packs
查看>>
transient的理解
查看>>
python中if __name__ == '__main__': 介绍
查看>>
HackRF实现无线门铃信号分析重放
查看>>
Windows源码安装PyTorch 0.4
查看>>
AI开发者福音!阿里云推出国内首个基于英伟达NGC的GPU优化容器
查看>>
CentOS6安装和配置rsync
查看>>
在真机里安装 ubuntu 14.04和一些常用的软件(二)
查看>>
python2.6升级到2.7
查看>>
Unity SLua 如何调用Unity中C#方法
查看>>
MyBatis排序时使用order by 动态参数时需要注意,用$而不是#
查看>>
linux基础命令-查看系统状态-free -m以及top命令详解
查看>>
动态代理
查看>>
批量删除redis key
查看>>