接收者操作特征曲线

                     

贡献者: xzllxls

预备知识 分类,模型评估,混淆矩阵

   接收者操作特征曲线(Receiver operating characteristic curve, ROC)是一种用于评价二分类器的分类性能的图表。该方法来源于信号检测论,是在第二次世界大战中,由电子信号工程师发明的。在心理学领域中也有广泛应用。

   曲线中点的坐标是真阳率(True positive rate, TPR)和假阳率(False positive rate, FPR)。随着分类器阈值的变化,真阳率和假阳率分别随之改变,由此产生一系列的点,然后将相邻两点连接起来,即构成接收者操作特征曲线。

图
图 1:ROC 示意图

   上图中蓝色曲线即为 ROC 曲线。横坐标为假阳率,纵坐标为真阳率。红色对角线表示一个完全随机分类器的 ROC 曲线。如果一个分类器的 ROC 曲线大体在红色虚线的上方,则表示性能优于随机分类器。

   ROC 曲线分析可以帮助我们做模型选择,选择最优模型,抛弃次优模型。曲线下面积(Aera under curve, AUC)是 ROC 曲线最基本的评估指标,顾名思义,表示的是曲线下方,横轴上方的面积。通常把整图的面积定义为 1,则 AUC 的值在 $0$ 和 $1$ 之间。该面积值越大,则表示分类模型效果越好;反之,则越差。


致读者: 小时百科一直以来坚持所有内容免费,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 10 元,我们一个星期内就能脱离亏损, 并保证在接下来的一整年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。

                     

友情链接: 超理论坛 | ©小时科技 保留一切权利