你是否经常听见朋友、同事或者新闻里提到ROC?那它到底是什么呢?
ROC(Receiver Operating Characteristic Curve),中文名为接受者操作特征曲线,是一种图形化展示分类器的评价工具。ROC曲线的横坐标是假阳性率(FPR),表示实际为负但被预测为正的样本所占的比例。ROC曲线的纵坐标是真阳性率(TPR),也就是召回率,表示实际为正且被分类器正确预测为正的样本所占的比例。
ROC曲线的绘制和AUC值的计算能给一个分类器的性能带来较全面的评价,尤其在费用敏感或者罕见事件预测中有着重要的应用。除此之外,ROC还有广泛的应用领域,如医学诊断和信号检测等领域。
DOB(Cohen, 1977)提出,ROC曲线是判定理论的重要组成部分。ROC曲线有很重要的意义是它能同时显示一个模型的敏感度和特异度。通常使用ROC曲线面积AUC(Area Under Roc Curve)作为评估分类器性能的量度,AUC值是模型评估中一个重要的标准,它的意义在于任意取出两个样本,放回两个样本到数据集中,其中一个样本分类正确,另外一个样本分类错误,分类器预测正确的机率大于随机猜测的机率,即可认为它是一个合理的分类器。