4个性能评价测度
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
VQEG 给出了评估视频质量评价模型性能的方法[36,37],主要是根据某些模型性能评估参数对客观模型得到的评分和主观质量评价的评分进行分析,从而评估模型的预测准确度和预测一致性。VQEG 给出的模型性能评估参数为:
♦ 均方根误差(Root Mean Square Error ,RMSE )
♦ Pearson 线性相关系数(Pearson Linear Correlation Coefficient )
♦ Spearman 秩相关系数(Spearman Rank Order Correlation Coefficient ) ♦ 背离率(Outlier Ratio ,OR )
设视频序列的总数为N ,S i 表示序列i 的主观质量评分,P i 表示其客观质量得分,下面是几个常用的评估参数的定义:
(1) 均方根误差
RMSE =均方根误差能够反映模型的预测准确度,均方根误差越小,说明模型的预测越准确;相反则误差越大,模型的预测越不准确。
(2) Pearson 线性相关系数
()()N
i i r S S P P C --=∑其中,P 为各序列客观评分P i 的均值,S 为各序列主观评分S i 的均值。 Pearson 线性相关系数能够反应模型的预测准确度。它是区间[-1, 1]上的值,其绝对值越接近于1,表明预测准确度越高。
(3) Spearman 秩相关系数
12
261(1)N i i s d C N N -==--∑
其中i i i S P d R R =-,其中i i S P R R 与分别表示S i 与P i 在各自评分组里面的名次
序号。这里的名次是指将N 个视频序列的主、客观评分分别按照一定的顺序,如从大到小或者从小到大,排列起来之后的序号。
Spearman 秩相关系数能够反映模型的预测单调性。它也是区间[-1, l]上的一个值,其绝对值越接近1,表明预测单调性越好。
(4) 背离率
OR num OR N
=
其中,OR num 表示所有客观评分满足22()i i MOS S P i σ->的个数,()MOS i σ表示
视频序列i 的主观质量评分的标准方差。
背离率能够反映模型的预测一致性。较小的OR 反映模型具有较好的预测稳定性。