It's Time to Retire PSNR
Vi实际上,所有视频质量指标的专家都认为峰值信噪比(PSNR)指标不能很好地预测主观质量. Yet, PSNR比较包含在几乎所有的编解码器比较中, 最近在优秀的IEEE白皮书中, "客观与主观评价VVC、HEVC和AV1的比较.“是时候让PSNR退休了,至少对于这些类型的分析来说是这样.
当我开始回顾时,我再次想起了PSNR的糟糕表现 ITU- t Rec新视频质量指标的测试结果. P.1204. Taking a step back, 百家乐软件app最新版下载使用视频质量指标的原因是为了帮助做出编码决策,从而提高主观质量. For this reason, 对于任何指标来说,最关键的性能特征是它预测人眼对同一视频的评价有多准确.
为了评估这一点,研究人员汇编了视频数据库和来自多个观众的主观评分. 然后,他们用度量标准对分数进行评分,并将这些分数与同一视频的主观分数进行比较. You can see three such comparisons in the graphic; on the left for P.1204.3、中间为PSNR,右边为 视频多方法评估融合(VMAF). In all three, the 纵轴表示主观评分的结果, 而横轴是度量分数.
![](http://dzceab466r34n.cloudfront.net/Images/ArticleImages/InlineImages/133073-producersviewchart2-ORG.png)
如果度量分数与主观评分完全匹配, 你会看到一条实线,从左下角到右上方. 没有一个度量是完美的,所以你永远不会看到一条实线. However, 这条线周围的数据点越密集, 预测越准确. Looking at the graphs, P.1204.3 is the 最准确,VMAF次之,PSNR次之 least by far. 你可以看到一个类似的图表 SSIMPLUS.
图形中的模式由每个数据集的Pearson相关系数(PCC)验证. 简而言之,PCC测量两个变量:X和Y之间的线性相关性. 根据Statistics Solutions,“如果系数值在±0之间.50 and ± 1, 那么我们就说这是一个很强的相关性." So 尽管PSNR图看起来是随机的, 数学家会说这种相关性很强. 然而,当VMAF、SSIMPLUS和P等更准确的指标出现时.1204是可用的,PSNR作为质量的衡量是浪费时间和空间.
有趣的是,PSNR有一个“煤矿里的金丝雀”实用程序,它可以识别VMAF的黑客方法. That is, 像预编码锐化和对比度调整这样的黑客技术可以使VMAF分数飙升, 但也会将PSNR分数发送到地板上. 如果你看到VMAF分数过高, 你应该运行一个快速的PSNR测试来验证入侵. 然而,就连这种使用也在逐渐减少,因为Netflix最近推出了一款 no-hacking model 所有编解码器测试人员都应该探索.
请关注更多关于P的信息.1204.3, 哪一种“无参考”指标可以在不将编码文件与源文件进行比较的情况下计算分数. 这使得它比全参考指标(如PSNR和VMAF)方便得多. If P.1204.3找到了像FFmpeg和莫斯科国立大学视频质量测量工具这样的工具, 这将为从编解码器比较中去掉PSNR提供更大的理由.
Related Articles
Jan Ozer讨论了三个关键目标质量度量工具的优缺点, SSIMplus, and Hybrik (Dolby).
04 May 2020
平均分数可能具有欺骗性, 因此,请确保您使用的工具可以更准确地评估您的视频质量
10 Feb 2020
泰克应用工程师Andrew Scott在流媒体西部2018年的演讲中讨论了图像质量测量的客观和主观方法和工具.
19 Apr 2019