Author: Kelan Kuang
Email: kuangkelan@mail.ioa.ac.cn
音频文件质量主观评价测试
感谢参加本次音频文件主观测试。本次测试分为两个部分,首先是对来自不同系统的同一条语音进行打分(mean opinion score;MOS);接着受试者需要从两条对比的语音中选择质量更好的一条(paired comparison test)。这两部分测试的具体内容会在每一部分测试的开始进行具体介绍。
MOS
基准语音 | 1分 | 2分 | 3-4分 | 5分 |
请你对以下语音的可懂度进行打分,打分范围是1-5。其中5分表示语音可懂度很高,主观上完全可以接受,语音完全不刺耳。4分表示对语音的接受程度降低,但不反感该语音。3分表示可以感知到此语音的瑕疵,如电音等刺耳瑕疵。2分表示该语音的刺耳瑕疵非常明显。1分表示完全无法接受该语音且非常反感。我们给出了1分与5分的语音作为参考,你只需要聆听这些语音以获得语音质量的直观感受。请您以这两条语音作为基准,对以下语音样本进行打分。需要说明的是本次测试是为了对语音质量以及可懂度而非语音的内容进行评判,某些语音的口音可能比较重,请您忽略口音相关的问题。下面的每一个Group,例如Group1,包含来自4个不同的语音增强系统(s1-s4)的输出语音,请在评分后将分数记录在对应的Excel表格中。
极低信噪比:
Group1 | s1 | s2 | s3 | s4 |
Group2 | s1 | s2 | s3 | s4 |
Group3 | s1 | s2 | s3 | s4 |
Group4 | s1 | s2 | s3 | s4 |
Group5 | s1 | s2 | s3 | s4 |
Group6 | s1 | s2 | s3 | s4 |
Group7 | s1 | s2 | s3 | s4 |
低信噪比:
Group8 | s1 | s2 | s3 | s4 |
Group9 | s1 | s2 | s3 | s4 |
Group10 | s1 | s2 | s3 | s4 |
Group11 | s1 | s2 | s3 | s4 |
Group12 | s1 | s2 | s3 | s4 |
Group13 | s1 | s2 | s3 | s4 |
Group14 | s1 | s2 | s3 | s4 |
中信噪比:
Group15 | s1 | s2 | s3 | s4 |
Group16 | s1 | s2 | s3 | s4 |
Group17 | s1 | s2 | s3 | s4 |
Group18 | s1 | s2 | s3 | s4 |
Group19 | s1 | s2 | s3 | s4 |
Group20 | s1 | s2 | s3 | s4 |
Group21 | s1 | s2 | s3 | s4 |
高信噪比:
Group22 | s1 | s2 | s3 | s4 |
Group23 | s1 | s2 | s3 | s4 |
Group24 | s1 | s2 | s3 | s4 |
Group25 | s1 | s2 | s3 | s4 |
Group26 | s1 | s2 | s3 | s4 |
Group27 | s1 | s2 | s3 | s4 |
Group28 | s1 | s2 | s3 | s4 |