PESQ的評價方法是以一系列的ITU-T標準為基礎,為一套自動化客觀評價語音品質的標準,其目的
是以客觀儀器的量測來取代過往的陪審團制度,以減少語音評價時的曠日費時。目前就寬頻的網
路環境而言,ITU-T Recommendation P.862搭配P.862.2為最常被應用的標準。現今PESQ已為全球
工業界,包括通訊相關周邊產品、電話製造商及網通設備供應商等經常應用來評價語音品質的
方法。
PESQ的基本計算概述
PESQ基本上就是比較”原始的輸入訊號”及通過DUT後”降等的輸出訊號”之間的差異。
而PESQ量測的結果即為將”理想的語音模型”及”真實輸出的語音訊號”之間的差異以
MOS的評分法來量化,可一定程度代表主觀聆聽測驗的結果。
簡單來說,PESQ的計算是經由以下幾個步驟來達成:
1. 時序上對應(Time alignment)
2. 訊號強度相對於標準訊號強度間的對應(Level alignment to a calibrated listening level)
3. 時間域及頻率域之間的對應關係(Time-frequency mapping)
4. 頻偏(Frequency warping)
5. 壓縮訊號的響度計算(Compressive loudness scaling)The calculation of PESQ is achieved in several stages
主要的參考標準
下表所列即為評價PESQ時採用的主要標準,而以ITU-T Recommendation P.862.2最常被
應用,其為ITU-T Recommendation P.862針對寬頻語音網路及編碼的延伸標準。
測試內容
依據ITU-T Recommendation P.862的標準,PESQ測試時所採用的語音訊號必須包括以下幾類
來源: 5種主要國際語言(英文、西班牙文、中文、法文、印度文)、 2種性別(男、女)、各4段
不同的語音段落,所以共有至少40個訊號必須測試。
如何評分?
PESQ使用Mean Opinion Score (MOS)來評價語音品質。MOS是以5分制來表示,如下表左方
所示,1分即為最差分數,而5分即為最佳分數。MOS的分數來自於各類語音訊號量測結果
的算術平均數。以統計上來說,如下表右方所示,若MOS超過4分,大部分的使用者會覺
得滿意或非常滿意。
影響PESQ分數的因子
以下幾類因子均會影響PESQ評價的分數,包括有:
1. 編碼的失真(Codec distortion)
2. 封包延遲及損失(Packet delay and loss)
3. Jitter延遲
4. 量測時環境的背景噪音
5. 其它…
而貝爾聲學的量測主要是在假設網路品質完美: 即無任何封包損失、延遲不變、及無背景
噪音干擾的狀況下進行。當然,若您想要知道DUT在經過品質較差的網路時,語音訊號被
干擾的情況,貝爾聲學亦提供模擬網路品質相關的量測服務。
聯絡貝爾