Perceptual Evaluation of Speech Quality (PESQ)【转载】

PESQ的評價方法是以一系列的ITU-T標準為基礎,為一套自動化客觀評價語音品質的標準,其目的
是以客觀儀器的量測來取代過往的陪審團制度,以減少語音評價時的曠日費時。目前就寬頻的網
路環境而言,ITU-T Recommendation P.862搭配P.862.2為最常被應用的標準。現今PESQ已為全球
工業界,包括通訊相關周邊產品、電話製造商及網通設備供應商等經常應用來評價語音品質的
方法。
PESQ的基本計算概述
PESQ基本上就是比較”原始的輸入訊號”及通過DUT後”降等的輸出訊號”之間的差異。
而PESQ量測的結果即為將”理想的語音模型”及”真實輸出的語音訊號”之間的差異以
MOS的評分法來量化,可一定程度代表主觀聆聽測驗的結果。
簡單來說,PESQ的計算是經由以下幾個步驟來達成:
   1.     時序上對應(Time alignment)
   2.     訊號強度相對於標準訊號強度間的對應(Level alignment to a calibrated listening level)
   3.     時間域及頻率域之間的對應關係(Time-frequency mapping)
   4.     頻偏(Frequency warping)

5.   壓縮訊號的響度計算(Compressive loudness scaling)The calculation of PESQ is achieved in several stages

主要的參考標準
下表所列即為評價PESQ時採用的主要標準,而以ITU-T Recommendation P.862.2最常被
應用,其為ITU-T Recommendation P.862針對寬頻語音網路及編碼的延伸標準。
測試內容
依據ITU-T Recommendation P.862的標準,PESQ測試時所採用的語音訊號必須包括以下幾類
來源: 5種主要國際語言(英文、西班牙文、中文、法文、印度文)、 2種性別(男、女)、各4
不同的語音段落,所以共有至少40個訊號必須測試。
如何評分?
PESQ使用Mean Opinion Score (MOS)來評價語音品質。MOS是以5分制來表示,如下表左方
所示,1分即為最差分數,而5分即為最佳分數。MOS的分數來自於各類語音訊號量測結果
的算術平均數。以統計上來說,如下表右方所示,若MOS超過4分,大部分的使用者會覺
得滿意或非常滿意。
影響PESQ分數的因子
以下幾類因子均會影響PESQ評價的分數,包括有:

1. 編碼的失真(Codec distortion)

2. 封包延遲及損失(Packet delay and loss)

3. Jitter延遲

4. 量測時環境的背景噪音

5. 其它…

而貝爾聲學的量測主要是在假設網路品質完美: 即無任何封包損失、延遲不變、及無背景

噪音干擾的狀況下進行。當然,若您想要知道DUT在經過品質較差的網路時,語音訊號被

干擾的情況,貝爾聲學亦提供模擬網路品質相關的量測服務。
聯絡貝爾
若您對這類服務有興趣或想得到更多的參考資訊,可透過電子郵件或電話的方式的聯絡貝爾:
     電子郵件: sales@pal-acoustics.com

電話: 886-2-26272515

 

来源: PAL Acoustics Technology 貝爾聲學科技

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

Scroll to top