Perceptual Evaluation of Speech Quality (PESQ)【转载】

PESQ的評價方法是以一系列的ITU-T標準為基礎，為一套自動化客觀評價語音品質的標準，其目的

是以客觀儀器的量測來取代過往的陪審團制度，以減少語音評價時的曠日費時。目前就寬頻的網

路環境而言，ITU-T Recommendation P.862搭配P.862.2為最常被應用的標準。現今PESQ已為全球

工業界，包括通訊相關周邊產品、電話製造商及網通設備供應商等經常應用來評價語音品質的

方法。

PESQ的基本計算概述

PESQ基本上就是比較”原始的輸入訊號”及通過DUT後”降等的輸出訊號”之間的差異。

而PESQ量測的結果即為將”理想的語音模型”及”真實輸出的語音訊號”之間的差異以

MOS的評分法來量化，可一定程度代表主觀聆聽測驗的結果。

簡單來說，PESQ的計算是經由以下幾個步驟來達成:

1. 時序上對應(Time alignment)

2. 訊號強度相對於標準訊號強度間的對應(Level alignment to a calibrated listening level)

3. 時間域及頻率域之間的對應關係(Time-frequency mapping)

4. 頻偏(Frequency warping)

5. 壓縮訊號的響度計算(Compressive loudness scaling)The calculation of PESQ is achieved in several stages

主要的參考標準

下表所列即為評價PESQ時採用的主要標準，而以ITU-T Recommendation P.862.2最常被

應用，其為ITU-T Recommendation P.862針對寬頻語音網路及編碼的延伸標準。

測試內容

依據ITU-T Recommendation P.862的標準，PESQ測試時所採用的語音訊號必須包括以下幾類

來源: 5種主要國際語言(英文、西班牙文、中文、法文、印度文)、 2種性別(男、女)、各4段

不同的語音段落，所以共有至少40個訊號必須測試。

如何評分?

PESQ使用Mean Opinion Score (MOS)來評價語音品質。MOS是以5分制來表示，如下表左方

所示，1分即為最差分數，而5分即為最佳分數。MOS的分數來自於各類語音訊號量測結果

的算術平均數。以統計上來說，如下表右方所示，若MOS超過4分，大部分的使用者會覺

得滿意或非常滿意。

影響PESQ分數的因子

以下幾類因子均會影響PESQ評價的分數，包括有:

1. 編碼的失真(Codec distortion)

2. 封包延遲及損失(Packet delay and loss)

3. Jitter延遲

4. 量測時環境的背景噪音

5. 其它…

而貝爾聲學的量測主要是在假設網路品質完美: 即無任何封包損失、延遲不變、及無背景

噪音干擾的狀況下進行。當然，若您想要知道DUT在經過品質較差的網路時，語音訊號被

干擾的情況，貝爾聲學亦提供模擬網路品質相關的量測服務。

聯絡貝爾

若您對這類服務有興趣或想得到更多的參考資訊，可透過電子郵件或電話的方式的聯絡貝爾:

電子郵件: sales@pal-acoustics.com

電話: 886-2-26272515

来源： PAL Acoustics Technology 貝爾聲學科技

日	一	二	三	四	五	六
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29

Perceptual Evaluation of Speech Quality (PESQ)【转载】

米鹿π

发表回复取消回复

米鹿π

You May Also Like

kamailio NAT后配置公网IP

Jitter Buffer for Voice over IP【转载】

发表回复 取消回复

发表回复取消回复