Punteggio di opinione medio

Un punteggio di opinione medio ( Punteggio medio di opinione (in) - MOS in abbreviazione) è un punteggio assegnato a un codec audio per caratterizzare la qualità della riproduzione del suono. Il voto può variare tra 1 (pessimo) e 5 (ottimo, paragonabile alla versione originale). È definito dall'ITU-T nello standard "P.800: Metodi di valutazione soggettiva per la qualità della trasmissione".

Perché il MOS

Esiste un numero enorme di codec audio diversi, basati su algoritmi di compressione radicalmente diversi. Ci sono generalmente tre famiglie:

codec senza perdita di dati. Sono usati raramente in telefonia perché non consentono di ottenere un buon rapporto di compressione;
codificatori di segnale. Si tratta di algoritmi con perdita di informazioni che non fanno particolari presupposti sulla natura del segnale sonoro o sul linguaggio utilizzato. Esempi: compressione logaritmica (ITU-T G.711 ), ADPCM differenziale (ITU-T G.726 ), AMR-WB adattivo (ITU-T G.722.2 ), MPEG layer 3;
codificatori ottimizzati per la voce o vocoder . Di solito si basano su un sintetizzatore vocale di dizionario finito o una previsione lineare (ACELP). Il principio della codifica di codec di dizionario finiti è trovare la migliore combinazione di voci di dizionario per ridurre al minimo gli errori durante la sintesi. Questi sono alcuni dei codec più utilizzati nella telefonia (con codec G.711). Esempi: ITU-T G.723 .1, ITU-T G.729 .

Essendo questi algoritmi di compressione molto vari nella loro natura e dai risultati che producono, uno strumento è apparso necessario per poter confrontare le rispettive qualità. Prima dell'introduzione dei vocoder, un semplice calcolo dell'errore quadratico tra il segnale originale e il segnale codificato-decodificato ha fornito una misura della degradazione. Tuttavia, questo metodo è stato messo in discussione da due fattori:

non consente di tenere conto degli effetti psico-acustici (ad esempio l'effetto massa quando due toni sono vicini)
un vocoder può essere percepito di ottima qualità mentre la sua risposta temporale è completamente diversa dal segnale che ha codificato. In questo caso l'errore quadratico è grande mentre il vocoder è di buona qualità.

Il metodo del punteggio MOS è stato sviluppato per tenere conto di questi fattori e valutare la qualità "percepita" di un codec.

Metodologia

Il principio di calcolo del MOS si basa su un'indagine su un campione presumibilmente rappresentativo della popolazione di utenti. Le persone che compongono il campione sono invitate ad ascoltare un segnale (spesso voce), quindi il suo equivalente codificato-decodificato. Dopo ogni ascolto, l'ascoltatore dà un voto che sancisce la qualità che ha percepito. La media dei punteggi forniti dalla popolazione costituisce il MOS. La tabella seguente mostra i risultati ottenuti da alcuni codec comuni.

Codec	Velocità in bit [kbit / s]	Punteggio di opinione medio (MOS)
G.711 ( ISDN )	64	4.1
iLBC	15.2	4.14
AMR	12.2	4.14
G.729	8	3.92
G.723.1 r63	6.3	3.9
GSM EFR	12.2	3.8
G.726 ADPCM	32	3.85
G.729a	8	3.7
G.723.1 r53	5.3	3.62
G.728	16	3.61
GSM FR	12.2	3.5

Vantaggi del metodo

Il punteggio MOS quantifica la qualità effettivamente percepita da una certa popolazione. In particolare, tiene conto degli effetti psico-acustici. Nel caso dei vocoder , il punteggio MOS rivela anche le differenze di qualità legate al linguaggio di chi parla e di chi ascolta. Un vocoder può essere valutato 3,9 in inglese e 1,9 in cinese mandarino . Infine, MOS è uno strumento indispensabile quando si sviluppa un nuovo tipo di codec. I complessi algoritmi utilizzati da un codec moderno spesso sono dotati di una serie di parametri che lo rendono più o meno specifico per un particolare tipo di applicazione. La scelta del valore dei parametri è molto difficile (a volte impossibile) da fare in modo razionale. In questo caso, il MOS viene in aiuto dei ricercatori fornendo una risposta quantitativa basata sull'esperienza percettiva reale.

Svantaggi del metodo

L'implementazione di una valutazione MOS è costosa in termini di costi ed energia. Si tratta di chiamare un numero relativamente elevato di ascoltatori, fornire loro apparecchiature audio adeguate, addestrarli nel modo giusto per assegnare un punteggio utilizzabile e raccogliere e consolidare i risultati. Un'altra difficoltà è la natura soggettiva del risultato. Le correzioni statistiche consentono di ridurre il pericolo, ma non di annullarlo. Tuttavia, l'esperienza mostra che quando più sessioni vengono svolte nelle stesse condizioni, e con campioni diversi ma rappresentativi della stessa popolazione, i risultati ottenuti non variano in modo apprezzabile. Il principale svantaggio del MOS è che non è completamente standardizzato. A prescindere da qualsiasi standard metodologico, molte figure sono prodotte in cattive condizioni sperimentali. Ad esempio, ci sono siti web che offrono all'utente di partecipare alla votazione. In questo caso, il punteggio tiene conto della qualità del codec ma anche di quella dell'apparecchiatura audio dell'utente di Internet e del suo ambiente acustico al momento del test.

Note e riferimenti

Cisco , Understanding Codecs: Complexity, Hardware Support, MOS, and Negotiation , 2 febbraio 2006

Vedi anche

Link esterno

P.800: Metodi di valutazione soggettiva per la qualità della trasmissione presso il sito ITU-T