Un punteggio di opinione medio ( Punteggio medio di opinione (in) - MOS in abbreviazione) è un punteggio assegnato a un codec audio per caratterizzare la qualità della riproduzione del suono. Il voto può variare tra 1 (pessimo) e 5 (ottimo, paragonabile alla versione originale). È definito dall'ITU-T nello standard "P.800: Metodi di valutazione soggettiva per la qualità della trasmissione".
Esiste un numero enorme di codec audio diversi, basati su algoritmi di compressione radicalmente diversi. Ci sono generalmente tre famiglie:
Essendo questi algoritmi di compressione molto vari nella loro natura e dai risultati che producono, uno strumento è apparso necessario per poter confrontare le rispettive qualità. Prima dell'introduzione dei vocoder, un semplice calcolo dell'errore quadratico tra il segnale originale e il segnale codificato-decodificato ha fornito una misura della degradazione. Tuttavia, questo metodo è stato messo in discussione da due fattori:
Il metodo del punteggio MOS è stato sviluppato per tenere conto di questi fattori e valutare la qualità "percepita" di un codec.
Il principio di calcolo del MOS si basa su un'indagine su un campione presumibilmente rappresentativo della popolazione di utenti. Le persone che compongono il campione sono invitate ad ascoltare un segnale (spesso voce), quindi il suo equivalente codificato-decodificato. Dopo ogni ascolto, l'ascoltatore dà un voto che sancisce la qualità che ha percepito. La media dei punteggi forniti dalla popolazione costituisce il MOS. La tabella seguente mostra i risultati ottenuti da alcuni codec comuni.
Codec | Velocità in bit [kbit / s] |
Punteggio di opinione medio (MOS) |
---|---|---|
G.711 ( ISDN ) | 64 | 4.1 |
iLBC | 15.2 | 4.14 |
AMR | 12.2 | 4.14 |
G.729 | 8 | 3.92 |
G.723.1 r63 | 6.3 | 3.9 |
GSM EFR | 12.2 | 3.8 |
G.726 ADPCM | 32 | 3.85 |
G.729a | 8 | 3.7 |
G.723.1 r53 | 5.3 | 3.62 |
G.728 | 16 | 3.61 |
GSM FR | 12.2 | 3.5 |
Il punteggio MOS quantifica la qualità effettivamente percepita da una certa popolazione. In particolare, tiene conto degli effetti psico-acustici. Nel caso dei vocoder , il punteggio MOS rivela anche le differenze di qualità legate al linguaggio di chi parla e di chi ascolta. Un vocoder può essere valutato 3,9 in inglese e 1,9 in cinese mandarino . Infine, MOS è uno strumento indispensabile quando si sviluppa un nuovo tipo di codec. I complessi algoritmi utilizzati da un codec moderno spesso sono dotati di una serie di parametri che lo rendono più o meno specifico per un particolare tipo di applicazione. La scelta del valore dei parametri è molto difficile (a volte impossibile) da fare in modo razionale. In questo caso, il MOS viene in aiuto dei ricercatori fornendo una risposta quantitativa basata sull'esperienza percettiva reale.
L'implementazione di una valutazione MOS è costosa in termini di costi ed energia. Si tratta di chiamare un numero relativamente elevato di ascoltatori, fornire loro apparecchiature audio adeguate, addestrarli nel modo giusto per assegnare un punteggio utilizzabile e raccogliere e consolidare i risultati. Un'altra difficoltà è la natura soggettiva del risultato. Le correzioni statistiche consentono di ridurre il pericolo, ma non di annullarlo. Tuttavia, l'esperienza mostra che quando più sessioni vengono svolte nelle stesse condizioni, e con campioni diversi ma rappresentativi della stessa popolazione, i risultati ottenuti non variano in modo apprezzabile. Il principale svantaggio del MOS è che non è completamente standardizzato. A prescindere da qualsiasi standard metodologico, molte figure sono prodotte in cattive condizioni sperimentali. Ad esempio, ci sono siti web che offrono all'utente di partecipare alla votazione. In questo caso, il punteggio tiene conto della qualità del codec ma anche di quella dell'apparecchiatura audio dell'utente di Internet e del suo ambiente acustico al momento del test.