MP3: la rivoluzione dell’audio digitale

Pubblichiamo un guest post di Raffaele Fanizzi

Forse non molti sanno che nel 1992 ebbe inizio una silenziosa ed inarrestabile rivoluzione dell’audio in formato digitale destinato alla massa, fino ad allora rappresentato essenzialmente dai CD-Audio. Questo fu, infatti, l’anno in cui l’algoritmo alla base del formato MP3 nacque ad opera del Fraunhofer-Institut für Integrierte Schaltungen (IIS).

Parte di un progetto di ricerca europero denominato EUREKA, iniziato nel 1987 e conclusosi nel 1994, l’allora MPEG 1 Layer 3 è stato uno dei più importanti e maturi frutti nel campo degli algoritmi di compressione psico-acustici. Questa famiglia di algoritmi di compressione, i cui primi studi risalgono al 1979 ad opera di Manfred R. Schroeder, fisico tedesco dei AT&T-Bell Labsc, hanno l’obiettivo di ridurre la quantità di informazione atta a descrivere un flusso audio, partendo dal presupposto che l’orecchio umano, per nostra fortuna, non è perfetto. L’idea di base è quella di sfruttare l’incapacità dell’apparato uditivo dell’uomo di riconoscere determinati suoni e frequenze, quando queste sono mascherate da altre.

Il mascheramento audio è rilevato in due livelli: mascheramento in frequenza e temporale. Per spiegarne rapidamente il principio facciamo un esempio: in presenza di due toni, dipendentemente dalla loro frequenza ed intensità, il nostro orecchio sarà in grado di riconoscerli entrambi oppure soltanto uno. In quest’ultimo caso abbiamo un mascheramento in frequenza e, pertanto, le informazioni relative al tono meno udibile possono essere scartate. Cosa succede, tuttavia, se il tono più intenso viene meno? Accadrà che il tono prima non avvertibile, adesso tornerà in primo piano. Tuttavia affinché l’apparato uditivo se ne accorga, passerà inevitabilmente del tempo, perché la membrana ha bisogno di smettere di vibrare e riassestarsi.

Parliamo, naturalmente, di tempi nell’ordine dei millisecondi, che tuttavia risultano preziosi, perché il suono che rientra in tale tempo verrà tagliato via dall’algoritmo di compressione e, conseguentemente, contribuirà a ridurre la quantità di informazione necessaria a descrivere ciò che è udibile.

Il primo encoder MP3, chiamato l3enc, fu rilasciato dalla stessa Fraunhofer Society il 7 Luglio 1994, mentre l’estensione MP3 nacque ufficialmente il 15 Luglio dell’anno successivo.

Chi ha vissuto quest’epoca, sa bene che stiamo parlando di anni in cui l’ADSL non esisteva, gli hard disk avevano dimensioni di qualche centinaio di MB e, più in generale, sia dal punto di vista delle comunicazioni che dell’immagazzinamento dei dati, le cifre erano ben lungi dall’essere generose come lo sono oggi. Tenendo presente tali limitazioni, voglio ricordare che un file audio non compresso in formato WAV PCM, con una risoluzione di 44 kHz e 16 bit, stereo, quanto cioè impone lo standard dei CD-Audio, ha un bitrate pari a 1411,2 kbit/s. Ciò significa che volendo estrarre da un CD-Audio una canzone sul proprio hard disk, lo spazio occupato in formato WAV non compresso è di circa 10 MB al minuto. Oggi forse non sarebbe un problema disporre di tale spazio, ma a metà degli anni novanta questa era una limitazione avvertibile.

La compattezza del formato MP3 unita alla più che accettabile qualità (una stima molto ottimistica è un bitrate di 128 kbit/s per ottenere una qualità paragonabile ai CD-Audio), ne fecero nel giro di pochissimi anni il veicolo di trasmissione per eccellenza per la musica. Tappe fondamentali che hanno contribuito a questo inarrestabile successo tecnologico sono state il rilascio del software di riproduzione Winamp a cura di Nullsoft nel 1997, e l’arrivo sul mercato solo un anno più tardi dei primi riproduttori multimediali portatili: l’MPMan F10 di Eiger Labs ed il Rio PMP300 di Diamond Multimedia.

Impossibile, infine, non citare la nascita delle reti peer-to-peer destinate allo scambio di file MP3 con Napster, una delle più celebri applicazioni di sempre, sia per l’innovativo servizio reso accessibile, che per le inevitabili vicende giudiziare che seguirono e che ne decretarono lo shutdown nel 2001.

In questo stesso anno, inoltre, fa la sua comparsa sul mercato un altro simbolo della rivoluzione multimediale frutto dello stesso orizzonte tecnologico tracciato dal formato MP3: l’Ipod di Apple.
Proseguendo fino ad oggi troviamo, parallelamente alla nascita di nuovi e più efficienti formati di compressione, esempi sempre più evidenti dalla rivoluzione, anche sociale e commerciale, che ha comportato l’arrivo del formato MP3.

Un tempo le playlist erano decise esclusivamente dalle case discografiche che inframezzavano in album con canzoni mediocri, grandi successi; oggi è possibile realizzare la propria playlist preferita, selezionando i brani e l’ordine di riproduzione senza alcuna difficoltà.

L’ampio supporto del formato MP3 da parte di impianti Hi-Fi, impianti audio per automobili, riproduttori multimediali portatili, telefoni cellulari, ecc… consente, unitamente alle crescenti dimensioni delle memorie di massa, di avere a disposizione il proprio catalogo multimediale in tutti i casi in cui la musica ha un ruolo: dalla suoneria del cellulare, alla musica ascoltata nella propria automobile o durante l’attività fisica. Anche dal punto di vista commerciale molto è cambiato a seguito dell’arrivo dei formati di compressione audio (e delle vicende giudiziarie di Napster) ed oggi è possibile acquistare singole canzoni a prezzi molto vantaggiosi, scaricandole direttamente sul proprio personal computer.

Esiste tuttora una folta schiera di audiofili che non ha guardato di buon occhio lo spopolamento del formato MP3. Basandosi su un algoritmo di compressione di tipo “lossy”, cioè con perdita di informazione, l’MP3 fornisce una qualità audio che, benché sia per lo più paragonabile al flusso audio di origine non compresso, ne rappresenta pur sempre un’approssimazione.

L’orecchio più attento, aiutato da impianti di riproduzione e diffusori adeguati, può quindi, senza grandi difficoltà, avvertire la perdita di qualità che comporta l’ausilio della compressione. Naturalmente questa rispettabilissima posizione pone l’accento su una cultura della qualità tipica degli audiofili, che tuttavia non tiene conto o sottovaluta che molto spesso l’ascolto della musica è un’attività che viene eseguita in condizioni dell’ambiente e con una dotazione tecnica (DAC, diffusori, ecc…) che non consentono di apprezzare l’eventuale surplus qualitativo derivante dall’uso del solo audio non compresso.

Inoltre, molte delle limitazioni dell’algoritmo di compressione alla base degli MP3 sono state superate dai nuovi formati tra i quali ricordiamo l’AAC (Advanced Audio Coding), incluso ufficialmente nello standard MPEG-4, il Vorbis, un algoritmo open source sviluppato da Christopher Montgomery, il WMA (Windows Media Audio), sviluppato da Microsoft, ed il poco fortunato mp3PRO, realizzato dallo stesso Fraunhofer IIS. Maggiori dettagli sulla loro storia, sulle caratteristiche tecniche e sui limiti del formato MP3 che vengono superati con questi codec li affronteremo in un post successivo.

Concludo questo piccolo excursus storico sul formato MP3 citando Henry Ford: “C’è vero progresso solo quando i vantaggi di una nuova tecnologia diventano per tutti”. Penso di poter affermare che l’MP3 sia, all’interno del panorama informatico multimediale, un esempio delle tecnologie che meglio concretizzano il senso di questa frase.

MP3: la rivoluzione dell’audio digitale

IBM ritira l’offerta: partita chiusa con Sun o mossa strategica?

Il design può salvare la carta stampata?

Sfoglia categorie

Programmazione

Genesi di un videogame ai tempi dell’Amiga: La lunga e tetra ora del tè dell’anima

Not always “big is better”: the importance of choosing data types – An example with CPython

Non sempre “big is better”: l’importanza della scelta dei tipi di dati – Un esempio con CPython

No, i limiti dell’HAM non sono svaniti!

L’abuso di assembly nuoce gravemente alla salute (mentale)

Amiga in modalità HAM: gioia per gli occhi, ma per pochi giochi

Non erano pigri certi sviluppatori Amiga che spremevano la macchina

Con Unity 3D è un gioco – Parte 2

Con Unity 3D è un gioco!

Genesi di un videogame ai tempi dell’Amiga: Verkosoft al Salvataggio!

Genesi di un videogame ai tempi dell’Amiga: La lunga e tetra ora del tè dell’anima

Not always “big is better”: the importance of choosing data types – An example with CPython

MP3: la rivoluzione dell’audio digitale

Sfoglia categorie

Programmazione

Tag Clouds

Press ESC to close