Tecnología
¬ŅC√≥mo se construye un MP3?
Publicado por: Alberto Zenteno
¬ŅEncontraste alg√ļn error? Av√≠sanos visitas

MPEG-(1/2) Layer III, conocido com√ļnmente como MP3, naci√≥ a finales de la d√©cada de los 80, por manos del Moving Picture Experts Group (MPEG); un formato de audio maravillo que promet√≠a tama√Īos 11 veces menor que un archivo similar en CD.

A mediados del 2000, muchos formatos de audio entraron al mercado como WMA, OGG y AAC, haciendo pensar que el MP3 ‚Äďun formato m√°s veterano- podr√≠a comenzar a decaer, no obstante s√≥lo consigui√≥ crecer m√°s.

Tel√©fonos celulares, reproductores port√°tiles, equipos de m√ļsica y computadores pueden reproducir este maravilloso archivo que, en un par de megabytes nos entrega nuestra m√ļsica favorita.

Logo mp3

¬ŅDe qu√© est√° hecho un archivo de Audio sin Compresi√≥n

El formato mp3, como es archiconocido, es un formato de audio, basado en un algoritmo de compresión con pérdida.

¬ŅQu√© significa esto?

Podríamos decir que el mp3 es sólo un aproximado del audio original. Se le ha quitado mucha información para hacerlo más liviano, como frecuencias que son inaudibles para el humano, entre otros.

Por otra parte el wav, es un formato sin compresión y casi sin pérdidas, aunque se le dice que no tiene, pero toda conversión análogo-digital implica pérdida de información.

Para la construcci√≥n de un archivo de audio sin p√©rdidas, se subdivide toda la pista en ‚Äúmuestras‚ÄĚ de algunos milisegundos.

Veamos el siguiente ejemplo de una muestra en la clásica transformación Análogo-Digital:

He aquí la muestra de una onda análoga

Onda An√°loga

Y aquí una onda digital

Onda Digital

Y aquí una onda vital.

Onda Vital
Lo siento, no pod√≠a dejarlo pasar…

Verán que la onda digital no es más que una emulación de la onda análoga. Cada columna está representado por grupos de bits. Entre más bits por muestra, mejor será la calidad y más parecida a la realidad será el audio.

¬ŅC√≥mo construimos un mp3?

Este bello formato ocupa algo mucho mejor: Las matem√°ticas.

Sucede que el clásico archivo WAV (sin compresión y casi sin pérdidas) funciona de la siguiente manera: cada muestra se forma mediante la union de distintos niveles, en el caso del formato CD, éstos usan niveles de 16 bits, es decir, 216: 65.536 posibles niveles.

Niveles

En esta imagen podemos ver una reconstrucción de 4 bits (24), es decir, 16 niveles distintos. En rojo se ve la onda original, y los puntos azules son los distintos niveles que intentan emular la información.

Pero si sacamos la cuenta, 1 minuto de archivo wav equivaldr√≠an a 10MB, cosa que para hoy no es mucho, pero para los a√Īos 90-2000, era demasiado.

El mp3 en cambio, toma cada muestra y la separa en 576 bandas de frecuencia distintas. Gracias a la Transformada de Fourier, cada frecuencia se reconstruye mediante una función matemática como una sumatoria de senos y cosenos.

Aquí tenemos un ejemplo de cómo funciona:

Serie de FourierSumatoria de Ondas

Al superponer cada frecuencia con distintas amplitudes, se logra reconstruir la onda de la muestra y… ¬°et voil√†!

¬ŅC√≥mo se mide la calidad de un mp3?

La calidad podr√≠a considerarse como el bitrate o en espa√Īol ‚Äútasa de bits‚ÄĚ, √©sta nos indica cu√°ntos bits por segundo tenemos en cada muestra. Como menciono anteriormente, entre mayor bitrate mayor ser√° la calidad, porque ‚Äďobviamente- habr√° menos p√©rdida de informaci√≥n.

Archivo

En el caso de esta canción, el bitrate es de 192kb/s. Lo anterior quiere decir que por cada segundo de audio, hay 192.000 bits de información, haciendo un audio bastante aceptable y muy similar a la calidad CD.

El bitrate puede ser constante, es decir, cada segundo de la pista tiene la misma cantidad de bits, o variable. Gracias al bitrate variable algunos segundos pueden tener más o menos bits dependiendo de la sección. Por ejemplo, para una sección de audio que no tiene sonido o sonido muy bajo, es contraproducente gastar la misma cantidad de bits que se pueden usar en otra sección que tenga más frecuencias y niveles.

Otra cosa que también influye en la calidad de un archivo de audio, es la frecuencia del muestreo, esta nos indica cuántas muestras por segundo se tomarán, para reconstruir el archivo original.

En la ilustración anterior, tenemos 44.100 muestras por segundo.

Gracias a la tasa de bits y la duraci√≥n del audio, podemos f√°cilmente calcular el tama√Īo del archivo resultante.

Fórmula

La formula anterior sólo funciona con audios con bitrate constante. Obviamente para bitrate variable no funciona, ya que no todas las muestras tienen la misma tasa de bits.

Tama√Īo

Podemos observar que el tama√Īo nos da muy similar a lo calculado anteriormente, los bytes restantes son ocupados en metadatos y otros.

Si quieres aprender m√°s, puedes leer acerca del algoritmo de Huffman y la transformada de Fourier, elementos vitales para la creaci√≥n de un mp3, y ‚Äďcomo todos saben- elementos que tambi√©n pueden convertirte en el alma de la fiesta, tal como mis amigos y yo.

Shiquillos

Tendencias Ahora