Convertidor de audio gratuito VSDC. Bitrate y su significado. Métodos de codificación de señales estéreo.

(Descripción del popular formato de compresión de audio MP3)

Introducción

Este formato de compresión de audio digital más popular en la actualidad fue desarrollado hace varios años por una pequeña empresa alemana, Fraunhofer IIS. La corporación europea THOMSON apoyó activamente el nuevo formato y hizo todo lo posible para difundirlo lo más rápido posible. En particular, con su apoyo, el recién llegado se convirtió en uno de los estándares de compresión de audio de la familia MPEG1, MPEG2 y se llamó MPEG Layer3 o el más familiar MP3.

Revolución del sonido

La aparición de este formato puede calificarse más apropiadamente como una revolución silenciosa. Revolucionario, porque antes del MP3, ningún formato de archivo de audio podía ofrecer tal calidad en un tamaño tan relativamente pequeño.

Sí, fue una revolución, pero una revolución muy extraña. Después de todo, este algoritmo único al comienzo de su existencia literalmente pendía de un hilo. Ausencia total de publicidad, ni reproductores de música de este formato, a excepción del de marca Fraunhofer IIS, que se distinguía por su diseño extremadamente pobre, su control terrible y sus requisitos de sistema exorbitantes.

A esto hay que sumarle el apetito colosal de los propios desarrolladores, que querían sumas bastante considerables por sus códecs (CODEC - COder/DECoder) (una situación similar ocurre ahora con algunos formatos de la familia AAC) y la ausencia de música como tal, a diferencia de los sólidos depósitos de música en formato RA. Estos factores bien podrían arruinar al recién nacido inmediatamente después del nacimiento. Y todos los amantes de la buena música deberían agradecer enormemente a los famosos y anónimos desarrolladores del software gratuito MP3 CODEC, que no permitieron que el creador de este formato, Fraunhofer IIS, destruyera su brillante creación debido a su estupidez y avaricia de marketing.

También cabe destacar el importante papel que jugó el popular reproductor WinAMP en la difusión del formato MP3. Este reproductor fue el primero en brindar la comodidad que tanto carecían los reproductores de marca. Luego, como ya dije, este formato fue notado por la empresa THOMSON, y así comenzó la marcha victoriosa del MP3 en todo el mundo.

MP3 desde dentro: psicofisiología del sonido

Este formato utiliza un algoritmo de codificación extremadamente complejo. A diferencia de los archivadores convencionales, que necesitan comprimir la información de tal manera que después de la extracción del archivo no cambie ni un solo bit, el MP3 tiene objetivos ligeramente diferentes. Además de los algoritmos matemáticos de compresión, este formato también contiene un algoritmo muy complejo para eliminar información de audio innecesaria, basado en las características psicológicas y fisiológicas del cuerpo humano.
¿Cuáles son los beneficios de este enfoque?

En primer lugar, la posibilidad de rebobinar, ya que es posible una transición fácil a un fotograma arbitrario y la reproducción de sonido exactamente desde este lugar. En segundo lugar, es esta característica estructural la que hace del MP3 un verdadero formato de red. Después de cargar los primeros fotogramas en la RAM o en la caché del disco, el reproductor comienza a reproducirlos, mientras carga simultáneamente nuevos fotogramas, logrando así una reproducción continua. Y finalmente, si no pudo descargar el archivo MP3 completo de Internet, entonces está bien, aún puede escuchar la música, el reproductor llegará al lugar donde se perdió la conexión y se detendrá. Así que volvamos a nuestros marcos. Con MP3 de alta calidad, cuya tasa de bits es de ~ 320 kbs, solo se utilizan algoritmos de compresión matemática para codificar fotogramas. La calidad no se ve afectada en absoluto, pero el tamaño se reduce sólo cuatro veces, es decir, la relación de compresión es la misma que daría un archivador normal; Por este motivo, los archivos MP3 son prácticamente imposibles de comprimir con archivadores convencionales. Cuando el ancho de banda (tasa de bits) se reduce a 256 kbs o menos, entran en juego los mismos algoritmos para eliminar sonidos "innecesarios", que se basan en las peculiaridades de la percepción del sonido por parte del oído humano, el llamado "modelo psicoacústico". El proceso de eliminar sonidos "innecesarios" se llama

cuantificación

Otro criterio mediante el cual se evalúa la "innecesidad" de un sonido es una condición basada en una característica del oído humano como la incapacidad de la mayoría de las personas para distinguir entre señales cuya potencia se encuentra por debajo de un cierto nivel, y este nivel es diferente para diferentes frecuencias. rangos. Cuando se utiliza el modelo de codificación psicoacústica de MP3, CODEC descarta automáticamente frecuencias inaudibles de baja potencia. Desafortunadamente, las personas no son las mismas y aquellos que pueden distinguir estas frecuencias específicas a menudo se quejan de la pérdida de calidad del sonido durante la codificación, mientras que la mayoría promedio no lo nota.

Pero la característica más importante del modelo de codificación psicoacústica de MP3 es el llamado efecto de enmascaramiento. Es gracias a este efecto que es posible comprimir tanto los datos de audio originales. La esencia de este efecto es que una señal débil de un rango de frecuencia a menudo queda enmascarada por una señal más potente de un rango adyacente, si está presente en la grabación de audio, o por una señal potente del cuadro anterior. Esta fuerte señal provoca una disminución temporal en la sensibilidad del oído a la señal del fotograma actual. En esencia, existe un fenómeno de “aturdimiento temporal”.

Para cada rango de audio, se determina la magnitud del efecto de enmascaramiento creado por la señal de los rangos vecinos y la señal del cuadro anterior. Si la señal de enmascaramiento excede la intensidad de la señal del rango actual, entonces este rango de señal no está codificado, lo que permite que el modelo psicoacústico elimine parte de los datos de este cuadro. Para los datos restantes de cada rango, se determina cuántos bits por cuadro podemos sacrificar para que las pérdidas de la cuantificación adicional estén por debajo de la magnitud del efecto de enmascaramiento. Sin duda, todo el mundo ha notado que el audio codificado a velocidades de bits bajas es extremadamente confuso y aburrido. Esto se debe al hecho de que cuando se pierde un bit de información, se introduce un ruido de cuantificación de aproximadamente 6 dB en el sonido general.

Cabe señalar que en el caso de velocidades de bits bajas, la codificación comienza con la codificación adaptativa.

Después de una cuantificación adicional, se forma el flujo final, que luego se comprime utilizando el algoritmo de Huffman (similar al algoritmo RAR).

Lo destacable de este formato es que el grado de compresión, es decir, la relación tamaño/calidad, está completamente bajo el control del usuario.

El ancho de la transmisión (tasa de bits) puede variar desde un valor máximo de 320 kbs hasta 64 kbs o menos, y el tamaño también varía en consecuencia.

Nos hemos familiarizado con las tecnologías de compresión utilizadas en MP3 CODEC, ahora es el momento de hablar de las diferentes tasas de bits.

La calidad requiere sacrificio

Es obvio que diferentes velocidades de bits incluso del mismo CODECa proporcionan una calidad muy diferente. Además, diferentes personas evalúan la calidad de la aceptabilidad de las mismas tasas de bits de maneras completamente diferentes, expresando su propia opinión puramente subjetiva. A la hora de evaluar la calidad del sonido suele surgir confusión, ya que muchas personas confunden la presencia de niveles de ruido bajos o altos con una calidad de señal alta o baja.

Pero debes prestar atención a la advertencia "en la mayoría de los casos" que hicieron los expertos para la tasa de bits de 256 kbs. En algunos casos, especialmente al codificar música clásica, esta tasa de bits no funciona bien.

Si desea una coincidencia exacta del archivo comprimido con el original, utilice la tasa de bits máxima para la codificación de audio de CD: 320 kbs.

La relación de compresión es 4:1, para una tasa de bits de 256 kbs – 6:1. El tamaño es un poco más grande, pero la calidad puede considerarse infalible.

Muchos amantes de la música ya han creado extensas bibliotecas de música en CDR o simplemente en el disco duro utilizando MP3 de 256 kbs y 320 kbs. Por cierto, es precisamente en este sentido que los ordenadores domésticos equipados con unidades de CD-RW (grabadora de CD-ROM) se han vuelto extremadamente populares en todas partes.

Pero la tasa de bits más popular en este momento sigue siendo 128 kbs, que rápidamente reemplazó al formato RA. La razón de esta popularidad es su tamaño relativamente pequeño (compresión 12:1), que es un factor determinante en condiciones de transferencia de datos lenta y alto costo de los servicios del proveedor. También es fácil determinar la duración del sonido según el tamaño del archivo MP3. A esta tasa de bits, 1 minuto de sonido ocupa aproximadamente 1 megabyte. Pero este nuevo “rey de las redes” ni siquiera tiene la misma calidad que un CD. Ésta es la calidad de un casete de audio promedio. En Internet se pueden encontrar principalmente MP3 con una velocidad de bits de 128 kbs; este formato se creó originalmente como formato de red.

Después de un largo desarrollo de este formato, poco a poco miles y miles de usuarios finalmente lo apreciaron. Como setas después de la lluvia, han aparecido muchos sitios web que se especializan exclusivamente en distribuir música en un formato de moda. Por supuesto, casi todos los archivos MP3 eran ilegales o semilegales, ya que los usuarios no se daban cuenta de que al distribuir música comprada con su propio dinero y convertida al formato MP3, estaban violando las leyes sobre derechos de autor y derechos afines. O lo hizo, pero... Pero atrapar, y mucho menos castigar, a los distribuidores ilegales resultó ser increíblemente difícil. Además, gracias al pequeño tamaño del MP3 con una tasa de bits de 128 kbs, fue posible grabar en un CD no 74 minutos de música como antes, ¡sino más de 650 minutos! Los piratas se aprovecharon inmediatamente de esto. Comenzaron a producir discos del tipo “todos los álbumes de un grupo de éxito en un solo disco”.
Las compañías discográficas comenzaron a sufrir pérdidas. ¿Por qué comprar un álbum cuando puedes comprar diez álbumes en un CD por el mismo dinero?

Recientemente, el gigante discográfico RIAA ha intentado combatir la distribución ilegal de música MP3. Pero ya era demasiado tarde. La industria del MP3 ha alcanzado niveles sin precedentes. Comenzaron a aparecer minirreproductores de hardware con 32 megabytes de memoria y la posibilidad de conectarse a una computadora; ya han aparecido más de 40 modelos. Reproductores para coches basados ​​en discos duros pequeños (1GB). Incluso tarjetas de sonido con soporte de hardware MP3. Se hizo imposible luchar contra esta ola. MP3 se convirtió en el primer formato de almacenamiento de audio reconocido después del CD-Audio. Fue una victoria.

Esta música será eterna...

Aunque el MP3 ya no sea el mejor.

  • Está siendo reemplazado por nuevos formatos: la familia AAC (códec de audio avanzado), VQF, PAC (códec de audio perceptual). Pero él fue el primero. Además, la gran audiencia de usuarios de MP3 es muy conservadora; el MP3 ha conseguido impresionar profundamente a sus fans, mientras que sus competidores sólo consiguen sorprenderles ligeramente.Así que creo que este estándar está destinado a durar muchos años más antes de ser reemplazado por uno más digno.
  • Glosario- significa COder/DECoder. Esto no es más que un conjunto de algoritmos de codificación y decodificación de audio.
  • tasa de bits- ancho de flujo. El número de bits utilizados para codificar la secuencia de audio. Se mide en kbs, es decir
  • número de kilobits por segundo. Cuantización
  • – el proceso de eliminar frecuencias que no son percibidas por el audífono humano común (oído). CD de audio
  • - el formato de audio digital más antiguo, que existe desde hace más de 20 años. Parámetros 44Khz, estéreo de 16 bits. REAL ACADEMIA DE BELLAS ARTES.

- formato significa Real Audio. El primer formato de red que proporciona transmisión y reproducción de audio en tiempo real. En comparación con MP3, tiene una tasa de bits de 8 y 16 kbs y, en consecuencia, una calidad de sonido terrible.

La aplicación le permite convertir cualquier archivo de audio a un formato que le resulte conveniente de forma totalmente gratuita. El servicio web admite la sincronización con Google Drive y Dropbox para recibir archivos de estos sistemas. También puedes extraerlos de fuentes externas mediante enlaces URL.

Interfaz fácil de usar

Utilizar el servicio no requiere mucho esfuerzo. Todo lo que necesitas hacer es completar 3 pasos: subir la grabación de audio deseada al sitio, luego seleccionar la calidad de la pista futura y hacer clic en "Convertir" para completar el proceso.

Conversión por lotes

A diferencia de muchos otros programas de este tipo, el conversor de audio online puede convertir varias grabaciones a la vez en un corto período de tiempo, guardando el trabajo terminado en un archivo.

Trabaja con cualquier formato

Para trabajar en esta aplicación, puede seleccionar casi cualquier formato de archivo principal para la conversión (alrededor de 300 opciones). Las grabaciones de audio se pueden convertir a 8 formatos, incluidos mp3, wav, m4a, mp2 y otros.

Configuraciones avanzadas

Cada usuario tiene la oportunidad de seleccionar características adicionales de la pista futura. Por ejemplo, puedes cambiar la frecuencia y la cantidad de memoria que ocupará el archivo, así como establecer una introducción suave o eliminar por completo la voz de la composición, dejando solo la melodía.

Funciona en el navegador

Para comenzar a trabajar con el convertidor, simplemente descargue un navegador a su computadora, si no tiene uno, y comience a convertir. La capacidad de trabajar sin descargar ahorra memoria de la computadora y la libera para datos importantes. Además, trabajar directamente en el navegador reduce el tiempo dedicado a preparar el programa para crear pistas.

El sistema es capaz de cortar música de cualquier vídeo. De esta forma puedes obtener bandas sonoras de películas y varios vídeos online. Esto es muy conveniente para los casos en los que necesita obtener música cuyo nombre no conoce.

Seguridad

El servicio garantiza la total seguridad de sus datos. Esto lo garantiza un sistema que elimina instantáneamente la información recibida del cliente inmediatamente después de finalizar el trabajo.

Soporte de etiquetas

Una opción adicional es la introducción de etiquetas para algunos formatos (AAC, AIFF, FLAC, M4A, M4R, MMF, MP3, OGG, OPUS, WAV, WMA). Cambiar el título, la pista, el álbum e incluso los artistas: todo esto también lo proporciona el recurso de conversión de audio en línea.

Conversor de audio rápido, potente, rico en funciones y fácil de usar.

Su objetivo principal es editar y convertir archivos de audio de un formato a otro. Se admiten todos los formatos de audio populares, como MP3, Windows Media Audio (WMA y ASF), QuickTime Audio (MP4, M4A y AAC), Real Audio (RM y RA), Vorbis Audio (OGG), formatos de teléfono (AMR), Creative Voice (VOC), Sun Audio (AU), Wave Audio (WAV y AIFF), FLAC, etc. También admitimos todos los códecs de audio, incluidos MP3, AAC, Vorbis, GSM y ADPCM.

También puedes abrir y convertir archivos M3U. Además, es posible descargar archivos de audio a través de Internet.

Admite todos los formatos clave principales
Se admiten casi todos los códecs y formatos de audio populares. Formatos admitidos: MP3, WMA y ASF, M3U, MOV, MP4 y M4A, RM y RA, OGG, AMR, VOC, AU, WAV, AIFF, FLAC, OMA y muchos otros.

Sistema de perfil avanzado
Usando perfiles, puedes elegir fácilmente la calidad y el formato del audio resultante sin pensarlo dos veces. La aplicación tiene una gran cantidad de ajustes preestablecidos que cubren todos los formatos y dispositivos multimedia. Puedes editarlos fácilmente tú mismo o crear los tuyos propios.

Posibilidad de guardar audio de vídeo.
Ahora puedes guardar la pista de audio o parte de ella desde archivos de vídeo y crear tu propia banda sonora en cualquiera de los formatos de audio disponibles.

Eliminar fragmentos de archivos de audio
Con el editor integrado, puede eliminar fácilmente fragmentos innecesarios de archivos de audio. Después de la conversión, los fragmentos se eliminarán del archivo resultante.

Descargar archivos de audio de Internet
Ahora siempre puedes descargar audio del sitio y convertirlo inmediatamente a otro formato de audio.

Conversión de audio de alta calidad
Al realizar la conversión, utilizamos únicamente algoritmos de procesamiento de audio de alta calidad, por lo que la conversión de audio se produce prácticamente sin pérdida de calidad. La calidad resultante depende únicamente del perfil que elijas.

Alta velocidad de conversión de archivos de audio.
Todos nuestros productos utilizan algoritmos optimizados para el uso de múltiples procesadores para acelerar su funcionamiento. Nuestros programas admiten y utilizan una amplia gama de tecnologías, como Dual Core, Core Duo, Hyper-Threading y otras.

Alta confiabilidad y estabilidad
Hemos intentado que todos nuestros productos sean compatibles con todos los sistemas operativos Windows. No debería encontrar ningún problema al utilizar nuestros programas.

Convertidor de audio gratuito– un conversor gratuito que funciona con muchos formatos de audio conocidos. Al trabajar con Free Audio Converter en ruso, podrá crear de forma independiente archivos MP3 de excelente calidad a través de ajustes preestablecidos alternativos. Otra función útil es la de comprimir archivos sin perder calidad alguna. Lo más destacado de Free Audio Converter para Windows 7, 8, 10 es su configuración flexible. Cuando trabaja con un formato separado, ofrece su propia selección de perfiles, así como un editor para cambiar la configuración.

Es decir, en el proceso de trabajo, usted mismo tiene la oportunidad de crear configuraciones nuevas, cambiar e incluso eliminar configuraciones antiguas. Al convertir con Free Audio Converter, puedes trabajar fácilmente con varios archivos a la vez. Teniendo en cuenta que se trata de un programa cien por cien gratuito, seguro de instalar y utilizar, el convertidor está libre de virus y spyware. Última versión Descarga gratuita de Convertidor de audio gratuito en ruso a través de un enlace directo desde el sitio web oficial sin registro ni SMS, puede ir a nuestro sitio web.

Características principales de Free Audio Converter en ruso:

  • Todo tipo de operaciones con registros de extensión aac, ac3, aiff, ape, flac, m4a, m4b, mka, mp3, ogg, ra, tta, wav, wma;
  • Creación independiente de grabaciones en formato mp3;
  • Manipulaciones con la configuración del programa;
  • Cien por ciento de seguridad de su computadora, al instalar el convertidor, contra virus y spyware.

El formato MP3 es la abreviatura de MPEG Layer3. Es uno de los formatos de streaming para almacenar y transmitir señales de audio en formato digital, desarrollado por Fraunhofer IIS y THOMSON, posteriormente aprobado como parte de los estándares de audio y vídeo comprimidos MPEG1 y MPEG2. Este esquema es el esquema más complejo de la familia MPEG Layer 1/2/3. Requiere más tiempo de computadora para codificar en comparación con los otros dos y proporciona una mayor calidad de codificación. Se utiliza principalmente para la transmisión de audio en tiempo real a través de enlaces de red y para la codificación de audio de CD.

formato MP3- formato de transmisión. Esto significa que la transferencia de datos se produce en un flujo de bloques de datos individuales independientes: marcos de datos. Para ello, la señal original durante la codificación se divide en secciones de igual duración, llamadas fotogramas y se codifican por separado. Durante la decodificación, se forma una señal a partir de una secuencia de cuadros decodificados.

Alto grado de compacidad formato MP3 en comparación con PCM 16Bit Stereo 44.1kHz (CD Audio) y formatos similares, manteniendo una calidad de sonido similar, se logra utilizando una cuantificación adicional de acuerdo con un esquema establecido que permite minimizar las pérdidas de calidad.

Esto último, a su vez, se logra teniendo en cuenta las características de la audición humana, incluido el efecto de enmascarar una señal débil de un rango de frecuencia con una señal más potente de un rango adyacente, cuando esto ocurre, o una señal potente del fotograma anterior, provocando una disminución temporal en la sensibilidad del oído a la señal del fotograma actual. También tiene en cuenta la incapacidad de la mayoría de las personas para distinguir entre señales por debajo de un cierto nivel de potencia, que varía según los diferentes rangos de frecuencia.

Estas técnicas se denominan codificación adaptativa y permiten conservar los detalles sonoros menos significativos desde el punto de vista de la percepción humana. El grado de compresión y, en consecuencia, la cantidad de cuantificación adicional, no está determinado por el formato, sino por el propio usuario al momento de configurar los parámetros de codificación. La tasa de bits para codificar una señal similar a un CD de audio (estéreo de 16 bits de 44,1 kHz) varía desde la más alta, 320 kbs (320 kilobits por segundo, también escrito kbs, kbps o kb/s), hasta 96 kbs y menos.

El término tasa de bits en general denota el tamaño total de la transmisión, la cantidad de información transmitida por unidad de tiempo y, por lo tanto, no está relacionado con las sutilezas internas de la estructura de la transmisión, su significado no depende de si la transmisión contiene mono o estéreo. , o audio de cinco canales con texto en diferentes idiomas, o cualquier otra cosa.

En las pruebas realizadas, expertos invitados especialmente y especializados en la evaluación subjetiva de la calidad del sonido no pudieron distinguir entre el sonido de la pista original en el CD y el codificado en formato MP3 con un ratio de compresión de 6:1, es decir, con un bitrate de 256kbs. Es cierto que las pruebas se realizaron con una pequeña cantidad de material y, de hecho, no todo es tan bueno, a menudo es necesario utilizar 320 kbs; Por mi parte, consideré que esto era una razón suficiente para una transición completa a la codificación con una tasa de bits de 320 kbs.

Las tasas de bits más bajas, a pesar de su popularidad, no proporcionan una calidad de codificación adecuada, lo que le ha dado al MP3 una reputación inmerecida como formato amateur. De hecho, aunque 256 kbs e incluso 320 kbs tampoco permiten implementar una codificación completamente transparente, las diferencias con el CD Audio, en el que está codificado el MP3 de prueba, son comparables a las diferencias entre el propio CD Audio y la señal analógica original de la cual se obtuvo mediante digitalización. Es decir, por supuesto, hay pérdidas, pero son insignificantes desde el punto de vista de quienes consideran suficiente la calidad del CD Audio. De hecho, detectarlos no suele ser una tarea trivial en equipos de alta fidelidad.

El presente y futuro del MP3.

formato MP3 hoy tiene dos enormes ventajas sobre otros formatos disponibles de este tipo. Uno de ellos es que todavía no se puede decir que ninguno de los formatos similares existentes garantice completamente la preservación estable de la calidad del sonido a velocidades de bits suficientemente altas, excepto formato MP3, que ha resistido con dignidad la prueba del tiempo. Quizás el único competidor que conozco en este sentido sean las últimas versiones del formato ATRAC utilizado en minidiscos.

Para formato MP3 También se ha escrito una gran cantidad de software fácil de usar. Este hecho refleja una segunda ventaja, no menos importante: para los próximos años, y posiblemente para toda la década, formato MP3 se ha convertido en un estándar de facto, por lo que las partes que lo utilizan han invertido mucho en él, incluidas las estaciones de radio digitales.

formato MP3 permaneció desconocido durante bastante tiempo, pero hace unos años su popularidad comenzó a crecer explosivamente y los depósitos de archivos ilegales comenzaron a aparecer con la misma rapidez en formato MP3. Ya se ha iniciado la producción de reproductores MP3 físicos, tanto de bolsillo como para automóviles. De este modo, formato MP3 se convirtió en el primer formato de almacenamiento de audio ampliamente aceptado después del CD-Audio.

A pesar de formato MP3 apareció hace bastante tiempo, los formatos más nuevos que compiten por su lugar y que han aparecido hasta ahora resultaron ser amateurs. Pueden ser buenos o no en comparación con el MP3 a velocidades de bits bajas, dependiendo de la pista y del oído del individuo, pero formato MP3 256 kbs... 320 kbs no son elegibles.

Quizás un "monopolio" formato MP3 en el ámbito de los ordenadores con tasas de bits bajas todavía se verá afectado parcialmente por el nuevo formato de Microsoft: WMA. Pero es demasiado pronto para hablar de ello. Por otro lado, la aparición de Microsoft en este mercado con un desarrollo tan fuerte significa una rápida eliminación de las ramas AAC y VQF que resultaron infructuosas. Sin embargo, todavía hay esperanzas de que el AAC esté finalizado.

Descripción del proceso de codificación.

Preparándose para la codificación. Estructura de trama Antes de codificar, la señal fuente se divide en secciones llamadas tramas, cada una de las cuales se codifica por separado y se coloca en el archivo final independientemente de las demás. La secuencia de reproducción está determinada por el orden de los fotogramas. Cada cuadro se puede codificar con diferentes parámetros. La información sobre ellos está contenida en el encabezado del marco.

Inicio de la codificación La codificación comienza con la división de la señal fuente en varios filtros, que representan rangos de frecuencia separados, cuya suma es equivalente a la señal original.

Funcionamiento del modelo psicoacústico Para cada rango se determina la magnitud del efecto de enmascaramiento creado por la señal de los rangos vecinos y la señal del cuadro anterior. Si excede la potencia de la señal del rango de interés o la potencia de la señal en él está por debajo del umbral de audibilidad determinado experimentalmente, entonces para este cuadro este rango de señal no está codificado.

Para los datos restantes de cada rango, se determina cuántos bits por muestra podemos sacrificar para que las pérdidas de la cuantificación adicional estén por debajo de la magnitud del efecto de enmascaramiento. Se tiene en cuenta que la pérdida de un bit provoca la introducción de un ruido de cuantificación del orden de 6 dB.

Finalización de la codificación Una vez finalizado el modelo psicoacústico se forma la secuencia final, que además se codifica según Huffman y con ello se completa la codificación.

Nota En la práctica, el esquema es algo más complicado. Por ejemplo, es necesario cumplir con los requisitos de tasa de bits. Según el codificador, esto conduce, cuando aumenta la tasa de bits, a distintos tipos de relajaciones en la selección de la parte retenida de la señal original, y cuando disminuye, por el contrario, a un endurecimiento de los criterios.

Métodos de codificación de señales estéreo.

Dentro formato MP3 La codificación estéreo es posible mediante cuatro métodos diferentes:

Doble canal- Cada canal recibe exactamente la mitad del flujo y se codifica por separado como señal mono. Se recomienda principalmente en los casos en que diferentes canales contienen señales fundamentalmente diferentes, por ejemplo, texto en diferentes idiomas.
Disponible en algunos codificadores bajo pedido.

Estéreo- Cada canal se codifica por separado, pero el codificador puede decidir darle más espacio a un canal que a otro. Esto puede resultar útil en el caso de que, después de descartar la parte de la señal que se encuentra por debajo del umbral de audibilidad o está completamente enmascarada, resulta que el código no llena completamente el volumen asignado para un canal determinado y el codificador tiene la oportunidad de utilizar este espacio para codificar otro canal. La documentación de mp3enc señala que esto, por ejemplo, evita codificar "silencio" en un canal cuando hay una señal en otro.
Este modo está configurado de forma predeterminada en la mayoría de los codificadores basados ​​en ISO y también lo utilizan los productos FhG IIS a velocidades de bits superiores a 192 kbs. También se puede utilizar a velocidades de bits más bajas del orden de 128 kbs... 160 kbs.

Estéreo conjunto (MS estéreo)- La señal estéreo se descompone en el promedio entre los canales y la diferencia. En este caso, el segundo está codificado con una tasa de bits más baja. Esto le permite aumentar ligeramente la calidad de codificación en una situación normal cuando los canales están en fase. Pero también se produce un fuerte deterioro si se codifican señales desfasadas. En particular, el cambio de fase casi siempre está presente en las grabaciones digitalizadas a partir de casetes de audio, pero también ocurre en los CD, especialmente si el propio CD se grabó al mismo tiempo a partir de una cinta de audio. Por otro lado, ya se ha hecho el (¿primero?) intento de escribir un programa para la corrección automática del cambio de fase. Quizás ayude un poco a aquellos a quienes les gusta codificar digitalizaciones de casetes de audio con una tasa de bits de aproximadamente 128 kbs.
El modo lo establecen de forma predeterminada los productos FhG IIS, así como el codificador Lame, para velocidades de bits de 112 kbs a 192 kbs.

Estéreo conjunto (estéreo MS/IS)- Introduce otro método de simplificación estéreo que mejora la calidad de codificación a velocidades de bits particularmente bajas. Consiste en que para algunos rangos de frecuencia ni siquiera queda la señal diferenciada, sino sólo la relación de las potencias de la señal en los diferentes canales. Está claro que se utiliza una tasa de bits aún más baja para codificar esta información.
A diferencia de todos los métodos anteriores, este método produce una pérdida de información de fase, pero los beneficios de ahorrar espacio en favor de la señal media son mayores si hablamos de bitrates muy bajos.
Este modo lo utilizan de forma predeterminada los productos FhG IIS para altas frecuencias a velocidades de bits de 96 kbs o menos (este modo prácticamente no lo utilizan otros codificadores de alta calidad).
Pero, como ya se mencionó, cuando se utiliza este modo, se pierde la información de fase y también se pierde cualquier señal antifase.

Errores simples de usuario de MP3

Uno de los mayores conceptos erróneos asociados con el formato MP3 aparece constantemente en el debate "128 kbs frente a 256 kbs: a qué tasa de bits codificar". Los argumentos de los partidarios de la primera opción se agotan recordando que estos MP3 tienen la mitad de tamaño. La afirmación de que es mejor conservar CD Audio en lugar de MP3 de 256 kbs es infundada - calidad formato MP3 256kbs... 320kbs prácticamente corresponde al original, y el volumen ocupado es 4,5-6 veces menor. La idea errónea es que 128 kbs también proporciona una calidad bastante alta. De hecho, para las personas que eligen conscientemente 128 kbs, mantener una calidad cercana a la original simplemente no es demasiado importante, ya que su equipo no suele ser mejor que el de los reproductores de apuntar y disparar. Al mismo tiempo, muchos propietarios de CD los codifican en formato MP3 simplemente porque es necesario cambiar el CD con mucha menos frecuencia: mi disco duro de 8 Gb tiene capacidad para más de cincuenta horas de música en formato MP3 con una tasa de bits de 320 kbs. Como dicen, en este caso los motivos de los usuarios de 128kbs no nos quedan claros.

Ser incapaz de distinguir formato MP3 128kbs del original, o necesitas ser sordo o tener peor equipo. Y es bien conocido por todos el hecho de que la mayoría de los sistemas informáticos desde el momento de la compra tienen una tarjeta de sonido ESS terriblemente ruidosa. Sólo desde hace algún tiempo me parece que también se trata de un envenenamiento constante por un sonido de mala calidad y, como consecuencia, de una pérdida temporal (pero constantemente renovada) de sensibilidad. Con demasiada frecuencia escuchamos cosas que no vale la pena escuchar, y esto no se debe sólo a las características de los equipos informáticos: formato MP3 128 kbs con audición normal tampoco serán agradables en ESS. Por supuesto, en comparación con el ruido de los altavoces de un quiosco callejero con el acompañamiento de un tranvía, el sonido formato MP3 128kbs puede parecer bastante bueno, pero no es normal.

¿Qué hacer con todo esto? Sí, simplemente protege tus oídos de torturas innecesarias, es útil. En cuanto a la tarjeta, una tarjeta sencilla y silenciosa y unos auriculares relativamente decentes no cuestan tanto. Por lo tanto, la revisión no tiene en cuenta el ruido de la computadora ni de la tarjeta; estas dificultades son completamente superables.

Otro pequeño error es que el nivel de ruido de la señal decodificada está fuertemente relacionado con el nivel de calidad. formato MP3. Pero esta idea errónea se disipa muy rápidamente; observe que la calidad formato MP3 Depende de otras razones, más fácilmente. Como regla general, el nivel de ruido es muy bajo a cualquier velocidad de bits; esto es más bien una característica del reproductor.

Además, la mayoría de los libros de texto establecen explícitamente la incapacidad humana de escuchar frecuencias superiores a 16 kHz. Pero, en primer lugar, esto simplemente no es cierto, mucho depende de la intensidad de la señal y de la edad del oyente. En segundo lugar, el hombre es una criatura que no carece de originalidad. Incluso cuando no escucha conscientemente esos sonidos a través de su oído, todavía los siente. Y esto afecta la percepción. Por lo tanto, cortar frecuencias por encima de 16 kHz puede considerarse justificado a tasas de bits bajas, cuando permite una codificación mucho mejor de rangos inferiores, pero no se puede ignorar cuando se trata de tasas de bits altas, acercando la calidad de la señal a los niveles de audio de CD. Sí, por cierto, en los niños el umbral de frecuencia de audición es mucho mayor que 16 kHz.

Métodos de almacenamiento de MP3

Estándar formato MP3 no define ningún algoritmo de codificación matemática estándar preciso, su desarrollo se deja enteramente a la conciencia de los codificadores. En cambio, define el esquema general del proceso de codificación, así como el formato del cuadro codificado. Las secuencias de fotogramas en sí pueden transmitirse como una secuencia (el proceso de transmisión de dicha secuencia se denomina transmisión) o almacenarse en archivos.

Archivo formato MP3, como una secuencia, consta de fotogramas dispuestos secuencialmente, entre los cuales se puede contener información arbitraria. El requisito principal es que no debe haber ninguna coincidencia con la firma de inicio del marco.

A menudo se añade un encabezado de formato de metaaudio WAV estándar a una secuencia de fotogramas, lo que da como resultado lo que se denomina WAV-MP3. Aún más a menudo, se agrega un bloque de información ID3v2 al archivo MP3, que contiene información sobre el artista, género, título de la canción y otra información similar sobre la pista. Se agrega al final del archivo. Hasta ahora a nadie se le ha ocurrido la idea de poner algo en el medio. Aunque, por lo general, puede resultar interesante insertar una etiqueta especial para VBR con información sobre en qué parte de la pista nos encontramos realmente.

La naturaleza de las pérdidas de codificación.

A velocidades de bits bajas, siempre se eliminan los detalles pequeños y relativamente silenciosos, cuya presencia o ausencia a menudo cambia seriamente el color emocional de la composición, dándole o privándola de efectos tales como la sensación de pureza "cristalina" del sonido (hasta el en la medida en que esté presente en CD Audio). Además, según el modelo psicoacústico, las frecuencias más altas (por encima de 16 kHz) con tasas de bits bajas se codifican con una prioridad muy baja.

Además, existen diferentes características de los codificadores. Por lo tanto, los codificadores de FhG IIS a 128 kbs tienen frecuencias superiores "manchadas" y se observa un efecto de "ceceo", mientras que los basados ​​​​en ISO tienen un "timbre". Lo más probable es que esto se deba a la diferente actitud de estos codificadores hacia frecuencias superiores a 16 kHz. En el codificador Lame, por cierto, están cortados de forma predeterminada, lo que aumenta la calidad de la codificación en 128 kbs.

A tasas de bits más altas, si se sigue sistemáticamente el modelo psicoacústico desarrollado por FhG IIS, los problemas sólo pueden deberse a errores introducidos al escribir el codificador. Sin embargo, debido a que FhG IIS no se preocupa demasiado por la calidad de sus codificadores a velocidades de bits altas, en más de una ocasión se ha demostrado que la nueva versión a veces suena incluso un poco peor que la anterior. Creo que la razón radica en la relajación insuficiente o incorrecta de las restricciones del modelo psicoacústico a medida que aumenta la tasa de bits. De nuevo, el primer cliente serio y el problema desaparecerá.




Arriba