Al hacer clic en "Aceptar todas las cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información en
Configuración de cookies
Al hacer clic en "Aceptar todas las cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información en
Acompáñenos en una inmersión profunda en el papel de la IA en la música, desde el análisis de datos de audio hasta la generación de nueva música. Explora su impacto y aplicaciones en la industria musical.
La Inteligencia Artificial (IA) consiste en recrear la inteligencia humana en máquinas. Una parte importante del ser humano es nuestra conexión con las artes, especialmente la música. La música influye profundamente en nuestra cultura y nuestras emociones. Gracias a los avances de la IA, las máquinas pueden crear música que suene como si hubiera sido compuesta por humanos. La IA musical abre nuevas posibilidades de colaboración innovadora entre el ser humano y la IA y transforma nuestra forma de experimentar e interactuar con la música.
En este artículo analizaremos cómo se utiliza la IA para crear música. También hablaremos de la conexión entre la IA y las herramientas de etiquetado musical como MusicBrainz Picard y su impacto en artistas, productores y la industria del entretenimiento en general.
La IA sonora y su importancia
La IA puede manejar varios tipos de datos, incluido el sonido. Los datos sonoros, a menudo denominados datos de audio, son una mezcla de frecuencias de onda con diferentes intensidades a lo largo del tiempo. Al igual que las imágenes o los datos de series temporales, los datos de audio pueden transformarse en un formato que los sistemas de IA puedan procesar y analizar. Las ondas sonoras pueden convertirse en datos numéricos que pueden ser analizados por modelos de IA.
Otro método interesante es utilizar las transformadas de Fourier, que convierten las ondas sonoras en un espectrograma. Un espectrograma es una representación visual que muestra cómo varían las distintas frecuencias del sonido a lo largo del tiempo. Los modelos de IA pueden aplicar técnicas de reconocimiento de imágenes para analizar e interpretar los datos de audio tratando este espectrograma como una imagen. La IA puede identificar patrones y características en el sonido, de forma similar a como lo haría con los datos visuales.
Fig. 1. Ejemplo de clasificación de un sonido por la IA.
El uso de la IA para analizar, manipular y generar datos de audio da lugar a toda una serie de aplicaciones. He aquí algunos ejemplos:
Generación y composición de música: Creación de nueva música aprendiendo de composiciones existentes y ayudando a los músicos con melodías, armonías y ritmos.
Mejora del audio y reducción del ruido: Mejora de la calidad de audio mediante la reducción del ruido de fondo para centros de llamadas, audífonos y edición de audio.
Resúmenes de podcasts: Generación de resúmenes concisos de episodios de podcasts para facilitar el consumo de contenidos.
Detección de emociones a partir del habla: Detección de emociones en el habla para la atención al cliente, la supervisión de la salud mental y la investigación de la experiencia del usuario.
Entender cómo funcionan los generadores de canciones por IA
Los generadores de canciones por IA funcionan analizando y aprendiendo de la música existente, de forma similar a la generación de imágenes. Es importante entender la diferencia entre utilizar la IA para entender la música y utilizarla para generarla. Entender la música implica analizar e identificar patrones, mientras que generar música implica crear nuevas composiciones basadas en esos patrones aprendidos.
Fig. 2. Comparación de la comprensión musical mediante IA y la generación musical mediante IA.
El proceso de generación de música por IA comienza con la recopilación de un gran conjunto de datos musicales que incluye varios géneros y estilos. A continuación, el conjunto de datos se descompone en componentes más pequeños, como notas, acordes y ritmos, que se convierten en datos numéricos que la IA puede procesar.
Existen muchos modelos generativos de IA que pueden entrenarse para generar música. Por ejemplo, modelos de IA como los transformadores y los autocodificadores variacionales (VAE) pueden trabajar juntos para generar música. Los VAE pueden comprimir los sonidos de entrada en un espacio latente agrupando piezas musicales similares para captar la diversidad y riqueza de la música. A continuación, los transformadores utilizan este espacio latente para generar nueva música comprendiendo patrones y centrándose en las notas importantes de una secuencia.
Una vez entrenado un modelo de IA con estos datos, la IA puede generar nueva música prediciendo la siguiente nota o acorde en función de lo que ha aprendido. Puede crear composiciones enteras encadenando estas predicciones. La música generada puede ajustarse a estilos o preferencias específicos.
Estamos empezando a ver más generadores de música que utilizan esta tecnología. He aquí algunos ejemplos:
MusicLM de Google: Genera música a partir de mensajes de texto, permitiendo a los usuarios especificar el género, el estado de ánimo, los instrumentos y la sensación general.
MusicGen de Meta: Crea música a partir de descripciones de texto o melodías existentes, utilizando una herramienta llamada EnCodec para procesar datos de audio.
Stable Audio 2.0 de Stability AI: Produce pistas de audio y efectos de sonido de alta calidad a partir de entradas de texto y audio, capaz de crear pistas completas y transformar muestras de audio basándose en indicaciones.
El impacto de la IA en la industria musical
La innovación de la IA está creando nuevas oportunidades y retos para músicos, oyentes y productores, lo que les lleva a situaciones que quizá no hayan experimentado antes. Es interesante ver cómo se adapta cada grupo a estos avances, cómo utiliza las nuevas herramientas y cómo sortea los problemas de originalidad y ética. Además de generar música, la IA tiene otras interesantes posibilidades en la industria musical, como mejorar las actuaciones en directo, mejorar el descubrimiento de música y ayudar en los procesos de producción. Veamos cómo afecta la IA a músicos, oyentes y productores de la industria musical.
Figura 3. El impacto de la IA generativa en la industria musical.
Impacto en los músicos
La IA está cambiando la forma en que los músicos crean música. Las herramientas integradas con IA generativa pueden ayudar a generar nuevas melodías, progresiones de acordes y letras, lo que facilita a los músicos superar los bloqueos creativos. La IA también se ha utilizado para completar obras inacabadas, como la nueva canción de The Beatles"Now And Then", creada con la voz de John Lennon a partir de una vieja maqueta. Sin embargo, el auge de la música generada por IA que imita el estilo de artistas consagrados plantea problemas de originalidad. Por ejemplo, a artistas como Bad Bunny les preocupa que la IA replique sus voces y estilos sin consentimiento.
Además de crear música, la IA y la visión por ordenador pueden ayudar a los músicos a mejorar sus actuaciones y vídeos musicales. Un vídeo musical consta de muchos elementos diferentes, y uno de ellos es el baile. Los modelos de estimación de poses, como Ultralytics YOLOv8, pueden comprender las poses humanas en imágenes y vídeos y contribuir a crear secuencias de baile coreografiadas y sincronizadas con la música.
Otro buen ejemplo de cómo la IA puede utilizarse en coreografía es el proyecto"Dance to Music" de NVIDIA. En este proyecto, utilizaron la IA y un proceso de dos pasos para generar nuevos movimientos de baile que fueran diversos, coherentes con el estilo y acordes con el ritmo. En primer lugar, se utilizó la estimación de poses y un detector cinemático de ritmo para aprender varios movimientos de baile al compás a partir de una gran colección de vídeos de baile. A continuación, se utilizó un modelo generativo de IA para organizar estos movimientos de baile en coreografías acordes con el ritmo y el estilo de la música. Los movimientos de baile coreografiados por la IA añaden un interesante elemento visual a los vídeos musicales y ayudan a los artistas a ser más creativos.
Impacto en los oyentes
Para los oyentes, la IA puede mejorar la experiencia de descubrir y escuchar música. Plataformas como Spotify y Apple Music utilizan la IA para crear listas de reproducción personalizadas y recomendar nueva música basándose en los hábitos de escucha de los usuarios. Descubrir nuevos artistas y géneros en estas plataformas es la magia de la IA.
La realidad virtual (RV) potenciada por la IA también está mejorando las experiencias de los conciertos en directo. Por ejemplo, Travis Scott utiliza la RV para crear actuaciones virtuales que llegan a audiencias mundiales. Sin embargo, la abundancia de música generada por IA en plataformas como TikTok puede hacer que el descubrimiento musical resulte abrumador. Puede dificultar que los nuevos artistas destaquen.
Fig. 4. La IA hace posible los conciertos en realidad virtual (RV).
Impacto en los productores
Los productores se benefician de la IA de varias maneras. Las herramientas de IA que ayudan a corregir el tono, mezclar y masterizar agilizan el proceso de producción. Los instrumentos y sintetizadores virtuales dotados de IA, como Watson Beat de IBM, pueden crear nuevos sonidos y texturas que amplían las posibilidades creativas.
La IA en las plataformas de streaming no sólo beneficia a los oyentes, sino que también ayuda a los productores al crear una audiencia más amplia. Sin embargo, al igual que preocupa a los músicos, la capacidad de la IA para imitar el estilo de artistas consagrados plantea problemas éticos y legales sobre la explotación de las voces y estilos únicos de los artistas. Esto ha dado lugar a disputas legales, como las demandas de grandes compañías musicales como Universal, Sony y Warner contra startups de IA como Suno y Udio por utilizar supuestamente obras protegidas por derechos de autor para entrenar sus modelos sin permiso.
Gestión de bibliotecas musicales con herramientas integradas en IA como MusicBrainz Picard
Hemos explorado brevemente algunas aplicaciones de la IA en la música comprendiendo su impacto en las distintas partes interesadas de la industria musical. Veamos ahora una aplicación más específica de la IA en la música: Herramientas de gestión musical mejoradas con IA, como MusicBrainz Picard. Estas herramientas son increíblemente útiles para organizar y gestionar bibliotecas de música digital.
Fig. 5. Las bibliotecas musicales pueden gestionarse mediante IA.
Identifican y etiquetan automáticamente los archivos de música con metadatos precisos, como nombres de artistas, títulos de álbumes y números de pista. MusicBrainz Picard facilita la organización de las colecciones de música. Una de las tecnologías clave integradas en MusicBrainz Picard son las huellas digitales de audio AcoustID. Estas huellas identifican los archivos de música basándose en su contenido de audio real, incluso si los archivos carecen de metadatos.
¿Por qué es tan importante? Grandes organizaciones como la BBC, Google, Amazon, Spotify y Pandora confían en los datos de MusicBrainz para mejorar sus servicios relacionados con la música. Los metadatos creados por herramientas como MusicBrainz Picard son cruciales para los desarrolladores que crean bases de datos musicales, aplicaciones de etiquetado u otro software relacionado con la música. La columna vertebral de la IA son los datos, y sin herramientas como Picard sería muy difícil disponer de los datos limpios y precisos necesarios para el análisis y el desarrollo de aplicaciones. Es fascinante que las herramientas mejoradas de IA utilicen la IA y ayuden a crear los datos necesarios para las aplicaciones de IA, formando un ciclo beneficioso de mejora e innovación.
Notas finales sobre la IA en la música
Ya hemos hablado de las olas que está levantando la IA en la música. El panorama legal de la música generada por IA también está evolucionando. Las normativas actuales, como las de la Oficina de Derechos de Autor de Estados Unidos, estipulan que las obras generadas íntegramente por IA no pueden ser objeto de derechos de autor, ya que carecen de autoría humana. Sin embargo, si un ser humano contribuye significativamente al proceso creativo, la obra puede optar a la protección de los derechos de autor. A medida que la IA siga integrándose en la industria musical, los debates jurídicos y éticos serán vitales para superar estos retos. De cara al futuro, la IA tiene un enorme potencial en la música, ya que combina la tecnología con la creatividad humana para ampliar las posibilidades de creación y producción musical.