Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

ИИ в музыке: приложения и инструменты, такие как MusicBrainz Picard

Абирами Вина

5 мин чтения

12 июля 2024 г.

Присоединяйтесь к нам для глубокого погружения в роль ИИ в музыке, от анализа аудиоданных до создания новой музыки. Изучите его влияние и применение в музыкальной индустрии.

Искусственный интеллект (ИИ) — это воссоздание человеческого интеллекта в машинах. Важной частью человеческой природы является наша связь с искусством, особенно с музыкой. Музыка оказывает глубокое влияние на нашу культуру и эмоции. Благодаря достижениям в области ИИ, машины теперь могут создавать музыку, звучащую так, будто ее сочинили люди. Музыка, созданная ИИ, открывает новые возможности для инновационного сотрудничества между людьми и ИИ и меняет то, как мы воспринимаем музыку и взаимодействуем с ней.

В этой статье мы рассмотрим, как ИИ используется для создания музыки. Мы также обсудим связь между ИИ и инструментами для добавления музыкальных тегов, такими как MusicBrainz Picard, и их влияние на артистов, продюсеров и индустрию развлечений в целом.

Звуковой AI и его значение

ИИ может обрабатывать различные типы данных, включая звук. Звуковые данные, часто называемые аудиоданными, представляют собой смесь волновых частот разной интенсивности во времени. Подобно изображениям или данным временных рядов, аудиоданные можно преобразовать в формат, который могут обрабатывать и анализировать системы ИИ. Звуковые волны можно преобразовать в числовые данные, которые могут быть проанализированы моделями ИИ.

Еще один интересный метод — использование преобразований Фурье, которые преобразуют звуковые волны в спектрограмму. Спектрограмма — это визуальное представление, показывающее, как различные частоты звука изменяются во времени. Модели ИИ могут применять методы распознавания изображений для анализа и интерпретации аудиоданных, рассматривая эту спектрограмму как изображение. ИИ может идентифицировать закономерности и особенности в звуке, так же как и в визуальных данных.

Рис. 1. Пример классификации звука с помощью AI.

Использование ИИ для анализа, обработки и генерации аудиоданных создает широкий спектр приложений. Вот несколько примеров:

  • Создание и сочинение музыки: Создание новой музыки путем обучения на существующих композициях и оказания помощи музыкантам с мелодиями, гармониями и ритмами.
  • Улучшение звука и шумоподавление: Улучшение качества звука за счет снижения фонового шума для колл-центров, слуховых аппаратов и редактирования звука.
  • Создание кратких обзоров подкастов: Создание кратких обзоров эпизодов подкастов для упрощения потребления контента.
  • Распознавание эмоций по речи: Обнаружение эмоций в речи для обслуживания клиентов, мониторинга психического здоровья и исследования пользовательского опыта.

Понимание того, как работают генераторы AI песен

Генераторы песен на основе ИИ работают путем анализа и обучения на существующей музыке, аналогично генерации изображений. Важно понимать разницу между использованием ИИ для понимания музыки и использованием ИИ для ее создания. Понимание музыки включает в себя анализ и выявление закономерностей, в то время как генерация музыки включает в себя создание новых композиций на основе этих изученных закономерностей.

Рис. 2. Сравнение понимания музыки с помощью ИИ и генерации музыки с помощью ИИ.

Процесс создания музыки с помощью ИИ начинается со сбора большого набора музыкальных данных, включающего различные жанры и стили. Затем набор данных разбивается на более мелкие компоненты, такие как ноты, аккорды и ритмы, которые преобразуются в числовые данные, которые может обрабатывать ИИ.

Существует множество различных генеративных моделей ИИ, которые можно обучить для создания музыки. Например, модели ИИ, такие как Transformers и Variational Autoencoders (VAEs), могут работать вместе для создания музыки. VAE могут сжимать входные звуки в латентное пространство, группируя похожие музыкальные произведения близко друг к другу, чтобы запечатлеть разнообразие и богатство музыки. Затем Transformers используют это латентное пространство для создания новой музыки, понимая закономерности и сосредотачиваясь на важных нотах в последовательности.

После обучения модели ИИ на этих данных, ИИ может генерировать новую музыку, предсказывая следующую ноту или аккорд на основе полученных знаний. Он может создавать целые композиции, объединяя эти предсказания. Сгенерированную музыку можно точно настроить в соответствии с определенными стилями или предпочтениями.

Мы начинаем видеть все больше генераторов музыки, использующих эту технологию. Вот несколько примеров:

  • MusicLM от Google: Генерирует музыку на основе текстовых подсказок, позволяя пользователям указывать жанр, настроение, инструменты и общее настроение.
  • MusicGen от Meta: Создает музыку из текстовых описаний или существующих мелодий, используя инструмент под названием EnCodec для обработки аудиоданных.
  • Stable Audio 2.0 от Stability AI: Создает высококачественные аудиодорожки и звуковые эффекты из текстовых и аудиоданных, способен создавать полноценные треки и преобразовывать аудиосэмплы на основе подсказок.

Влияние ИИ на музыкальную индустрию

Инновации в области ИИ создают новые возможности и вызовы для музыкантов, слушателей и продюсеров, приводя к ситуациям, с которыми они, возможно, раньше не сталкивались. Интересно наблюдать, как каждая группа адаптируется к этим достижениям, используя новые инструменты и решая вопросы оригинальности и этики. Помимо создания музыки, ИИ обладает и другими интересными возможностями в музыкальной индустрии, такими как улучшение живых выступлений, совершенствование поиска музыки и помощь в производственных процессах. Давайте подробнее рассмотрим, как ИИ влияет на музыкантов, слушателей и продюсеров в музыкальной индустрии.

Рис. 3. Влияние генеративного ИИ на музыкальную индустрию.

Влияние на музыкантов

ИИ меняет способы создания музыки музыкантами. Инструменты, интегрированные с генеративным ИИ, могут помочь в создании новых мелодий, последовательностей аккордов и текстов, облегчая музыкантам преодоление творческих блоков. ИИ также использовался для завершения незаконченных работ, таких как новая песня The Beatles "Now And Then", созданная с использованием вокала Джона Леннона из старой демо-записи. Однако, рост популярности музыки, сгенерированной ИИ, которая имитирует стиль известных исполнителей, вызывает опасения по поводу оригинальности. Например, такие артисты, как Bad Bunny, обеспокоены тем, что ИИ воспроизводит их голоса и стили без согласия.

Помимо создания музыки, искусственный интеллект и компьютерное зрение могут помочь музыкантам создавать более качественные выступления и музыкальные видеоклипы. Музыкальное видео состоит из множества различных элементов, и один из них - это танцы. Модели оценки позы, такие как Ultralytics YOLOv8 позволяют понять позы человека на изображениях и видео и играют важную роль в создании хореографических танцевальных последовательностей, синхронизированных с музыкой.

Еще один хороший пример использования ИИ в хореографии - проект NVIDIA"Dance to Music". В этом проекте они использовали ИИ и двухэтапный процесс для генерации новых танцевальных движений, которые были разнообразны, соответствовали стилю и ритму. Сначала для изучения различных танцевальных движений в такт ритму на основе большой коллекции танцевальных видеороликов были использованы оценка позы и кинематический детектор ритма. Затем генеративная модель ИИ была использована для организации этих танцевальных движений в хореографию, соответствующую ритму и стилю музыки. Хореографические танцевальные движения, созданные ИИ, добавляют интересный визуальный элемент в музыкальные видео и помогают артистам быть более креативными.

Влияние на слушателей

Для слушателей AI может улучшить процесс поиска и прослушивания музыки. Платформы, такие как Spotify и Apple Music, используют AI для создания персонализированных плейлистов и рекомендации новой музыки на основе привычек прослушивания пользователей. Когда вы открываете для себя новых исполнителей и жанры на этих платформах, это магия AI. 

Виртуальная реальность (VR) на базе ИИ также улучшает впечатления от живых концертов. Например, Трэвис Скотт использует VR для создания виртуальных представлений, которые охватывают глобальную аудиторию. Однако обилие музыки, созданной ИИ, на таких платформах, как TikTok, может затруднить поиск музыки. Это может затруднить новым исполнителям выделиться.

Рис. 4. ИИ делает возможным концерт в виртуальной реальности (VR).

Влияние на продюсеров

Использование ИИ приносит пользу продюсерам несколькими способами. Инструменты ИИ, помогающие в коррекции высоты тона, микшировании и мастеринге, оптимизируют процесс производства. Виртуальные инструменты и синтезаторы на базе ИИ, такие как Watson Beat от IBM, могут создавать новые звуки и текстуры, расширяющие творческие возможности. 

Использование ИИ на стриминговых платформах выгодно не только слушателям, но и помогает продюсерам, расширяя аудиторию. Однако, как и в случае с музыкантами, способность ИИ имитировать стиль известных исполнителей поднимает этические и юридические вопросы об эксплуатации уникальных голосов и стилей артистов. Это привело к юридическим спорам, таким как иски от крупных музыкальных компаний, таких как Universal, Sony и Warner, против ИИ-стартапов, таких как Suno и Udio, за предполагаемое использование защищенных авторским правом произведений для обучения своих моделей без разрешения.

Управление музыкальными библиотеками с помощью AI-интегрированных инструментов, таких как MusicBrainz Picard

Мы вкратце рассмотрели некоторые области применения ИИ в музыке, поняв его влияние на различные заинтересованные стороны музыкальной индустрии. Теперь давайте разберемся в более конкретном применении ИИ в музыке: Инструменты управления музыкой с поддержкой ИИ, такие как MusicBrainz Picard. Эти инструменты невероятно полезны для организации и управления цифровыми музыкальными библиотеками. 

Рис. 5. Управление музыкальными библиотеками с помощью ИИ.

Они автоматически идентифицируют и маркируют музыкальные файлы с помощью точных метаданных, таких как имена исполнителей, названия альбомов и номера track . MusicBrainz Picard облегчает упорядочивание музыкальных коллекций. Одна из ключевых технологий, интегрированных в MusicBrainz Picard, - аудиоотпечатки AcoustID. Эти отпечатки идентифицируют музыкальные файлы на основе их фактического аудиосодержимого, даже если в файлах отсутствуют метаданные.

Почему это так важно? Такиекрупные организации, как BBC, Google, Amazon, Spotify и Pandora, используют данные MusicBrainz для улучшения своих музыкальных сервисов. Метаданные, созданные такими инструментами, как MusicBrainz Picard, крайне важны для разработчиков, создающих музыкальные базы данных, приложения для тегирования и другое программное обеспечение, связанное с музыкой. Основой ИИ являются данные, и без таких инструментов, как Picard, было бы очень сложно получить чистые и точные данные, необходимые для анализа и разработки приложений. Удивительно, что инструменты с поддержкой ИИ используют ИИ и помогают создавать данные, необходимые для приложений ИИ, формируя полезный цикл совершенствования и инноваций.

Заключительные замечания об ИИ в музыке

Мы обсудили волны, которые ИИ создает в музыке. Правовая среда, окружающая музыку, созданную ИИ, также развивается. Действующие правила, такие как правила Бюро авторского права США, предусматривают, что произведения, созданные исключительно ИИ, не могут быть защищены авторским правом, поскольку им не хватает человеческого авторства​​. Однако, если человек вносит значительный вклад в творческий процесс, работа может претендовать на защиту авторским правом. Поскольку ИИ продолжает интегрироваться в музыкальную индустрию, текущие юридические и этические дискуссии будут иметь жизненно важное значение для решения этих проблем. Заглядывая в будущее, ИИ обладает огромным потенциалом в музыке, сочетая технологии с человеческим творчеством, чтобы расширить возможности в создании и производстве музыки.

Изучите ИИ, посетив наш репозиторий GitHub и присоединившись к нашему активному сообществу. Узнайте о применении ИИ в производстве и сельском хозяйстве на страницах с нашими решениями.

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно