AI trong âm nhạc: Các ứng dụng và công cụ như MusicBrainz Picard

Abirami Vina

5 phút đọc

Ngày 12 tháng 7 năm 2024

Hãy tham gia cùng chúng tôi để tìm hiểu sâu hơn về vai trò của AI trong âm nhạc, từ phân tích dữ liệu âm thanh đến tạo ra âm nhạc mới. Khám phá tác động và ứng dụng của AI trong ngành công nghiệp âm nhạc.

Trí tuệ nhân tạo (AI) là tất cả về việc tái tạo trí thông minh của con người trong máy móc. Một phần quan trọng của con người là mối liên hệ của chúng ta với nghệ thuật, đặc biệt là âm nhạc. Âm nhạc ảnh hưởng sâu sắc đến văn hóa và cảm xúc của chúng ta. Nhờ những tiến bộ trong AI, máy móc hiện có thể tạo ra âm nhạc nghe như được sáng tác bởi con người. Âm nhạc AI mở ra những khả năng mới cho sự hợp tác sáng tạo giữa con người và AI và biến đổi cách chúng ta trải nghiệm và tương tác với âm nhạc.

Trong bài viết này, chúng ta sẽ khám phá cách AI được sử dụng để tạo ra âm nhạc. Chúng ta cũng sẽ thảo luận về mối liên hệ giữa AI và các công cụ gắn thẻ âm nhạc như MusicBrainz Picard và tác động của chúng đối với nghệ sĩ, nhà sản xuất và ngành công nghiệp giải trí nói chung.

AI âm thanh và ý nghĩa của nó

AI có thể xử lý nhiều loại dữ liệu khác nhau, bao gồm cả âm thanh. Dữ liệu âm thanh, thường được gọi là dữ liệu âm thanh, là sự kết hợp của các tần số sóng ở các cường độ khác nhau theo thời gian. Giống như hình ảnh hoặc dữ liệu chuỗi thời gian, dữ liệu âm thanh có thể được chuyển đổi thành định dạng mà hệ thống AI có thể xử lý và phân tích. Sóng âm có thể được chuyển đổi thành dữ liệu số có thể được phân tích bởi các mô hình AI.

Một phương pháp thú vị khác là sử dụng Biến đổi Fourier, chuyển đổi sóng âm thành phổ đồ. Phổ đồ là biểu diễn trực quan cho thấy các tần số âm thanh khác nhau thay đổi như thế nào theo thời gian. Các mô hình AI có thể áp dụng các kỹ thuật nhận dạng hình ảnh để phân tích và diễn giải dữ liệu âm thanh bằng cách xử lý phổ đồ này như một hình ảnh. AI có thể xác định các mẫu và đặc điểm trong âm thanh, giống như cách nó làm với dữ liệu trực quan.

__wf_reserved_thừa kế
Hình 1. Một ví dụ về âm thanh được phân loại bằng AI.

Sử dụng AI để phân tích, xử lý và tạo dữ liệu âm thanh tạo ra nhiều ứng dụng. Sau đây là một số ví dụ:

  • Sáng tác và sáng tác nhạc: Sáng tác nhạc mới bằng cách học hỏi từ các tác phẩm hiện có và hỗ trợ nhạc sĩ về giai điệu, hòa âm và nhịp điệu.
  • Cải thiện âm thanh và giảm tiếng ồn: Cải thiện chất lượng âm thanh bằng cách giảm tiếng ồn xung quanh cho các tổng đài , máy trợ thính và chỉnh sửa âm thanh.
  • Tóm tắt podcast: Tạo bản tóm tắt ngắn gọn các tập podcast để dễ tiếp nhận nội dung hơn.
  • Phát hiện cảm xúc từ giọng nói: Phát hiện cảm xúc trong giọng nói để phục vụ dịch vụ khách hàng, theo dõi sức khỏe tâm thần và nghiên cứu trải nghiệm người dùng.

Hiểu cách hoạt động của trình tạo bài hát AI

Trình tạo bài hát AI hoạt động bằng cách phân tích và học hỏi từ âm nhạc hiện có, tương tự như tạo hình ảnh . Điều quan trọng là phải hiểu sự khác biệt giữa việc sử dụng AI để hiểu âm nhạc và sử dụng AI để tạo ra âm nhạc. Hiểu âm nhạc liên quan đến việc phân tích và xác định các mẫu, trong khi tạo ra âm nhạc liên quan đến việc tạo ra các sáng tác mới dựa trên các mẫu đã học đó.

__wf_reserved_thừa kế
Hình 2. So sánh khả năng hiểu âm nhạc bằng AI và công nghệ tạo nhạc bằng AI.

Quá trình tạo nhạc AI bắt đầu bằng việc thu thập một tập dữ liệu âm nhạc lớn bao gồm nhiều thể loại và phong cách khác nhau. Sau đó, tập dữ liệu được chia thành các thành phần nhỏ hơn như nốt nhạc, hợp âm và nhịp điệu, được chuyển đổi thành dữ liệu số mà AI có thể xử lý.

Có nhiều mô hình AI tạo sinh khác nhau có thể được đào tạo để tạo ra âm nhạc. Ví dụ, các mô hình AI như Transformers và Variational Autoencoders (VAE) có thể hoạt động cùng nhau để tạo ra âm nhạc. VAE có thể nén âm thanh đầu vào thành một không gian tiềm ẩn bằng cách nhóm các bản nhạc tương tự lại gần nhau để nắm bắt sự đa dạng và phong phú của âm nhạc. Sau đó, Transformers sử dụng không gian tiềm ẩn này để tạo ra âm nhạc mới bằng cách hiểu các mẫu và tập trung vào các nốt quan trọng trong một chuỗi.

Khi mô hình AI được đào tạo trên dữ liệu này, AI có thể tạo ra âm nhạc mới bằng cách dự đoán nốt nhạc hoặc hợp âm tiếp theo dựa trên những gì nó đã học được. Nó có thể tạo ra toàn bộ tác phẩm bằng cách xâu chuỗi những dự đoán này lại với nhau. Âm nhạc được tạo ra có thể được tinh chỉnh để phù hợp với các phong cách hoặc sở thích cụ thể.

Chúng tôi bắt đầu thấy nhiều máy phát nhạc sử dụng công nghệ này hơn. Sau đây là một số ví dụ:

  • MusicLM của Google: Tạo nhạc dựa trên lời nhắc văn bản, cho phép người dùng chỉ định thể loại, tâm trạng, nhạc cụ và cảm nhận chung.
  • MusicGen của Meta: Tạo nhạc từ mô tả văn bản hoặc giai điệu có sẵn, sử dụng công cụ có tên EnCodec để xử lý dữ liệu âm thanh.
  • Stable Audio 2.0 của Stability AI: Tạo ra các bản âm thanh và hiệu ứng âm thanh chất lượng cao từ văn bản và đầu vào âm thanh, có khả năng tạo ra các bản âm thanh đầy đủ và chuyển đổi các mẫu âm thanh dựa trên lời nhắc.

Tác động của AI đến ngành công nghiệp âm nhạc

Sự đổi mới của AI đang tạo ra những cơ hội và thách thức mới cho các nhạc sĩ, người nghe và nhà sản xuất, dẫn đến những tình huống mà họ có thể chưa từng trải qua trước đây. Thật thú vị khi thấy cách mỗi nhóm thích nghi với những tiến bộ này, sử dụng các công cụ mới và giải quyết các mối quan tâm về tính nguyên bản và đạo đức. Bên cạnh việc tạo ra âm nhạc, AI còn có tiềm năng thú vị khác trong ngành công nghiệp âm nhạc, như nâng cao hiệu suất biểu diễn trực tiếp, cải thiện khả năng khám phá âm nhạc và hỗ trợ các quy trình sản xuất. Hãy cùng xem xét kỹ hơn cách AI đang tác động đến các nhạc sĩ, người nghe và nhà sản xuất trong ngành công nghiệp âm nhạc.

__wf_reserved_thừa kế
Hình 3. Tác động của AI tạo sinh lên ngành công nghiệp âm nhạc.

Tác động đến các nhạc sĩ

AI đang thay đổi cách các nhạc sĩ sáng tác nhạc. Các công cụ tích hợp với AI tạo ra có thể giúp tạo ra giai điệu, tiến trình hợp âm và lời bài hát mới, giúp các nhạc sĩ dễ dàng vượt qua các rào cản sáng tạo hơn. AI cũng đã được sử dụng để hoàn thiện các tác phẩm còn dang dở, chẳng hạn như bài hát mới của The Beatles " Now And Then ", được tạo ra bằng giọng hát của John Lennon từ một bản demo cũ. Tuy nhiên, sự gia tăng của âm nhạc do AI tạo ra bắt chước phong cách của các nghệ sĩ đã thành danh làm dấy lên mối lo ngại về tính độc đáo. Ví dụ, các nghệ sĩ như Bad Bunny lo ngại về việc AI sao chép giọng hát và phong cách của họ mà không được sự đồng ý.

Ngoài việc tạo ra âm nhạc, AI và thị giác máy tính có thể giúp các nhạc sĩ tạo ra các màn trình diễn và video âm nhạc tốt hơn. Một video âm nhạc bao gồm nhiều yếu tố khác nhau và một trong những yếu tố đó là khiêu vũ. Các mô hình ước tính tư thế như Ultralytics YOLOv8 có thể hiểu tư thế của con người trong hình ảnh và video và đóng vai trò trong việc tạo ra các chuỗi khiêu vũ được biên đạo đồng bộ với âm nhạc.

Một ví dụ tốt khác về cách AI có thể được sử dụng cho biên đạo là dự án " Dance to Music " của NVIDIA. Trong dự án này, họ đã sử dụng AI và quy trình hai bước để tạo ra các động tác nhảy mới đa dạng, nhất quán về phong cách và phù hợp với nhịp điệu. Đầu tiên, ước tính tư thế và máy dò nhịp động học được sử dụng để học các động tác nhảy theo nhịp điệu khác nhau từ một bộ sưu tập lớn các video khiêu vũ. Sau đó, một mô hình AI tạo ra được sử dụng để sắp xếp các động tác nhảy này thành vũ đạo phù hợp với nhịp điệu và phong cách của âm nhạc. Các động tác nhảy được biên đạo bằng AI thêm một yếu tố trực quan thú vị vào video âm nhạc và giúp nghệ sĩ sáng tạo hơn.

Tác động đến người nghe

Đối với người nghe, AI có thể cải thiện trải nghiệm khám phá và nghe nhạc. Các nền tảng như Spotify và Apple Music đang sử dụng AI để quản lý danh sách phát được cá nhân hóa và đề xuất nhạc mới dựa trên thói quen nghe nhạc của người dùng. Khi bạn khám phá ra nghệ sĩ và thể loại nhạc mới trên các nền tảng này, đó chính là phép thuật của AI. 

Thực tế ảo (VR) hỗ trợ bởi AI cũng đang cải thiện trải nghiệm hòa nhạc trực tiếp. Ví dụ, Travis Scott sử dụng VR để tạo ra các buổi biểu diễn ảo tiếp cận khán giả toàn cầu. Tuy nhiên, sự phong phú của âm nhạc do AI tạo ra trên các nền tảng như TikTok có thể khiến việc khám phá âm nhạc trở nên quá sức. Điều này có thể khiến các nghệ sĩ mới khó nổi bật.

__wf_reserved_thừa kế
Hình 4. AI giúp trải nghiệm hòa nhạc thực tế ảo (VR) trở nên khả thi.

Tác động đến nhà sản xuất

Các nhà sản xuất được hưởng lợi từ AI theo nhiều cách. Các công cụ AI hỗ trợ hiệu chỉnh cao độ, phối nhạc và làm chủ hợp lý hóa quy trình sản xuất. Các nhạc cụ ảo và bộ tổng hợp được hỗ trợ bởi AI, như Watson Beat của IBM, có thể tạo ra âm thanh và kết cấu mới giúp mở rộng khả năng sáng tạo. 

AI trên các nền tảng phát trực tuyến không chỉ mang lại lợi ích cho người nghe; nó còn giúp các nhà sản xuất bằng cách tạo ra lượng khán giả rộng hơn. Tuy nhiên, cũng giống như các nhạc sĩ, khả năng bắt chước phong cách của các nghệ sĩ nổi tiếng của AI đặt ra các vấn đề về đạo đức và pháp lý về việc khai thác giọng hát và phong cách độc đáo của nghệ sĩ. Điều này đã dẫn đến các tranh chấp pháp lý , chẳng hạn như các vụ kiện từ các công ty âm nhạc lớn như Universal, Sony và Warner chống lại các công ty khởi nghiệp AI như Suno và Udio vì bị cáo buộc sử dụng các tác phẩm có bản quyền để đào tạo mô hình của họ mà không được phép.

Quản lý thư viện nhạc bằng các công cụ tích hợp AI như MusicBrainz Picard

Chúng tôi đã khám phá sơ qua một số ứng dụng của AI trong âm nhạc bằng cách hiểu tác động của nó đối với các bên liên quan khác nhau trong ngành công nghiệp âm nhạc. Bây giờ, hãy cùng tìm hiểu một ứng dụng cụ thể hơn của AI trong âm nhạc: các công cụ quản lý âm nhạc được tăng cường AI như MusicBrainz Picard . Các công cụ này cực kỳ hữu ích để tổ chức và quản lý các thư viện nhạc kỹ thuật số. 

__wf_reserved_thừa kế
Hình 5. Thư viện nhạc có thể được quản lý bằng AI.

Chúng tự động nhận dạng và gắn thẻ các tệp nhạc với siêu dữ liệu chính xác, chẳng hạn như tên nghệ sĩ, tiêu đề album và số bản nhạc. MusicBrainz Picard giúp bạn dễ dàng sắp xếp bộ sưu tập nhạc một cách khoa học. Một trong những công nghệ chính được tích hợp vào MusicBrainz Picard là dấu vân tay âm thanh AcoustID. Những dấu vân tay này nhận dạng các tệp nhạc dựa trên nội dung âm thanh thực tế của chúng, ngay cả khi các tệp không có siêu dữ liệu.

Tại sao điều này lại quan trọng đến vậy? Các tổ chức lớn như BBC, Google, Amazon, Spotify và Pandora dựa vào dữ liệu MusicBrainz để nâng cao các dịch vụ liên quan đến âm nhạc của họ. Siêu dữ liệu được tạo ra bởi các công cụ như MusicBrainz Picard rất quan trọng đối với các nhà phát triển xây dựng cơ sở dữ liệu âm nhạc, ứng dụng gắn thẻ hoặc phần mềm liên quan đến âm nhạc khác. Xương sống của AI là dữ liệu và nếu không có các công cụ như Picard, sẽ rất khó để có được dữ liệu sạch, chính xác cần thiết cho việc phân tích và phát triển ứng dụng. Thật hấp dẫn khi các công cụ được tăng cường AI sử dụng AI và giúp tạo ra dữ liệu cần thiết cho các ứng dụng AI, tạo thành một chu kỳ cải tiến và đổi mới có lợi.

Ghi chú cuối cùng về AI trong âm nhạc

Chúng tôi đã thảo luận về những làn sóng mà AI trong âm nhạc đang tạo ra. Bối cảnh pháp lý xung quanh âm nhạc do AI tạo ra cũng đang phát triển. Các quy định hiện hành, chẳng hạn như quy định của Văn phòng Bản quyền Hoa Kỳ , quy định rằng các tác phẩm do AI tạo ra hoàn toàn không thể được bảo vệ bản quyền vì chúng không có tác giả là con người. Tuy nhiên, nếu con người đóng góp đáng kể vào quá trình sáng tạo, tác phẩm có thể đủ điều kiện để được bảo vệ bản quyền. Khi AI tiếp tục tích hợp vào ngành công nghiệp âm nhạc, các cuộc thảo luận về mặt pháp lý và đạo đức đang diễn ra sẽ rất quan trọng để vượt qua những thách thức này. Nhìn về phía trước, AI có tiềm năng to lớn trong âm nhạc, kết hợp công nghệ với sự sáng tạo của con người để mở rộng khả năng sáng tác và sản xuất âm nhạc.

Khám phá AI bằng cách truy cập kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng sôi động của chúng tôi. Tìm hiểu về các ứng dụng AI trong sản xuấtnông nghiệp trên các trang giải pháp của chúng tôi.

Hãy cùng xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của máy học

Bắt đầu miễn phí
Liên kết đã được sao chép vào clipboard