Thuật ngữ

AI tạo ra

Khám phá cách AI tạo ra nội dung gốc như văn bản, hình ảnh và âm thanh, chuyển đổi các ngành công nghiệp bằng các ứng dụng sáng tạo.

Trí tuệ nhân tạo (AI) tạo sinh là một loại hệ thống trí tuệ nhân tạo (AI) có khả năng tạo ra nội dung mới và độc đáo, bao gồm văn bản, hình ảnh, âm thanh và video. Không giống như AI truyền thống phân tích hoặc xử lý dữ liệu hiện có, các mô hình tạo sinh học các mẫu và cấu trúc cơ bản từ một kho dữ liệu đào tạo khổng lồ để tạo ra các kết quả đầu ra mới mô phỏng các đặc điểm của dữ liệu mà chúng được đào tạo. Công nghệ này được hỗ trợ bởi các mô hình học sâu phức tạp, chẳng hạn như mô hình ngôn ngữ lớn (LLM) , vốn ngày càng dễ tiếp cận và mạnh mẽ.

Trí tuệ nhân tạo (AI) tạo ra hoạt động như thế nào?

Về cốt lõi, Trí tuệ nhân tạo (AI) tạo sinh dựa trên mạng nơ-ron (NN) được đào tạo trên các tập dữ liệu khổng lồ. Trong quá trình đào tạo, mô hình học một phân phối xác suất của dữ liệu. Khi được cung cấp một gợi ý hoặc dữ liệu đầu vào, nó sử dụng phân phối đã học này để dự đoán và tạo ra phần tử có khả năng xuất hiện cao nhất tiếp theo trong một chuỗi, cho dù đó là một từ, một điểm ảnh hay một nốt nhạc. Quá trình này được lặp lại để xây dựng một nội dung hoàn chỉnh. Nhiều mô hình tạo sinh hiện đại được xây dựng trên kiến trúc Transformer , sử dụng cơ chế chú ý để cân nhắc tầm quan trọng của các phần khác nhau của dữ liệu đầu vào, cho phép nó nắm bắt các mối phụ thuộc phức tạp, tầm xa và tạo ra các đầu ra có tính nhất quán cao. Những mô hình mạnh mẽ, được đào tạo trước này thường được gọi là các mô hình nền tảng .

AI sáng tạo so với AI phân biệt đối xử

Đối trọng của AI Tạo sinh là AI Phân biệt. Sự khác biệt chính nằm ở mục tiêu của chúng:

  • Mô hình sinh: Tìm hiểu cách phân phối dữ liệu để tạo các mẫu dữ liệu mới. Mục tiêu của chúng là trả lời câu hỏi "Dữ liệu trông như thế nào?". Ví dụ bao gồm các mô hình tổng hợp văn bản thành hình ảnh hoặc tạo văn bản .
  • Mô hình Phân biệt: Tìm hiểu ranh giới giữa các lớp dữ liệu khác nhau để phân loại hoặc dự đoán nhãn cho một đầu vào nhất định. Mục tiêu của chúng là trả lời câu hỏi: "Sự khác biệt giữa các nhóm này là gì?". Hầu hết các tác vụ trong học có giám sát , chẳng hạn như phân loại hình ảnhphát hiện đối tượng được thực hiện bởi các mô hình như Ultralytics YOLO , đều thuộc loại này.

Trong khi các mô hình phân biệt rất tốt cho việc phân loại và dự đoán, các mô hình tạo sinh lại vượt trội trong việc sáng tạo và tăng cường.

Ứng dụng trong thế giới thực

Trí tuệ nhân tạo đang chuyển đổi nhiều ngành công nghiệp với nhiều ứng dụng đa dạng:

  1. Tạo và Mở rộng Nội dung : Các mô hình như GPT-4 có thể viết bài viết, email và mã, trong khi các mô hình chuyển văn bản thành hình ảnh như DALL-E 3 và Midjourney tạo ra hình ảnh ấn tượng từ các mô tả văn bản đơn giản. Điều này đang cách mạng hóa các lĩnh vực từ tiếp thị và giải trí đến phát triển phần mềm, với các công cụ như GitHub Copilot hỗ trợ các nhà phát triển.
  2. Tạo dữ liệu tổng hợp : AI tạo sinh có thể tạo ra dữ liệu nhân tạo, thực tế để huấn luyện các mô hình học máy (ML) khác. Ví dụ, trong AI ô tô , nó có thể tạo ra các tình huống lái xe hiếm gặp để cải thiện độ tin cậy của các mô hình nhận thức trong xe tự hành . Tương tự, trong chăm sóc sức khỏe, nó có thể tạo ra hình ảnh y tế tổng hợp để huấn luyện các công cụ chẩn đoán, giúp khắc phục các thách thức liên quan đến quyền riêng tư dữ liệu và hạn chế về bộ dữ liệu . Kỹ thuật này bổ sung cho việc tăng cường dữ liệu truyền thống.

Các loại mô hình sinh sản phổ biến

Một số kiến trúc đóng vai trò then chốt trong sự phát triển của AI tạo sinh:

  • Mạng đối nghịch tạo sinh (GAN) : Bao gồm hai mạng nơ-ron cạnh tranh—một mạng tạo và một mạng phân biệt—hoạt động cùng nhau để tạo ra đầu ra có độ chân thực cao.
  • Mô hình khuếch tán : Dần dần thêm nhiễu vào hình ảnh và sau đó học cách đảo ngược quy trình để tạo ra hình ảnh có độ trung thực cao. Đây là công nghệ đằng sau các mô hình như Khuếch tán ổn định .
  • Mô hình Ngôn ngữ Lớn (LLM) : Dựa trên kiến trúc Transformer, các mô hình này được đào tạo trên một lượng lớn dữ liệu văn bản để hiểu và tạo ra ngôn ngữ giống con người. Các tổ chức nghiên cứu hàng đầu như Google AIMeta AI không ngừng mở rộng ranh giới của những gì có thể.

Những thách thức và cân nhắc về mặt đạo đức

Sự phát triển nhanh chóng của Trí tuệ Nhân tạo (AI) tạo ra những thách thức đáng kể. Nguy cơ bị lạm dụng, chẳng hạn như tạo deepfake cho các chiến dịch thông tin sai lệch hoặc vi phạm quyền sở hữu trí tuệ , là một mối lo ngại lớn. Các mô hình cũng có thể duy trì và khuếch đại các sai lệch thuật toán hiện diện trong dữ liệu huấn luyện của chúng. Việc giải quyết những vấn đề này đòi hỏi cam kết mạnh mẽ về đạo đức AI và phát triển các khuôn khổ quản trị mạnh mẽ. Hơn nữa, việc huấn luyện các mô hình lớn này đòi hỏi khối lượng tính toán lớn, làm dấy lên lo ngại về tác động môi trường của chúng. Việc quản lý hiệu quả vòng đời mô hình thông qua các nền tảng MLOps như Ultralytics HUB có thể giúp hợp lý hóa quá trình phát triển và triển khai .

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard