Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

AI tạo sinh

Khám phá những nguyên tắc cơ bản của Trí tuệ nhân tạo tạo sinh (Generative AI). Tìm hiểu cách nó tạo ra dữ liệu tổng hợp, tích hợp với... Ultralytics YOLO26, và thúc đẩy sự đổi mới trong lĩnh vực thị giác máy tính.

Trí tuệ nhân tạo tạo sinh (Generative AI) đề cập đến một nhánh nhỏ của trí tuệ nhân tạo (AI) tập trung vào việc tạo ra nội dung mới, chẳng hạn như văn bản, hình ảnh, âm thanh, video và mã máy tính, để đáp ứng các yêu cầu của người dùng. Không giống như các hệ thống AI truyền thống chủ yếu được thiết kế để phân tích hoặc classify Với dữ liệu hiện có, các mô hình tạo sinh sử dụng thuật toán học sâu (DL) để học các mẫu, cấu trúc và phân bố xác suất tiềm ẩn của các tập dữ liệu khổng lồ. Sau khi được huấn luyện, các hệ thống này có thể tạo ra các đầu ra mới có sự tương đồng về mặt thống kê với dữ liệu huấn luyện nhưng là những sáng tạo độc nhất vô nhị. Khả năng này đã đưa Trí tuệ nhân tạo tạo sinh trở thành nền tảng của các mô hình hiện đại, thúc đẩy sự đổi mới trong các ngành công nghiệp sáng tạo, phát triển phần mềm và nghiên cứu khoa học.

Cách thức hoạt động của mô hình tạo sinh

Cốt lõi của Trí tuệ nhân tạo tạo sinh (Generative AI) là các kiến ​​trúc mạng nơ-ron phức tạp học cách mã hóa và giải mã thông tin. Các mô hình này thường được huấn luyện bằng phương pháp học không giám sát trên các kho dữ liệu khổng lồ.

  • Transformer: Đối với văn bản và mã, kiến ​​trúc Transformer sử dụng các cơ chế như tự chú ý để track Mối quan hệ giữa các từ trải dài trên một chuỗi. Điều này cho phép các mô hình ngôn ngữ lớn (LLM) tạo ra văn bản mạch lạc và phù hợp với ngữ cảnh.
  • Mô hình khuếch tán: Đối với việc tạo ảnh, mô hình khuếch tán hoạt động bằng cách thêm nhiễu vào ảnh cho đến khi ảnh không thể nhận ra được nữa, sau đó học cách đảo ngược quá trình này để tái tạo lại một ảnh rõ nét từ nhiễu ngẫu nhiên.
  • GANs: Mạng đối kháng tạo sinh (GANs) sử dụng hai mạng nơ-ron—một mạng tạo sinh và một mạng phân biệt—cạnh tranh với nhau, thúc đẩy mạng tạo sinh tạo ra các kết quả đầu ra ngày càng giống thật hơn.

AI sáng tạo so với AI phân biệt

Để hiểu về Trí tuệ nhân tạo tạo sinh (Generative AI), điều quan trọng là phải phân biệt nó với Trí tuệ nhân tạo phân biệt (Discriminative AI) . Mặc dù cả hai đều là trụ cột của học máy, nhưng mục tiêu của chúng khác nhau đáng kể.

  • Trí tuệ nhân tạo tạo sinh (Generative AI) tập trung vào việc sáng tạo . Nó mô hình hóa sự phân bố của các lớp riêng lẻ để tạo ra các mẫu mới. Ví dụ, một mô hình như Stable Diffusion tạo ra một hình ảnh mới của một con chó dựa trên mô tả bằng văn bản.
  • Trí tuệ nhân tạo phân biệt tập trung vào phân loạidự đoán . Nó học các ranh giới quyết định giữa các lớp để phân loại dữ liệu đầu vào. Các mô hình thị giác hiệu năng cao như YOLO26 là các mô hình phân biệt; chúng xuất sắc trong việc phát hiện đối tượng bằng cách phân tích hình ảnh để xác định và định vị các đối tượng cụ thể (ví dụ: phát hiện một con chó trong ảnh) thay vì tự tạo ra hình ảnh đó.

Các Ứng dụng Thực tế

Tính linh hoạt của Trí tuệ nhân tạo tạo sinh cho phép nó được áp dụng trong nhiều lĩnh vực khác nhau, thường kết hợp với các mô hình phân biệt để tạo ra các quy trình làm việc mạnh mẽ.

  1. Tạo dữ liệu tổng hợp: Một trong những ứng dụng thực tiễn nhất đối với các kỹ sư thị giác máy tính là tạo ra dữ liệu tổng hợp . Việc thu thập dữ liệu thực tế cho các trường hợp hiếm gặp—chẳng hạn như các khuyết tật công nghiệp cụ thể hoặc điều kiện đường xá nguy hiểm—có thể nguy hiểm hoặc tốn kém. Các mô hình tạo sinh có thể tạo ra hàng ngàn hình ảnh chân thực về các tình huống này. Dữ liệu này sau đó được sử dụng để huấn luyện các bộ phát hiện mạnh mẽ như YOLO26 , cải thiện độ chính xác của chúng trong thế giới thực.
  2. Thiết kế sáng tạo và tạo mẫu: Trong lĩnh vực sáng tạo, các công cụ dựa trên mô hình chuyển đổi văn bản thành hình ảnh cho phép các nhà thiết kế nhanh chóng hình dung các ý tưởng. Bằng cách nhập một yêu cầu, nghệ sĩ có thể tạo ra nhiều biến thể của thiết kế sản phẩm, bố cục kiến ​​trúc hoặc tài liệu tiếp thị, giúp đẩy nhanh đáng kể giai đoạn hình thành ý tưởng.
  3. Tạo mã và gỡ lỗi: Quá trình phát triển phần mềm đã được chuyển đổi nhờ các mô hình được huấn luyện trên kho mã nguồn. Những trợ lý này hỗ trợ các nhà phát triển bằng cách đề xuất các đoạn mã, viết tài liệu và thậm chí xác định lỗi, giúp tối ưu hóa vòng đời phần mềm.

Sự phối hợp với thị giác máy tính

Trí tuệ nhân tạo tạo sinh (Generative AI) và các mô hình thị giác máy tính phân biệt (discriminative computer vision) thường hoạt động như những công nghệ bổ sung cho nhau. Một quy trình phổ biến bao gồm việc sử dụng mô hình tạo sinh để tăng cường tập dữ liệu, sau đó huấn luyện mô hình phân biệt trên tập dữ liệu được tăng cường đó bằng các công cụ như Nền tảng Ultralytics .

Sau đây là Python ví dụ minh họa cách sử dụng ultralytics Gói này dùng để tải mô hình YOLO26. Trong quy trình làm việc kết hợp, bạn có thể sử dụng mã này để xác thực các đối tượng trong hình ảnh được tạo ra một cách tổng hợp.

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Run inference on an image (e.g., a synthetic sample from a generative model)
# The model identifies objects within the generated content
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results to verify the synthetic data quality
results[0].show()

Những thách thức và cân nhắc

Mặc dù mạnh mẽ, Trí tuệ nhân tạo tạo sinh (Generative AI) cũng đặt ra những thách thức cụ thể mà người dùng phải vượt qua. Các mô hình đôi khi có thể tạo ra ảo giác , tạo ra thông tin hoặc hình ảnh nghe có vẻ hợp lý nhưng thực tế lại không chính xác. Thêm vào đó, vì các mô hình này được huấn luyện trên dữ liệu quy mô internet, chúng có thể vô tình truyền bá sự thiên vị trong AI vốn có trong nguồn dữ liệu.

Các vấn đề đạo đức liên quan đến bản quyền và sở hữu trí tuệ cũng rất nổi bật, như đã được thảo luận trong nhiều khuôn khổ đạo đức về trí tuệ nhân tạo. Các nhà nghiên cứu và tổ chức, chẳng hạn như Viện Trí tuệ Nhân tạo hướng đến con người Stanford , đang tích cực nghiên cứu các phương pháp để đảm bảo những công cụ mạnh mẽ này được phát triển và triển khai một cách có trách nhiệm. Hơn nữa, chi phí tính toán để huấn luyện các mô hình khổng lồ này đã dẫn đến sự quan tâm ngày càng tăng đối với việc lượng tử hóa mô hình để làm cho quá trình suy luận tiết kiệm năng lượng hơn trên các thiết bị biên.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay