Khám phá những nguyên tắc cơ bản của Trí tuệ nhân tạo tạo sinh (Generative AI). Tìm hiểu cách nó tạo ra dữ liệu tổng hợp, tích hợp với... Ultralytics YOLO26, và thúc đẩy sự đổi mới trong lĩnh vực thị giác máy tính.
Trí tuệ nhân tạo tạo sinh (Generative AI) đề cập đến một nhánh nhỏ của trí tuệ nhân tạo (AI) tập trung vào việc tạo ra nội dung mới, chẳng hạn như văn bản, hình ảnh, âm thanh, video và mã máy tính, để đáp ứng các yêu cầu của người dùng. Không giống như các hệ thống AI truyền thống chủ yếu được thiết kế để phân tích hoặc classify Với dữ liệu hiện có, các mô hình tạo sinh sử dụng thuật toán học sâu (DL) để học các mẫu, cấu trúc và phân bố xác suất tiềm ẩn của các tập dữ liệu khổng lồ. Sau khi được huấn luyện, các hệ thống này có thể tạo ra các đầu ra mới có sự tương đồng về mặt thống kê với dữ liệu huấn luyện nhưng là những sáng tạo độc nhất vô nhị. Khả năng này đã đưa Trí tuệ nhân tạo tạo sinh trở thành nền tảng của các mô hình hiện đại, thúc đẩy sự đổi mới trong các ngành công nghiệp sáng tạo, phát triển phần mềm và nghiên cứu khoa học.
Cốt lõi của Trí tuệ nhân tạo tạo sinh (Generative AI) là các kiến trúc mạng nơ-ron phức tạp học cách mã hóa và giải mã thông tin. Các mô hình này thường được huấn luyện bằng phương pháp học không giám sát trên các kho dữ liệu khổng lồ.
Để hiểu về Trí tuệ nhân tạo tạo sinh (Generative AI), điều quan trọng là phải phân biệt nó với Trí tuệ nhân tạo phân biệt (Discriminative AI) . Mặc dù cả hai đều là trụ cột của học máy, nhưng mục tiêu của chúng khác nhau đáng kể.
Tính linh hoạt của Trí tuệ nhân tạo tạo sinh cho phép nó được áp dụng trong nhiều lĩnh vực khác nhau, thường kết hợp với các mô hình phân biệt để tạo ra các quy trình làm việc mạnh mẽ.
Trí tuệ nhân tạo tạo sinh (Generative AI) và các mô hình thị giác máy tính phân biệt (discriminative computer vision) thường hoạt động như những công nghệ bổ sung cho nhau. Một quy trình phổ biến bao gồm việc sử dụng mô hình tạo sinh để tăng cường tập dữ liệu, sau đó huấn luyện mô hình phân biệt trên tập dữ liệu được tăng cường đó bằng các công cụ như Nền tảng Ultralytics .
Sau đây là Python ví dụ minh họa cách sử dụng ultralytics Gói này dùng để tải mô hình YOLO26. Trong quy trình làm việc kết hợp, bạn có thể sử dụng mã này để xác thực các đối tượng trong hình ảnh được tạo ra một cách tổng hợp.
from ultralytics import YOLO
# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")
# Run inference on an image (e.g., a synthetic sample from a generative model)
# The model identifies objects within the generated content
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detection results to verify the synthetic data quality
results[0].show()
Mặc dù mạnh mẽ, Trí tuệ nhân tạo tạo sinh (Generative AI) cũng đặt ra những thách thức cụ thể mà người dùng phải vượt qua. Các mô hình đôi khi có thể tạo ra ảo giác , tạo ra thông tin hoặc hình ảnh nghe có vẻ hợp lý nhưng thực tế lại không chính xác. Thêm vào đó, vì các mô hình này được huấn luyện trên dữ liệu quy mô internet, chúng có thể vô tình truyền bá sự thiên vị trong AI vốn có trong nguồn dữ liệu.
Các vấn đề đạo đức liên quan đến bản quyền và sở hữu trí tuệ cũng rất nổi bật, như đã được thảo luận trong nhiều khuôn khổ đạo đức về trí tuệ nhân tạo. Các nhà nghiên cứu và tổ chức, chẳng hạn như Viện Trí tuệ Nhân tạo hướng đến con người Stanford , đang tích cực nghiên cứu các phương pháp để đảm bảo những công cụ mạnh mẽ này được phát triển và triển khai một cách có trách nhiệm. Hơn nữa, chi phí tính toán để huấn luyện các mô hình khổng lồ này đã dẫn đến sự quan tâm ngày càng tăng đối với việc lượng tử hóa mô hình để làm cho quá trình suy luận tiết kiệm năng lượng hơn trên các thiết bị biên.