Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Generative Adversarial Network (GAN)

Khám phá cách Generative Adversarial Networks (GANs) tạo ra dữ liệu tổng hợp thực tế. Tìm hiểu cách huấn luyện Ultralytics YOLO26 với các tập dữ liệu tăng cường bằng GAN cho thị giác AI.

Mạng đối nghịch tạo sinh (GAN) là một khung làm việc phức tạp trong lĩnh vực trí tuệ nhân tạo (AI) được thiết kế để tạo ra các thực thể dữ liệu mới tương tự như dữ liệu huấn luyện của bạn. Được giới thiệu trong một bài báo mang tính đột phá bởi Ian Goodfellow và các cộng sự vào năm 2014, GAN vận hành dựa trên nguyên tắc độc đáo về sự cạnh tranh giữa hai mạng thần kinh riêng biệt. Kiến trúc này đã trở thành nền tảng của AI tạo sinh hiện đại, cho phép tạo ra hình ảnh chân thực, tăng cường video và tổng hợp các tập dữ liệu huấn luyện đa dạng cho các tác vụ học máy phức tạp.

Link to this sectionKiến trúc đối nghịch#

Cơ chế cốt lõi của GAN bao gồm hai mô hình được huấn luyện đồng thời trong một trò chơi có tổng bằng không, thường được mô tả bằng sự tương đồng giữa một người làm hàng giả và một thám tử.

  • Bộ tạo (Generator): Mạng này đóng vai trò là "người làm hàng giả". Nó nhận đầu vào là nhiễu ngẫu nhiên (một vector tiềm ẩn) và cố gắng tạo ra dữ liệu—chẳng hạn như một hình ảnh—trông giống như thật. Mục tiêu chính của nó là đánh lừa bộ phân biệt tin rằng kết quả đầu ra được tạo ra là thực. Quá trình này đóng vai trò cơ bản trong việc tạo ra dữ liệu tổng hợp chất lượng cao.
  • Bộ phân biệt (Discriminator): Đóng vai trò là "thám tử", mạng này đánh giá các đầu vào để phân biệt giữa các mẫu thực từ dữ liệu huấn luyện và các mẫu giả do bộ tạo sản xuất. Nó hoạt động như một bộ phân loại nhị phân tiêu chuẩn, đưa ra xác suất rằng đầu vào là thực.

Trong quá trình huấn luyện, bộ tạo giảm thiểu xác suất mà bộ phân biệt tạo ra phân loại chính xác, trong khi bộ phân biệt tối đa hóa chính xác xác suất đó. Vòng lặp đối nghịch này tiếp tục cho đến khi hệ thống đạt đến Cân bằng Nash, một trạng thái mà bộ tạo tạo ra dữ liệu chân thực đến mức bộ phân biệt không còn có thể phân biệt nó với các ví dụ trong thế giới thực.

Link to this sectionCác ứng dụng thực tế trong Vision AI#

GAN đã vượt xa khỏi lý thuyết học thuật để giải quyết các vấn đề thực tế trong nhiều ngành công nghiệp, đặc biệt là trong thị giác máy tính.

  1. Tăng cường dữ liệu cho huấn luyện mô hình: Trong các tình huống dữ liệu khan hiếm hoặc nhạy cảm về quyền riêng tư, chẳng hạn như phân tích hình ảnh y tế, GAN được sử dụng để tạo ra các ví dụ tổng hợp thực tế. Ví dụ, việc tạo ra các bản quét MRI tổng hợp cho phép các nhà nghiên cứu huấn luyện các mô hình chẩn đoán mạnh mẽ mà không làm ảnh hưởng đến quyền riêng tư của bệnh nhân. Kỹ thuật này cũng rất quan trọng đối với xe tự hành, nơi GAN có thể mô phỏng các điều kiện thời tiết hoặc tình huống giao thông hiếm gặp để cải thiện độ an toàn.

  2. Siêu phân giải và tăng cường hình ảnh: GAN cực kỳ hiệu quả trong siêu phân giải, quá trình nâng cấp hình ảnh có độ phân giải thấp lên độ phân giải cao trong khi vẫn tạo ra các chi tiết hợp lý. Điều này được sử dụng rộng rãi trong việc khôi phục lưu trữ lịch sử, tăng cường hình ảnh vệ tinh cho bản đồ toàn cầu và cải thiện chất lượng phát video.

  3. Chuyển đổi phong cách: Ứng dụng này cho phép áp dụng phong cách thẩm mỹ của hình ảnh này lên nội dung của hình ảnh khác. Các công cụ như CycleGAN cho phép các phép chuyển đổi như biến ảnh ban ngày thành cảnh ban đêm hoặc chuyển đổi bản phác thảo thành các mô hình sản phẩm chân thực, giúp hợp lý hóa quy trình làm việc trong AI trong bán lẻ thời trang.

Link to this sectionSự khác biệt giữa GAN và mô hình khuếch tán#

Mặc dù cả hai đều là công nghệ tạo sinh, nhưng điều quan trọng là phải phân biệt GAN với mô hình khuếch tán như những mô hình được sử dụng trong Stable Diffusion.

  • Tốc độ suy luận: GAN thường tạo dữ liệu trong một lần truyền tiến duy nhất, giúp chúng nhanh hơn đáng kể ở suy luận thời gian thực.
  • Tính ổn định trong huấn luyện: Các mô hình khuếch tán hoạt động bằng cách loại bỏ dần nhiễu khỏi hình ảnh, điều này thường mang lại kết quả huấn luyện ổn định hơn và độ bao phủ chế độ (sự đa dạng) cao hơn. Ngược lại, GAN có thể bị "sụp đổ chế độ" (mode collapse), nơi bộ tạo tạo ra sự đa dạng đầu ra hạn chế, mặc dù các kỹ thuật như Wasserstein GANs (WGAN) giúp giảm thiểu điều này.

Link to this sectionTích hợp dữ liệu do GAN tạo ra với YOLO#

Một trường hợp sử dụng mạnh mẽ cho GAN là tạo các tập dữ liệu tổng hợp để huấn luyện các mô hình phát hiện đối tượng như YOLO26. Nếu bạn thiếu đủ hình ảnh thực tế về một lỗi hoặc đối tượng cụ thể, GAN có thể tạo hàng ngàn biến thể được gán nhãn. Sau đó, bạn có thể quản lý các tập dữ liệu này và huấn luyện mô hình của mình bằng Nền tảng Ultralytics.

Ví dụ sau đây minh họa cách tải một mô hình YOLO26 để huấn luyện trên một tập dữ liệu, có thể bao gồm các hình ảnh tổng hợp do GAN tạo ra một cách liền mạch để tăng hiệu suất:

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Train the model on a dataset configuration file
# The dataset path defined in 'coco8.yaml' can contain both real and GAN-generated images
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

# Verify the model performance on validation data
metrics = model.val()

Link to this sectionThách thức và Cân nhắc#

Mặc dù có khả năng mạnh mẽ, việc huấn luyện GAN đòi hỏi phải tinh chỉnh siêu tham số cẩn thận. Các vấn đề như gradient biến mất có thể xảy ra nếu bộ phân biệt học quá nhanh, không cung cấp phản hồi có ý nghĩa cho bộ tạo. Hơn nữa, khi GAN trở nên có khả năng tạo deepfake hơn, ngành công nghiệp đang ngày càng tập trung vào đạo đức AI và phát triển các phương pháp để phát hiện nội dung do AI tạo ra.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning