Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Generative AI

Khám phá các nguyên tắc cơ bản của Generative AI. Tìm hiểu cách nó tạo ra dữ liệu tổng hợp, tích hợp với Ultralytics YOLO26 và thúc đẩy sự đổi mới trong thị giác máy tính.

Generative AI là một tập hợp con của trí tuệ nhân tạo (AI) tập trung vào việc tạo nội dung mới, như văn bản, hình ảnh, âm thanh, video và mã máy tính, nhằm phản hồi các prompt của người dùng. Không giống như các hệ thống AI truyền thống vốn được thiết kế chủ yếu để phân tích hoặc phân loại dữ liệu hiện có, các generative model sử dụng các thuật toán học sâu (DL) để học các mẫu, cấu trúc và phân phối xác suất tiềm ẩn của các tập dữ liệu khổng lồ. Sau khi được huấn luyện, các hệ thống này có thể tạo ra các kết quả mới lạ chia sẻ những điểm tương đồng thống kê với dữ liệu huấn luyện nhưng lại là những tác phẩm độc bản. Khả năng này đã đưa Generative AI trở thành nền tảng của các mô hình nền tảng (foundation models) hiện đại, thúc đẩy sự đổi mới trong các ngành sáng tạo, phát triển phần mềm và nghiên cứu khoa học.

Link to this sectionGenerative Model hoạt động như thế nào#

Cốt lõi của Generative AI là các kiến trúc mạng thần kinh (neural network) phức tạp giúp học cách mã hóa và giải mã thông tin. Các mô hình này thường được huấn luyện bằng học không giám sát (unsupervised learning) trên các kho dữ liệu khổng lồ.

  • Transformers: Đối với văn bản và mã nguồn, kiến trúc Transformer sử dụng các cơ chế như tự chú ý (self-attention) để theo dõi mối quan hệ giữa các từ trong khoảng cách xa trong một chuỗi. Điều này cho phép các mô hình ngôn ngữ lớn (LLMs) tạo ra văn bản mạch lạc và phù hợp với ngữ cảnh.
  • Diffusion Models: Đối với việc tạo hình ảnh, diffusion models hoạt động bằng cách thêm nhiễu vào một hình ảnh cho đến khi nó không thể nhận dạng được, sau đó học cách đảo ngược quá trình này để tái tạo một hình ảnh rõ nét từ nhiễu ngẫu nhiên.
  • GANs: Generative Adversarial Networks (GANs) sử dụng hai mạng thần kinh—một mạng tạo (generator) và một mạng phân biệt (discriminator)—cạnh tranh với nhau, thúc đẩy mạng tạo sản xuất các kết quả ngày càng thực tế hơn.

Link to this sectionGenerative AI so với Discriminative AI#

Để hiểu Generative AI, điều quan trọng là phải phân biệt nó với Discriminative AI. Mặc dù cả hai đều là trụ cột của học máy, nhưng mục tiêu của chúng khác nhau đáng kể.

  • Generative AI tập trung vào sáng tạo. Nó mô hình hóa phân phối của các lớp riêng lẻ để tạo ra các mẫu mới. Ví dụ, một mô hình như Stable Diffusion tạo ra một hình ảnh mới về một chú chó dựa trên các mô tả văn bản.
  • Discriminative AI tập trung vào phân loạidự đoán. Nó học các ranh giới quyết định giữa các lớp để phân loại dữ liệu đầu vào. Các mô hình thị giác hiệu năng cao như YOLO26 là các mô hình mang tính phân biệt; chúng vượt trội trong việc phát hiện đối tượng (object detection) bằng cách phân tích hình ảnh để xác định và định vị các đối tượng cụ thể (ví dụ: phát hiện một chú chó trong ảnh) thay vì tạo ra hình ảnh đó.

Link to this sectionCác ứng dụng trong thực tế#

Tính linh hoạt của Generative AI cho phép nó được ứng dụng trong nhiều lĩnh vực khác nhau, thường kết hợp cùng với các mô hình phân biệt để tạo ra các quy trình làm việc mạnh mẽ.

  1. Tạo dữ liệu tổng hợp (Synthetic Data Generation): Một trong những ứng dụng thực tế nhất cho các kỹ sư thị giác máy tính là tạo ra dữ liệu tổng hợp (synthetic data). Việc thu thập dữ liệu thực tế cho các trường hợp biên hiếm gặp—như các lỗi công nghiệp cụ thể hoặc điều kiện đường xá nguy hiểm—có thể gây nguy hiểm hoặc tốn kém. Các generative model có thể tạo ra hàng ngàn hình ảnh chân thực về các tình huống này. Dữ liệu này sau đó được sử dụng để huấn luyện các bộ phát hiện mạnh mẽ như YOLO26, cải thiện độ chính xác của chúng trong thế giới thực.

  2. Thiết kế sáng tạo và tạo mẫu (Prototyping): Trong lĩnh vực sáng tạo, các công cụ hỗ trợ bởi mô hình văn bản-thành-hình ảnh (text-to-image) cho phép các nhà thiết kế nhanh chóng hình dung các ý tưởng. Bằng cách nhập một prompt, một nghệ sĩ có thể tạo ra nhiều biến thể của thiết kế sản phẩm, bố cục kiến trúc hoặc tài sản tiếp thị, đẩy nhanh đáng kể giai đoạn lên ý tưởng.

  3. Tạo và gỡ lỗi mã nguồn: Phát triển phần mềm đã được chuyển đổi nhờ các mô hình được huấn luyện trên các kho mã nguồn. Các trợ lý này hỗ trợ nhà phát triển bằng cách gợi ý các đoạn mã, viết tài liệu và thậm chí xác định lỗi, giúp tối ưu hóa vòng đời phần mềm.

Link to this sectionSự cộng hưởng với thị giác máy tính#

Generative AI và các mô hình thị giác máy tính phân biệt thường hoạt động như các công nghệ bổ trợ. Một quy trình phổ biến bao gồm việc sử dụng một generative model để tăng cường tập dữ liệu, sau đó huấn luyện một mô hình phân biệt trên tập dữ liệu đã nâng cao đó bằng các công cụ như Ultralytics Platform.

Ví dụ Python sau đây minh họa cách sử dụng gói ultralytics để tải một mô hình YOLO26. Trong một quy trình làm việc kết hợp, bạn có thể sử dụng mã này để xác thực các đối tượng trong một hình ảnh được tạo tổng hợp.

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Run inference on an image (e.g., a synthetic sample from a generative model)
# The model identifies objects within the generated content
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results to verify the synthetic data quality
results[0].show()

Link to this sectionThách thức và Cân nhắc#

Mặc dù mạnh mẽ, Generative AI cũng giới thiệu những thách thức cụ thể mà người dùng phải điều hướng. Các mô hình đôi khi có thể tạo ra các ảo tưởng (hallucinations), tạo ra thông tin nghe có vẻ hợp lý nhưng lại không chính xác về mặt thực tế hoặc các lỗi hình ảnh. Ngoài ra, vì các mô hình này được huấn luyện trên dữ liệu quy mô internet, chúng có thể vô tình lan truyền định kiến trong AI (bias in AI) có sẵn trong tài liệu nguồn.

Các lo ngại về đạo đức liên quan đến bản quyền và sở hữu trí tuệ cũng rất nổi bật, như đã được thảo luận trong nhiều khuôn khổ Đạo đức AI (AI Ethics). Các nhà nghiên cứu và tổ chức, chẳng hạn như Stanford Institute for Human-Centered AI, đang tích cực làm việc trên các phương pháp để đảm bảo những công cụ mạnh mẽ này được phát triển và triển khai một cách có trách nhiệm. Hơn nữa, chi phí tính toán cho việc huấn luyện các mô hình khổng lồ này đã dẫn đến sự quan tâm ngày càng tăng đối với lượng tử hóa mô hình (model quantization) để giúp việc suy luận tiết kiệm năng lượng hơn trên các thiết bị biên.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning