Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Latent Diffusion Model (LDM)

Tìm hiểu cách Latent Diffusion Models (LDMs) tạo dữ liệu tổng hợp chất lượng cao một cách hiệu quả. Khám phá cách xác thực đầu ra của LDM bằng Ultralytics YOLO26 ngay hôm nay.

Latent Diffusion Model (LDM) là một loại Generative AI tiên tiến được thiết kế để tổng hợp hình ảnh, video hoặc âm thanh chất lượng cao với hiệu suất tính toán vượt trội. Không giống như các model truyền thống hoạt động trực tiếp trên dữ liệu pixel đa chiều, LDM nén dữ liệu đầu vào thành một biểu diễn có chiều thấp hơn gọi là không gian tiềm ẩn (latent space). Quy trình khuếch tán cốt lõi—bao gồm việc lặp đi lặp lại quá trình thêm và loại bỏ nhiễu để tạo ra kết quả đầu ra có cấu trúc—diễn ra hoàn toàn trong không gian nén này. Bằng cách tách biệt việc tạo mô hình khỏi không gian pixel độ phân giải cao, LDM giảm đáng kể bộ nhớ và năng lượng tính toán cần thiết cho các tác vụ deep learning, giúp khả thi việc chạy các workflow tạo sinh phức tạp trên phần cứng phổ thông.

Link to this sectionPhân biệt các thuật ngữ liên quan#

Để hiểu kiến trúc của một LDM, việc đối chiếu nó với các khái niệm liên quan chặt chẽ về computer vision và tạo sinh sẽ rất hữu ích:

  • Diffusion Models so với LDM: Các model khuếch tán tiêu chuẩn thực hiện các quy trình nhiễu xuôi và ngược trực tiếp trên dữ liệu pixel thô. Mặc dù có độ chính xác cao, phương pháp này đòi hỏi chi phí tính toán lớn. LDM giải quyết vấn đề này bằng cách sử dụng autoencoder để ánh xạ hình ảnh vào một không gian tiềm ẩn nhỏ hơn, thực hiện khuếch tán tại đó, và giải mã kết quả trở lại dạng pixel.
  • Stable Diffusion so với LDM: Stable Diffusion là một triển khai cụ thể, được áp dụng rộng rãi của Latent Diffusion Model. Nói cách khác, tất cả các model Stable Diffusion đều là LDM, nhưng không phải tất cả LDM đều là Stable Diffusion.

Link to this sectionCác ứng dụng trong thực tế#

Hiệu suất của LDM đã mở ra vô số ứng dụng thực tế trong nghiên cứu và công nghiệp, phần lớn được ghi lại trong các bài báo học thuật trên arXiv và được khám phá bởi các tổ chức như Google DeepMind.

  • Synthetic Data Generation: Các kỹ sư thường xuyên sử dụng LDM để tạo ra dữ liệu hình ảnh tổng hợp đa dạng, độ trung thực cao về các trường hợp biên hiếm gặp, chẳng hạn như điều kiện thời tiết cụ thể hoặc các lỗi bất thường trong sản xuất. Dữ liệu tổng hợp này sau đó được sử dụng để huấn luyện mạnh mẽ các model object detection, giúp giảm thời gian cần thiết cho việc thu thập dữ liệu thủ công.
  • Chỉnh sửa hình ảnh nâng cao và Inpainting: LDM vượt trội trong việc sửa đổi các hình ảnh hiện có dựa trên câu lệnh văn bản (text prompts). Các ngành công nghiệp sáng tạo tận dụng các model này để thay thế nền, lấp đầy các phần hình ảnh bị thiếu (inpainting), hoặc mở rộng biên của canvas (outpainting) một cách liền mạch trong khi vẫn duy trì ánh sáng và kết cấu phức tạp.

Link to this sectionXác thực đầu ra LDM với YOLO26#

Khi sử dụng LDM để tạo tập dữ liệu tổng hợp cho machine learning, điều quan trọng là phải xác minh rằng các đối tượng được tạo ra sở hữu các đặc trưng ngữ nghĩa chính xác. Bạn có thể chạy inference trên các hình ảnh được tạo này bằng một mô hình phân biệt (discriminative model) như Ultralytics YOLO để đảm bảo chất lượng.

from ultralytics import YOLO

# Load the lightweight YOLO26 Nano model for rapid validation
model = YOLO("yolo26n.pt")

# Analyze a synthetic image generated by a Latent Diffusion Model
results = model.predict("ldm_synthetic_dataset_sample.jpg")

# Display the bounding box results to verify object fidelity
results[0].show()

Link to this sectionNhững phát triển trong tương lai về kiến trúc tiềm ẩn#

Khi lĩnh vực Artificial Intelligence ngày càng hoàn thiện, các cơ chế cơ bản của LDM đang được điều chỉnh cho các phương thức phức tạp hơn. Các nhà nghiên cứu từ các nhóm như AnthropicOpenAI đang khám phá khuếch tán tiềm ẩn cho việc tạo video độ nét cao và tổng hợp môi trường 3D.

Đồng thời, những tiến bộ trong các phép toán tensor cốt lõi—được hỗ trợ bởi các thư viện như PyTorchTensorFlow—tiếp tục tăng tốc cho các model này. Đối với các chuyên gia AI đang tìm cách tích hợp các embeddings và tập dữ liệu tổng hợp này vào các pipeline sản xuất, Ultralytics Platform cung cấp một môi trường liền mạch cho model deployment, cho phép các nhóm chuyển đổi suôn sẻ từ dữ liệu được tạo sang giải pháp thị giác máy tính đã triển khai hoàn chỉnh.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning