Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Computer Vision (CV)

Khám phá các nguyên tắc cơ bản của Computer Vision (CV). Tìm hiểu cách Ultralytics YOLO26 và Ultralytics Platform cho phép phát hiện vật thể, phân đoạn và hơn thế nữa.

Thị giác máy tính (CV) là một lĩnh vực tinh vi của Trí tuệ nhân tạo (AI), cho phép máy tính và hệ thống trích xuất thông tin có ý nghĩa từ hình ảnh kỹ thuật số, video và các dữ liệu đầu vào trực quan khác. Trong khi thị giác con người có khả năng bẩm sinh để nhận biết và thấu hiểu môi trường xung quanh ngay lập tức, máy tính phải được đào tạo để nhận diện các mô hình và giải mã pixel. Bằng cách tận dụng Học máy (ML) và cụ thể là các thuật toán Học sâu (DL), các hệ thống CV có thể tiếp nhận dữ liệu trực quan, xử lý chúng và đưa ra các đề xuất hoặc hành động dựa trên thông tin đó.

Link to this sectionCách thức hoạt động của Thị giác máy tính#

Về cốt lõi, máy tính nhìn nhận một hình ảnh như một mảng các giá trị số biểu diễn các pixel. CV hiện đại phụ thuộc rất nhiều vào Mạng thần kinh tích chập (CNNs), được thiết kế để bắt chước mô hình kết nối của các neuron trong não người. Các mạng này học cách xác định một hệ thống phân cấp các đặc trưng—từ các cạnh và kết cấu đơn giản đến các hình dạng và đối tượng phức tạp—thông qua một quá trình gọi là trích xuất đặc trưng.

Để hoạt động hiệu quả, các model này yêu cầu một lượng lớn dữ liệu huấn luyện. Ví dụ, để nhận diện một chiếc ô tô, một model cần xử lý hàng nghìn hình ảnh ô tô đã được gán nhãn trong nhiều điều kiện khác nhau. Các công cụ như Ultralytics Platform giúp hợp lý hóa quy trình này, cho phép người dùng chú thích tập dữ liệu, huấn luyện model trên đám mây và triển khai chúng một cách hiệu quả.

Link to this sectionCác tác vụ cốt lõi trong Thị giác máy tính#

Thị giác máy tính không phải là một chức năng đơn lẻ mà là một tập hợp các tác vụ riêng biệt, mỗi tác vụ giải quyết một vấn đề cụ thể:

  • Phân loại hình ảnh: Tác vụ này gán nhãn lớp cho toàn bộ hình ảnh, trả lời câu hỏi, "Cái gì có trong bức ảnh này?" (ví dụ: phân biệt giữa mèo và chó).
  • Phát hiện đối tượng: Tiến thêm một bước, việc phát hiện giúp xác định các đối tượng riêng biệt trong hình ảnh và vẽ một khung bao xung quanh chúng. Điều này rất quan trọng để đếm các mục hoặc xác định vị trí của các đặc trưng cụ thể.
  • Phân đoạn cá thể: Tác vụ này cung cấp một mặt nạ chính xác ở cấp độ pixel cho mỗi đối tượng được phát hiện, tách biệt các cá thể riêng lẻ của cùng một lớp. Điều này rất quan trọng cho các ứng dụng đòi hỏi độ chính xác cao, chẳng hạn như phân tích hình ảnh y tế.
  • Ước tính tư thế: Tác vụ này liên quan đến việc phát hiện các điểm khóa cụ thể trên một đối tượng, chẳng hạn như các khớp trên cơ thể người, để theo dõi chuyển động và tư thế.

Link to this sectionCác ứng dụng trong thực tế#

Tiện ích của thị giác máy tính bao trùm hầu như mọi ngành công nghiệp, tự động hóa các tác vụ trước đây vốn yêu cầu mắt người.

  • Sản xuất và Kiểm soát chất lượng: Trong môi trường công nghiệp, CV thường được gọi là Thị giác máy (Machine Vision). Nó được sử dụng để tự động hóa kiểm tra chất lượng, phát hiện các khiếm khuyết nhỏ trên sản phẩm trên dây chuyền lắp ráp nhanh hơn và chính xác hơn so với các thanh tra viên con người. Ví dụ, AI trong Sản xuất cho phép giám sát thiết bị theo thời gian thực để ngăn ngừa các sự cố.
  • Giao thông tự hành: Xe tự lái dựa hoàn toàn vào CV để điều hướng an toàn. Bằng cách xử lý dữ liệu đầu vào từ camera và cảm biến LiDAR, các phương tiện này thực hiện Phát hiện đối tượng 3D để nhận diện người đi bộ, các phương tiện khác và biển báo giao thông theo thời gian thực. Đây là một thành phần quan trọng để đạt được các cấp độ cao về tự động hóa phương tiện.
  • Chăm sóc sức khỏe và Chẩn đoán: Các bác sĩ chẩn đoán hình ảnh sử dụng CV để hỗ trợ xác định các điểm bất thường trong phim X-quang, MRI và CT scan. AI trong Chăm sóc sức khỏe hỗ trợ phát hiện bệnh sớm, chẳng hạn như xác định khối u, bằng cách làm nổi bật các vùng quan tâm mà mắt thường có thể bỏ sót.

Link to this sectionThị giác máy tính so với Xử lý hình ảnh#

Điều quan trọng là phải phân biệt CV với Xử lý hình ảnh, mặc dù chúng thường hoạt động cùng nhau.

  • Xử lý hình ảnh liên quan đến việc thao tác với một hình ảnh để nâng cao hoặc trích xuất thông tin (ví dụ: điều chỉnh độ sáng, độ tương phản hoặc áp dụng các bộ lọc như những bộ lọc trong Adobe Photoshop). Kết quả đầu ra thường là một hình ảnh khác.
  • Thị giác máy tính lấy hình ảnh làm đầu vào và xuất ra thông tin hoặc cách diễn giải (ví dụ: "Có ba người trong phòng này"). CV sử dụng các kỹ thuật xử lý hình ảnh để chuẩn bị hình ảnh cho việc phân tích bởi các Mạng thần kinh (Neural Networks).

Link to this sectionTriển khai Thị giác máy tính với Python#

Các thư viện hiện đại đã giúp việc triển khai các model CV mạnh mẽ trở nên dễ dàng hơn. Ví dụ dưới đây minh họa cách tải model YOLO26 hiện đại nhất để phát hiện các đối tượng trong hình ảnh bằng cách sử dụng gói ultralytics.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with bounding boxes
results[0].show()

Script đơn giản này sử dụng một model đã được huấn luyện sẵn để thực hiện các tác vụ suy luận phức tạp, minh chứng cho sự dễ tiếp cận của các công cụ AI hiện đại. Đối với các nhà phát triển muốn tiến xa hơn ngoài hình ảnh tĩnh, CV còn hỗ trợ Hiểu video và các hệ thống theo dõi thời gian thực được sử dụng trong phân tích bảo mật và thể thao. Bằng cách tích hợp với các thư viện như OpenCV, các nhà phát triển có thể xây dựng các ứng dụng toàn diện để ghi lại, xử lý và phân tích thế giới trực quan.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning