Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Convolutional Neural Network (CNN)

Khám phá cách Convolutional Neural Networks (CNN) hỗ trợ computer vision hiện đại. Tìm hiểu về các lớp, ứng dụng và cách chạy Ultralytics YOLO26 cho AI thời gian thực.

Mạng thần kinh tích chập (CNN) là một kiến trúc deep learning chuyên dụng được thiết kế để xử lý dữ liệu có cấu trúc topo dạng lưới, đáng chú ý nhất là ảnh kỹ thuật số. Lấy cảm hứng từ cấu trúc sinh học của vỏ não thị giác, các CNN có khả năng độc đáo trong việc bảo tồn các mối quan hệ không gian trong dữ liệu đầu vào. Không giống như các mạng thần kinh truyền thống làm phẳng ảnh thành một danh sách dài các con số, CNN phân tích các vùng nhỏ, chồng lấp của ảnh để tự động học các hệ thống phân cấp tính năng—từ các cạnh và kết cấu đơn giản đến các hình dạng và đối tượng phức tạp. Khả năng này biến chúng thành công nghệ nền tảng đằng sau các hệ thống thị giác máy tính (CV) hiện đại.

Link to this sectionCách thức hoạt động của mạng thần kinh tích chập#

Sức mạnh của một CNN nằm ở khả năng rút gọn một ảnh phức tạp thành một dạng dễ xử lý hơn mà không làm mất đi các đặc trưng quan trọng để có được dự đoán tốt. Điều này đạt được thông qua một quy trình gồm các lớp riêng biệt chuyển đổi khối dữ liệu đầu vào thành một lớp hoặc giá trị đầu ra:

  • Lớp tích chập: Đây là thành phần xây dựng cốt lõi. Nó sử dụng một tập hợp các bộ lọc (hoặc kernels) có thể học được trượt trên ảnh đầu vào giống như một chiếc đèn pin. Tại mỗi vị trí, bộ lọc thực hiện một phép toán gọi là tích chập, tạo ra một bản đồ đặc trưng làm nổi bật các mẫu cụ thể như các đường ngang hoặc độ dốc màu.
  • Hàm kích hoạt: Sau khi tích chập, một hàm phi tuyến tính được áp dụng cho đầu ra. Lựa chọn phổ biến nhất là ReLU (Rectified Linear Unit), hàm này biến các giá trị pixel âm thành zero. Điều này tạo ra tính phi tuyến tính, cho phép mạng học các mẫu phức tạp vượt ra ngoài các mối quan hệ tuyến tính đơn giản.
  • Lớp gộp (Pooling Layer): Còn được gọi là lấy mẫu xuống (downsampling), lớp này làm giảm kích thước của các bản đồ đặc trưng. Các kỹ thuật như max pooling chỉ giữ lại các đặc trưng quan trọng nhất (các giá trị cao nhất) trong một vùng, giúp giảm tải tính toán và giúp ngăn ngừa quá khớp (overfitting).
  • Lớp kết nối đầy đủ (Fully Connected Layer): Ở giai đoạn cuối, các đặc trưng đã xử lý được làm phẳng và đưa vào một mạng thần kinh (NN) tiêu chuẩn. Lớp này sử dụng các đặc trưng cấp cao đã được các lớp trước đó xác định để đưa ra phân loại hoặc dự đoán cuối cùng, chẳng hạn như "mèo" hoặc "chó".

Link to this sectionCác ứng dụng trong thực tế#

CNN đã thay đổi các ngành công nghiệp bằng cách tự động hóa các tác vụ thị giác với độ chính xác vượt xa con người.

  • Chẩn đoán y tế: Trong lĩnh vực chăm sóc sức khỏe, CNN hỗ trợ các bác sĩ chẩn đoán hình ảnh bằng cách xác định các bất thường trong ảnh chụp y tế nhanh hơn mắt người. Ví dụ, các mô hình deep learning phân tích ảnh chụp MRI và CT để phát hiện sớm các dấu hiệu khối u hoặc gãy xương. Nghiên cứu liên quan đến AI trong chẩn đoán hình ảnh nêu bật cách các công cụ này cải thiện tính nhất quán và tốc độ chẩn đoán.
  • Hệ thống tự hành: Xe tự lái phụ thuộc rất nhiều vào CNN để nhận thức môi trường xung quanh. Các mô hình như YOLO26 sử dụng các kiến trúc CNN nền tảng hiệu quả để thực hiện phát hiện đối tượng theo thời gian thực, xác định người đi bộ, biển báo giao thông và các phương tiện khác để đưa ra quyết định lái xe trong tích tắc.

Link to this sectionCNN so với Vision Transformers (ViT)#

Trong khi CNN từ lâu đã là tiêu chuẩn cho các tác vụ thị giác, một kiến trúc mới hơn được gọi là Vision Transformer (ViT) đã xuất hiện.

  • CNN xử lý ảnh bằng cách sử dụng các đặc trưng cục bộ và cực kỳ hiệu quả trên các tập dữ liệu nhỏ hơn nhờ "độ lệch quy nạp" (chúng giả định rằng các pixel gần nhau có liên quan đến nhau). Chúng vượt trội trong các tình huống yêu cầu suy luận thời gian thực trên các thiết bị biên.
  • ViT chia ảnh thành các bản vá (patches) và xử lý chúng bằng các cơ chế tự chú ý (self-attention) toàn cầu. Điều này cho phép chúng nắm bắt được các phụ thuộc tầm xa trên toàn bộ bức ảnh nhưng thường yêu cầu các tập dữ liệu khổng lồ và nhiều sức mạnh tính toán hơn để huấn luyện hiệu quả.

Link to this sectionVí dụ về triển khai#

Các thư viện hiện đại giúp việc sử dụng các mô hình dựa trên CNN trở nên đơn giản. Gói ultralytics cung cấp quyền truy cập vào các mô hình hiện đại nhất như YOLO26, với các kiến trúc CNN được tối ưu hóa cao cho việc suy luận nhanh.

Ví dụ sau đây minh họa cách tải một mô hình CNN đã được huấn luyện trước và thực hiện dự đoán:

from ultralytics import YOLO

# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")

# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the prediction results
results[0].show()

Link to this sectionCông cụ dành cho phát triển#

Việc phát triển CNN được hỗ trợ bởi một hệ sinh thái mạnh mẽ các công cụ mã nguồn mở. Các kỹ sư thường sử dụng các framework như PyTorch hoặc TensorFlow để xây dựng các kiến trúc tùy chỉnh. Các thư viện này cung cấp các phép toán tensor cấp thấp cần thiết cho tích chập và lan truyền ngược (backpropagation).

Đối với các nhóm muốn hợp lý hóa vòng đời của các dự án thị giác máy tính—từ thu thập dữ liệu đến triển khai—Ultralytics Platform cung cấp một giải pháp toàn diện. Nền tảng này đơn giản hóa các quy trình phức tạp, cho phép các nhà phát triển tập trung vào việc áp dụng CNN để giải quyết các vấn đề kinh doanh thay vì quản lý cơ sở hạ tầng. Ngoài ra, các mô hình có thể được xuất sang các định dạng như ONNX hoặc TensorRT để triển khai hiệu suất cao trên các thiết bị biên.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning