Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Convolution

Khám phá các nguyên tắc cơ bản của tích chập (convolution) trong computer vision và học sâu. Tìm hiểu cách các kernel và feature map hỗ trợ Ultralytics YOLO26 cho các tác vụ thời gian thực.

Convolution là một phép toán cơ bản đóng vai trò là khối xây dựng cốt lõi của các hệ thống thị giác máy tính (CV)học sâu (DL) hiện đại. Trong ngữ cảnh xử lý hình ảnh, convolution bao gồm việc trượt một bộ lọc nhỏ—thường được gọi là kernel—trên hình ảnh đầu vào để tạo ra bản đồ các đặc trưng quan trọng. Quá trình này cho phép các mô hình trí tuệ nhân tạo (AI) tự động học và xác định các mẫu như cạnh, kết cấu và hình dạng mà không cần sự can thiệp của con người. Khác với học máy (ML) truyền thống thường đòi hỏi trích xuất đặc trưng thủ công, convolution cho phép các mạng lưới xây dựng sự hiểu biết phân cấp về dữ liệu hình ảnh, bắt đầu từ các đường nét đơn giản và tiến dần đến các đối tượng phức tạp như khuôn mặt hoặc phương tiện.

Link to this sectionConvolution hoạt động như thế nào#

Phép toán này hoạt động bằng cách truyền một bộ lọc qua dữ liệu đầu vào, thực hiện phép nhân từng phần tử và tính tổng các kết quả để tạo ra một giá trị duy nhất cho mỗi vị trí. Đầu ra này được gọi là feature map.

  • Kernel: Đây là một ma trận số nhỏ (trọng số) giúp phát hiện các đặc trưng cụ thể. Ví dụ, Sobel operator là một loại kernel cụ thể được sử dụng để phát hiện các cạnh dọc hoặc ngang.
  • Sliding Window: Kernel di chuyển qua hình ảnh bằng cách sử dụng một kích thước bước xác định gọi là "stride". Quá trình lọc không gian này bảo toàn mối quan hệ giữa các pixel, điều này rất quan trọng để hiểu hình ảnh.
  • Phân cấp lớp: Trong các kiến trúc sâu như Mạng thần kinh tích chập (CNNs), các lớp ban đầu nắm bắt các chi tiết ở cấp độ thấp, trong khi các lớp sâu hơn kết hợp chúng thành các khái niệm ở cấp độ cao.

Link to this sectionConvolution so với các khái niệm liên quan#

Để nắm bắt đầy đủ về convolution, việc phân biệt nó với các thuật ngữ tương tự thường gặp trong tài liệu về mạng thần kinh (NN) là rất hữu ích:

  • Cross-Correlation so với Convolution: Về mặt toán học, convolution thực thụ bao gồm việc lật kernel trước khi áp dụng. Tuy nhiên, hầu hết các framework học sâu, bao gồm cả thư viện PyTorch, đều triển khai cross-correlation (trượt mà không lật) nhưng lại gọi nó là "convolution" vì các trọng số được học trong quá trình huấn luyện, làm cho sự khác biệt về việc lật trở nên không đáng kể đối với hiệu suất.
  • Convolution so với Attention: Trong khi convolution xử lý thông tin cục bộ (các pixel lân cận), cơ chế attention cho phép mô hình liên kết các phần xa của hình ảnh cùng một lúc. Các kiến trúc hiện đại như YOLO26 thường sử dụng các lớp tích chập được tối ưu hóa cao để duy trì tốc độ suy luận thời gian thực, vì các lớp attention có thể nặng hơn về mặt tính toán.

Link to this sectionCác ứng dụng trong thực tế#

Hiệu suất của convolution đã cho phép AI cách mạng hóa nhiều ngành công nghiệp bằng cách hỗ trợ các hệ thống nhận thức mạnh mẽ:

  1. Chẩn đoán y tế: Trong lĩnh vực AI trong chăm sóc sức khỏe, convolution giúp phân tích các bản quét MRI độ phân giải cao. Bằng cách sử dụng các kernel cụ thể được thiết kế để làm nổi bật các bất thường, các mô hình có thể phát hiện những dấu hiệu sớm của khối u hoặc gãy xương với độ chính xác sánh ngang với các chuyên gia con người.

  2. Điều hướng tự hành: Các phương tiện tự lái dựa vào convolution để phát hiện đối tượng thời gian thực. Khi xe di chuyển, các lớp tích chập sẽ xử lý luồng video để xác định ngay lập tức người đi bộ, vạch kẻ làn đường và biển báo giao thông, một thành phần quan trọng của sự an toàn trong AI ngành ô tô.

Link to this sectionVí dụ Python với Ultralytics#

Bạn có thể kiểm tra các lớp tích chập trong các mô hình hiện đại bằng cách sử dụng Python. Ví dụ sau đây tải mô hình YOLO26 và xác minh rằng lớp ban đầu của nó sử dụng phép toán tích chập tiêu chuẩn, được triển khai thông qua torch.nn.

import torch.nn as nn
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Access the first layer of the model's backbone
first_layer = model.model.model[0]

# Verify it is a Convolutional layer
if isinstance(first_layer.conv, nn.Conv2d):
    print("Success: The first layer is a standard convolution.")
    print(f"Kernel size: {first_layer.conv.kernel_size}")

Link to this sectionTại sao Convolution quan trọng đối với Edge AI#

Các phép toán tích chập có khả năng tối ưu hóa cao, khiến chúng trở nên lý tưởng cho các triển khai Edge AI nơi tài nguyên tính toán bị hạn chế. Vì cùng một kernel được chia sẻ trên toàn bộ hình ảnh (chia sẻ tham số), mô hình yêu cầu ít bộ nhớ hơn đáng kể so với các kiến trúc kết nối đầy đủ cũ hơn. Hiệu suất này cho phép các mô hình nâng cao chạy trên điện thoại thông minh và các thiết bị IoT.

Đối với các nhóm đang tìm cách tận dụng các phép toán này cho tập dữ liệu tùy chỉnh, Nền tảng Ultralytics cung cấp một môi trường liền mạch để chú thích hình ảnh và huấn luyện các mô hình dựa trên tích chập mà không cần quản lý cơ sở hạ tầng phức tạp. Bằng cách sử dụng học chuyển đổi, bạn có thể tinh chỉnh các trọng số tích chập đã được huấn luyện trước để nhận diện các đối tượng mới với dữ liệu huấn luyện tối thiểu.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning