Bản đồ đặc điểm
Khám phá cách bản đồ tính năng hỗ trợ các mô hình YOLO của Ultralytics, cho phép phát hiện đối tượng chính xác và các ứng dụng AI tiên tiến như lái xe tự động.
Bản đồ đặc trưng là kết quả đầu ra của một bộ lọc tích chập , còn được gọi là hạt nhân (kernel), được áp dụng cho một lớp đầu vào trong Mạng Nơ-ron Tích chập (CNN) . Về bản chất, nó là biểu diễn các đặc điểm đã học, chẳng hạn như các cạnh, kết cấu hoặc hình dạng phức tạp, được phát hiện trong các vùng cụ thể của ảnh. Mỗi bộ lọc trong một lớp tích chập được thiết kế để phát hiện một đặc trưng cụ thể duy nhất. Bản đồ đặc trưng kết quả làm nổi bật vị trí của đặc trưng cụ thể đó trong dữ liệu đầu vào, tạo thành nền tảng cơ bản cho nhiều tác vụ thị giác máy tính (CV) .
Bản đồ tính năng hoạt động như thế nào
Việc tạo bản đồ đặc trưng bắt đầu khi một CNN áp dụng một bộ lọc—một ma trận nhỏ các trọng số có thể học được —trên một ảnh đầu vào hoặc bản đồ đặc trưng từ một lớp trước đó. Bộ lọc này trượt qua ảnh đầu vào và thực hiện phép tích chập tại mỗi vị trí. Đầu ra của phép trượt này tạo ra một mảng 2D mới, chính là bản đồ đặc trưng. Các giá trị kích hoạt trong bản đồ biểu thị cường độ của đặc trưng được phát hiện tại mỗi vị trí. Ví dụ: một bộ lọc được huấn luyện để phát hiện các cạnh dọc sẽ tạo ra các giá trị kích hoạt cao trong bản đồ đặc trưng tại các vị trí tương ứng với các cạnh dọc. Các nền tảng học sâu hiện đại như PyTorch và TensorFlow xử lý các phép toán này một cách tự động.
Biểu diễn tính năng phân cấp
Một trong những khía cạnh mạnh mẽ nhất của CNN là khả năng xây dựng hệ thống phân cấp các tính năng .
- Lớp Sơ khai: Bản đồ đặc trưng trong các lớp sơ khai của xương sống mạng nắm bắt các đặc điểm cơ bản, đơn giản như cạnh, góc và độ dốc màu. Các xương sống này thường là các mạng được đào tạo trước mạnh mẽ, chẳng hạn như ResNet .
- Lớp trung cấp: Khi dữ liệu di chuyển qua mạng, các lớp tiếp theo sẽ kết hợp các đặc điểm đơn giản này thành các mẫu phức tạp hơn, chẳng hạn như kết cấu, các bộ phận của vật thể (như bánh xe hoặc mắt) hoặc hình dạng đơn giản.
- Lớp sâu: Bản đồ đặc trưng trong các lớp sâu hơn biểu diễn các khái niệm trừu tượng và phức tạp, chẳng hạn như toàn bộ đối tượng. Quy trình phân cấp này cho phép các mô hình như Ultralytics YOLO thực hiện các tác vụ phức tạp như phát hiện đối tượng , phân đoạn ảnh và phân loại ảnh .
Bản đồ tính năng so với các khái niệm liên quan
Sẽ rất hữu ích nếu phân biệt bản đồ đặc điểm với các thuật ngữ có liên quan chặt chẽ:
- Trích xuất đặc trưng: Đây là quá trình xác định và trích xuất các mẫu có ý nghĩa từ dữ liệu thô. Bản đồ đặc trưng là đầu ra hoặc kết quả hữu hình của quá trình trích xuất đặc trưng diễn ra trong một lớp CNN. Mặc dù trích xuất đặc trưng là một khái niệm rộng, bản đồ đặc trưng là các cấu trúc dữ liệu cụ thể lưu giữ các đặc trưng đã học được theo cách được tổ chức không gian.
- Nhúng: Bản đồ đặc trưng thường là các mảng đa chiều lưu giữ thông tin không gian về vị trí xuất hiện của các đặc trưng. Ngược lại, nhúng thường là các vectơ một chiều, dày đặc, biểu diễn toàn bộ hình ảnh hoặc vật thể trong một không gian ngữ nghĩa được nén. Chúng thường được tạo ra bằng cách làm phẳng và xử lý các bản đồ đặc trưng cuối cùng của một mạng để nắm bắt ý nghĩa cấp cao cho các tác vụ như tìm kiếm ngữ nghĩa hoặc phân loại, hy sinh chi tiết không gian để sử dụng trong cơ sở dữ liệu vectơ .
Ứng dụng trong thế giới thực
Bản đồ đặc điểm là một phần không thể thiếu của vô số ứng dụng Trí tuệ nhân tạo (AI) và Học máy (ML) :
- Lái xe tự động : Trong xe tự lái, mạng lưới CNN xử lý dữ liệu camera và cảm biến để định hướng. Bản đồ đặc trưng được tạo ra ở các lớp khác nhau giúp xác định người đi bộ, phương tiện khác, vạch kẻ đường và biển báo giao thông. Các lớp đầu tiên phát hiện các cạnh và kết cấu, trong khi các lớp sâu hơn kết hợp chúng để nhận dạng các vật thể phức tạp. Điều này rất quan trọng cho việc định hướng an toàn, và các công ty như Waymo rất tin tưởng vào các công nghệ này cho AI của họ trong xe tự lái .
- Phân tích hình ảnh y tế : CNN phân tích các hình ảnh chụp X-quang, CT, MRI để hỗ trợ chẩn đoán. Bản đồ đặc trưng làm nổi bật các bất thường tiềm ẩn. Ví dụ, khi sử dụng tập dữ liệu như tập dữ liệu Khối u não để phát hiện khối u, bản đồ đặc trưng ban đầu có thể xác định các kết cấu hoặc cạnh bất thường. Các bản đồ sâu hơn sau đó học cách nhận dạng các hình dạng và cấu trúc cụ thể đặc trưng của khối u, hỗ trợ các bác sĩ X quang trong công việc của họ. Nghiên cứu này thường được công bố trên các tạp chí hàng đầu như Radiology: Artificial Intelligence .
Hình dung và Diễn giải
Việc trực quan hóa bản đồ đặc trưng cung cấp những thông tin chi tiết có giá trị về những gì CNN đã học được và cách nó đưa ra quyết định. Bằng cách kiểm tra những phần nào của hình ảnh kích hoạt mạnh mẽ các bản đồ đặc trưng cụ thể, các nhà phát triển có thể hiểu liệu mô hình có đang tập trung vào thông tin liên quan hay không. Quá trình này là một thành phần quan trọng của Explainable AI (XAI) , góp phần vào khả năng diễn giải tổng thể của mô hình . Nó có thể được thực hiện bằng các công cụ như TensorBoard hoặc các kỹ thuật trực quan hóa tiên tiến khác. Việc hiểu bản đồ đặc trưng giúp gỡ lỗi mô hình , cải thiện độ chính xác và độ tin cậy của chúng, đồng thời quản lý toàn bộ vòng đời thông qua các nền tảng như Ultralytics HUB .