Khám phá cách trích xuất đặc trưng biến đổi dữ liệu thô thành thông tin chi tiết hữu ích. Tìm hiểu cách thực hiện. Ultralytics YOLO26 tự động hóa quy trình này để phát hiện đối tượng một cách vượt trội.
Trích xuất đặc trưng là một quá trình mang tính đột phá trong học máy (ML) giúp chuyển đổi dữ liệu thô, đa chiều thành một tập hợp các thuộc tính hoặc "đặc trưng" có ý nghĩa hơn. Dữ liệu đầu vào thô, chẳng hạn như hình ảnh độ phân giải cao, luồng âm thanh hoặc văn bản không cấu trúc, thường quá lớn và dư thừa khiến các thuật toán khó xử lý hiệu quả. Trích xuất đặc trưng giải quyết vấn đề này bằng cách chắt lọc dữ liệu đầu vào xuống các thành phần thiết yếu nhất—bảo toàn thông tin quan trọng cần thiết cho mô hình dự đoán trong khi loại bỏ nhiễu và các chi tiết nền không liên quan. Việc giảm thiểu này rất quan trọng để giảm thiểu " lời nguyền của chiều không gian" , đảm bảo các mô hình vẫn hiệu quả về mặt tính toán và có khả năng khái quát hóa tốt đối với dữ liệu mới, chưa từng thấy.
Trong kỷ nguyên của thị giác máy tính truyền thống, các chuyên gia dựa vào các kỹ thuật thủ công như Biến đổi Đặc trưng Bất biến theo Tỷ lệ (SIFT) để xác định các điểm mấu chốt trong hình ảnh. Tuy nhiên, học sâu (DL) hiện đại đã cách mạng hóa quy trình làm việc này bằng cách tự động hóa việc phát hiện đặc trưng.
Mạng nơ-ron, đặc biệt là Mạng nơ-ron tích chập (CNN) , sử dụng một thành phần kiến trúc chuyên biệt được gọi là " xương sống" để thực hiện trích xuất đặc trưng theo thứ bậc. Khi dữ liệu di chuyển qua các lớp của mạng, độ phức tạp của các đặc trưng được trích xuất sẽ tăng lên:
Các biểu diễn đã học này được lưu trữ trong các bản đồ đặc trưng , sau đó được chuyển đến đầu phát hiện để thực hiện các tác vụ như phát hiện đối tượng hoặc phân loại hình ảnh.
Trích xuất đặc trưng đóng vai trò là động lực đằng sau nhiều khả năng AI tiên tiến, chuyển đổi dữ liệu đầu vào thô từ các giác quan thành những thông tin chi tiết có thể hành động được trong nhiều ngành công nghiệp khác nhau.
Các kiến trúc tiên tiến như Ultralytics YOLO26 tích hợp trực tiếp các công nghệ trích xuất đặc trưng mạnh mẽ vào thiết kế của chúng. Khi bạn chạy suy luận, mô hình sẽ tự động xử lý hình ảnh để trích xuất các đặc trưng liên quan trước khi dự đoán các hộp giới hạn và nhãn lớp.
Ví dụ sau đây minh họa cách sử dụng mô hình đã được huấn luyện trước để xử lý hình ảnh. Mặc dù mã lệnh đơn giản, nhưng bên trong mô hình đang thực hiện quá trình trích xuất đặc trưng phức tạp để định vị các đối tượng:
from ultralytics import YOLO
# Load a pretrained YOLO26 model, which includes a learned feature extraction backbone
model = YOLO("yolo26n.pt")
# Perform inference on an image
# The model internally extracts features to locate and classify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting bounding boxes
results[0].show()
Đối với các nhóm muốn quản lý tập dữ liệu được sử dụng để huấn luyện các bộ trích xuất đặc trưng này, Nền tảng Ultralytics cung cấp một giải pháp toàn diện cho việc chú thích, huấn luyện và triển khai.
Để hiểu rõ quy trình khoa học dữ liệu, việc phân biệt giữa trích xuất đặc trưng và các khái niệm tương tự là rất hữu ích.
Bằng cách nắm vững kỹ thuật trích xuất đặc trưng, các nhà phát triển có thể tận dụng các framework như PyTorch và TensorFlow để xây dựng các mô hình không chỉ chính xác mà còn đủ hiệu quả cho việc triển khai trên thiết bị biên.