Khám phá sức mạnh của việc trích xuất tính năng trong học máy với Ultralytics YOLO11 . Tìm hiểu các kỹ thuật phát hiện và phân tích hiệu quả.
Trích xuất đặc trưng là một quá trình then chốt trong học máy (ML) , bao gồm việc chuyển đổi dữ liệu thô thành dạng biểu diễn số có thể được xử lý bằng các thuật toán trong khi vẫn giữ nguyên thông tin liên quan nhất của tập dữ liệu gốc. Bằng cách tinh chỉnh các đầu vào đa chiều—chẳng hạn như giá trị pixel thô trong dạng sóng hình ảnh hoặc âm thanh—thành một tập hợp các thuộc tính dễ quản lý, trích xuất đặc trưng làm giảm độ phức tạp của dữ liệu. Sự chuyển đổi này rất cần thiết để xử lý vấn đề đa chiều (curse of dimensionality) , một hiện tượng mà số lượng biến đầu vào quá nhiều có thể ảnh hưởng tiêu cực đến hiệu suất của mô hình và làm tăng chi phí tính toán. Các phương pháp trích xuất hiệu quả sẽ cô lập tín hiệu khỏi nhiễu, cho phép các công cụ mô hình dự đoán học các mẫu hiệu quả hơn.
Mục tiêu chính của việc trích xuất đặc trưng là chuyển đổi dữ liệu phức tạp thành một vectơ đặc trưng , một biểu diễn cô đọng, gói gọn các đặc điểm thiết yếu của dữ liệu đầu vào. Quá trình này rất quan trọng để tối ưu hóa quy trình huấn luyện mô hình . Bằng cách giảm lượng dữ liệu dư thừa, các nhà phát triển có thể đạt được thời gian huấn luyện nhanh hơn và sử dụng bộ nhớ ít hơn. Hơn nữa, việc đơn giản hóa dữ liệu đầu vào giúp ngăn ngừa hiện tượng quá khớp , đảm bảo mô hình tổng quát hóa tốt với các ví dụ mới, chưa từng thấy thay vì ghi nhớ nhiễu trong tập huấn luyện.
Trong học sâu (DL) hiện đại, việc trích xuất đặc điểm thường được tự động hóa. Các kiến trúc như Mạng nơ-ron tích chập (CNN) sử dụng các lớp bộ lọc để tự động học các đặc điểm nhận dạng từ hình ảnh. Các lớp ban đầu có thể detect Các cạnh hoặc kết cấu đơn giản, trong khi các lớp sâu hơn kết hợp chúng thành các hình dạng phức tạp như mắt hoặc bánh xe. Phương pháp tự động này trái ngược với các kỹ thuật thị giác máy tính (CV) truyền thống, chẳng hạn như Biến đổi Đặc trưng Bất biến Tỷ lệ (SIFT) , trong đó các chuyên gia thiết kế thủ công các thuật toán để xác định các điểm chính trong hình ảnh.
Trích xuất tính năng là động lực đằng sau nhiều công nghệ Trí tuệ nhân tạo (AI) mang tính chuyển đổi trong nhiều ngành công nghiệp khác nhau.
Các mô hình tiên tiến như Ultralytics YOLO11 sử dụng một thành phần được gọi là xương sống (bone) để thực hiện trích xuất đặc điểm. Khi hình ảnh đi qua mạng, xương sống sẽ tạo ra các bản đồ đặc điểm làm nổi bật sự hiện diện của các đối tượng.
Đoạn mã sau đây minh họa cách tải một mô hình được đào tạo trước và thực hiện suy luận. Trong quá trình này, mô hình sẽ tự động trích xuất các đặc điểm để xác định vị trí và classify các vật thể.
from ultralytics import YOLO
# Load a pretrained YOLO11 model which contains a learned feature extraction backbone
model = YOLO("yolo11n.pt")
# Run inference on an image; the model extracts features to detect the bus
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting bounding boxes derived from the extracted features
results[0].show()
Điều quan trọng là phải phân biệt trích xuất tính năng với các thuật ngữ tương tự trong khoa học dữ liệu và quy trình xử lý dữ liệu trước .
Các khuôn khổ như PyTorch và TensorFlow cung cấp các công cụ cần thiết để triển khai cả quy trình trích xuất tính năng thủ công và tự động, cho phép phát triển các tác nhân AI mạnh mẽ và các công cụ phân tích.