Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Trích xuất đặc trưng

Khám phá sức mạnh của việc trích xuất tính năng trong học máy với Ultralytics YOLO11 . Tìm hiểu các kỹ thuật phát hiện và phân tích hiệu quả.

Trích xuất đặc trưng là một quá trình then chốt trong học máy (ML) , bao gồm việc chuyển đổi dữ liệu thô thành dạng biểu diễn số có thể được xử lý bằng các thuật toán trong khi vẫn giữ nguyên thông tin liên quan nhất của tập dữ liệu gốc. Bằng cách tinh chỉnh các đầu vào đa chiều—chẳng hạn như giá trị pixel thô trong dạng sóng hình ảnh hoặc âm thanh—thành một tập hợp các thuộc tính dễ quản lý, trích xuất đặc trưng làm giảm độ phức tạp của dữ liệu. Sự chuyển đổi này rất cần thiết để xử lý vấn đề đa chiều (curse of dimensionality) , một hiện tượng mà số lượng biến đầu vào quá nhiều có thể ảnh hưởng tiêu cực đến hiệu suất của mô hình và làm tăng chi phí tính toán. Các phương pháp trích xuất hiệu quả sẽ cô lập tín hiệu khỏi nhiễu, cho phép các công cụ mô hình dự đoán học các mẫu hiệu quả hơn.

Vai trò của trích xuất tính năng trong AI

Mục tiêu chính của việc trích xuất đặc trưng là chuyển đổi dữ liệu phức tạp thành một vectơ đặc trưng , một biểu diễn cô đọng, gói gọn các đặc điểm thiết yếu của dữ liệu đầu vào. Quá trình này rất quan trọng để tối ưu hóa quy trình huấn luyện mô hình . Bằng cách giảm lượng dữ liệu dư thừa, các nhà phát triển có thể đạt được thời gian huấn luyện nhanh hơn và sử dụng bộ nhớ ít hơn. Hơn nữa, việc đơn giản hóa dữ liệu đầu vào giúp ngăn ngừa hiện tượng quá khớp , đảm bảo mô hình tổng quát hóa tốt với các ví dụ mới, chưa từng thấy thay vì ghi nhớ nhiễu trong tập huấn luyện.

Trong học sâu (DL) hiện đại, việc trích xuất đặc điểm thường được tự động hóa. Các kiến trúc như Mạng nơ-ron tích chập (CNN) sử dụng các lớp bộ lọc để tự động học các đặc điểm nhận dạng từ hình ảnh. Các lớp ban đầu có thể detect Các cạnh hoặc kết cấu đơn giản, trong khi các lớp sâu hơn kết hợp chúng thành các hình dạng phức tạp như mắt hoặc bánh xe. Phương pháp tự động này trái ngược với các kỹ thuật thị giác máy tính (CV) truyền thống, chẳng hạn như Biến đổi Đặc trưng Bất biến Tỷ lệ (SIFT) , trong đó các chuyên gia thiết kế thủ công các thuật toán để xác định các điểm chính trong hình ảnh.

Các Ứng dụng Thực tế

Trích xuất tính năng là động lực đằng sau nhiều công nghệ Trí tuệ nhân tạo (AI) mang tính chuyển đổi trong nhiều ngành công nghiệp khác nhau.

  • Chẩn đoán Y khoa: Trong lĩnh vực AI chăm sóc sức khỏe , các thuật toán phân tích hình ảnh y tế như chụp X-quang hoặc chụp MRI. Thông qua phân tích hình ảnh y tế , các mô hình trích xuất các đặc điểm liên quan đến mật độ mô, hình dạng khối u hoặc các bất thường về kết cấu. Những đặc điểm này cho phép các hệ thống hỗ trợ bác sĩ X-quang phát hiện bệnh sớm, cải thiện đáng kể kết quả điều trị cho bệnh nhân.
  • Xe tự hành: Xe tự lái chủ yếu dựa vào việc trích xuất đặc điểm để điều hướng an toàn. Bằng cách xử lý dữ liệu video từ camera trên xe, các mô hình phát hiện vật thể xác định các đặc điểm quan trọng như vạch kẻ đường, biển báo giao thông và hình bóng người đi bộ. Phân tích thời gian thực này cho phép AI trong hệ thống ô tô đưa ra quyết định nhanh chóng về việc lái và phanh.

Tự động trích xuất với Ultralytics YOLO

Các mô hình tiên tiến như Ultralytics YOLO11 sử dụng một thành phần được gọi là xương sống (bone) để thực hiện trích xuất đặc điểm. Khi hình ảnh đi qua mạng, xương sống sẽ tạo ra các bản đồ đặc điểm làm nổi bật sự hiện diện của các đối tượng.

Đoạn mã sau đây minh họa cách tải một mô hình được đào tạo trước và thực hiện suy luận. Trong quá trình này, mô hình sẽ tự động trích xuất các đặc điểm để xác định vị trí và classify các vật thể.

from ultralytics import YOLO

# Load a pretrained YOLO11 model which contains a learned feature extraction backbone
model = YOLO("yolo11n.pt")

# Run inference on an image; the model extracts features to detect the bus
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes derived from the extracted features
results[0].show()

Phân biệt các khái niệm liên quan

Điều quan trọng là phải phân biệt trích xuất tính năng với các thuật ngữ tương tự trong khoa học dữ liệu và quy trình xử lý dữ liệu trước .

  • Trích xuất Đặc điểm so với Kỹ thuật Đặc điểm : Kỹ thuật đặc điểm là một thuật ngữ rộng hơn, thường ám chỉ một quy trình thủ công, trong đó kiến thức chuyên môn được sử dụng để tạo ra các đặc điểm mới từ dữ liệu thô (ví dụ: tính toán "chỉ số khối cơ thể" từ các cột cân nặng và chiều cao). Trích xuất đặc điểm là một loại kỹ thuật cụ thể chuyển đổi dữ liệu đa chiều (như pixel) thành không gian đa chiều, thường sử dụng các kỹ thuật toán học như Phân tích Thành phần Chính (PCA) hoặc các lớp mạng đã học.
  • Trích xuất Đặc trưng so với Giảm Chiều : Mục tiêu của việc giảm chiều là giảm số lượng biến ngẫu nhiên đang được xem xét. Trích xuất đặc trưng là một phương pháp để đạt được mục tiêu này bằng cách tạo ra các đặc trưng mới, kết hợp. Một phương pháp khác là lựa chọn đặc trưng , đơn giản là chọn một tập hợp con các đặc trưng hiện có mà không thay đổi chúng.

Các khuôn khổ như PyTorchTensorFlow cung cấp các công cụ cần thiết để triển khai cả quy trình trích xuất tính năng thủ công và tự động, cho phép phát triển các tác nhân AI mạnh mẽ và các công cụ phân tích.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay