Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Trích xuất đặc trưng

Khám phá cách trích xuất đặc trưng biến đổi dữ liệu thô thành thông tin chi tiết hữu ích. Tìm hiểu cách thực hiện. Ultralytics YOLO26 tự động hóa quy trình này để phát hiện đối tượng một cách vượt trội.

Trích xuất đặc trưng là một quá trình mang tính đột phá trong học máy (ML) giúp chuyển đổi dữ liệu thô, đa chiều thành một tập hợp các thuộc tính hoặc "đặc trưng" có ý nghĩa hơn. Dữ liệu đầu vào thô, chẳng hạn như hình ảnh độ phân giải cao, luồng âm thanh hoặc văn bản không cấu trúc, thường quá lớn và dư thừa khiến các thuật toán khó xử lý hiệu quả. Trích xuất đặc trưng giải quyết vấn đề này bằng cách chắt lọc dữ liệu đầu vào xuống các thành phần thiết yếu nhất—bảo toàn thông tin quan trọng cần thiết cho mô hình dự đoán trong khi loại bỏ nhiễu và các chi tiết nền không liên quan. Việc giảm thiểu này rất quan trọng để giảm thiểu " lời nguyền của chiều không gian" , đảm bảo các mô hình vẫn hiệu quả về mặt tính toán và có khả năng khái quát hóa tốt đối với dữ liệu mới, chưa từng thấy.

Vai trò của việc trích xuất đặc trưng trong học sâu

Trong kỷ nguyên của thị giác máy tính truyền thống, các chuyên gia dựa vào các kỹ thuật thủ công như Biến đổi Đặc trưng Bất biến theo Tỷ lệ (SIFT) để xác định các điểm mấu chốt trong hình ảnh. Tuy nhiên, học sâu (DL) hiện đại đã cách mạng hóa quy trình làm việc này bằng cách tự động hóa việc phát hiện đặc trưng.

Mạng nơ-ron, đặc biệt là Mạng nơ-ron tích chập (CNN) , sử dụng một thành phần kiến ​​trúc chuyên biệt được gọi là " xương sống" để thực hiện trích xuất đặc trưng theo thứ bậc. Khi dữ liệu di chuyển qua các lớp của mạng, độ phức tạp của các đặc trưng được trích xuất sẽ tăng lên:

  • Các lớp nông: Những lớp ban đầu này hoạt động như các bộ dò cạnh, xác định các cấu trúc đơn giản, cấp thấp như đường thẳng, góc và độ chuyển màu.
  • Các lớp sâu: Khi mạng lưới trở nên sâu hơn, các yếu tố đơn giản này được tổng hợp thành các biểu diễn ngữ nghĩa cấp cao, chẳng hạn như hình dạng của một chiếc xe, khuôn mặt người hoặc các dấu hiệu đặc trưng của động vật.

Các biểu diễn đã học này được lưu trữ trong các bản đồ đặc trưng , ​​sau đó được chuyển đến đầu phát hiện để thực hiện các tác vụ như phát hiện đối tượng hoặc phân loại hình ảnh.

Các Ứng dụng Thực tế

Trích xuất đặc trưng đóng vai trò là động lực đằng sau nhiều khả năng AI tiên tiến, chuyển đổi dữ liệu đầu vào thô từ các giác quan thành những thông tin chi tiết có thể hành động được trong nhiều ngành công nghiệp khác nhau.

  • Chẩn đoán y khoa: Trong lĩnh vực trí tuệ nhân tạo ứng dụng trong chăm sóc sức khỏe , các mô hình phân tích hình ảnh y tế phức tạp như ảnh chụp cộng hưởng từ (MRI) hoặc chụp cắt lớp vi tính (CT). Các thuật toán trích xuất đặc điểm tinh vi xác định những bất thường nhỏ trong mật độ hoặc kết cấu mô, có thể là dấu hiệu của các bệnh lý giai đoạn sớm. Bằng cách phân lập các dấu hiệu hình ảnh quan trọng này, hệ thống có thể hỗ trợ các bác sĩ X quang trong việc phát hiện khối u với độ chính xác và tốc độ cao hơn đáng kể.
  • Lái xe tự hành: Xe tự lái phụ thuộc vào việc trích xuất đặc điểm theo thời gian thực để di chuyển an toàn. Camera trên xe truyền video đến các mô hình thị giác máy tính (CV) để ngay lập tức trích xuất các đặc điểm liên quan đến vạch kẻ đường, đèn giao thông và chuyển động của người đi bộ. Khả năng này cho phép xe tự hành đưa ra quyết định trong tích tắc trong môi trường năng động.
  • Xử lý âm thanh: Trong trợ lý giọng nói, dạng sóng âm thanh thô được chuyển đổi thành phổ đồ. Sau đó, các thuật toán sẽ trích xuất các đặc điểm ngữ âm, cao độ và âm sắc, cho phép hệ thống chuyển giọng nói thành văn bản hiểu được ngôn ngữ nói bất kể giọng điệu của người nói hay tiếng ồn xung quanh.

Trích xuất đặc trưng với Ultralytics YOLO

Các kiến ​​trúc tiên tiến như Ultralytics YOLO26 tích hợp trực tiếp các công nghệ trích xuất đặc trưng mạnh mẽ vào thiết kế của chúng. Khi bạn chạy suy luận, mô hình sẽ tự động xử lý hình ảnh để trích xuất các đặc trưng liên quan trước khi dự đoán các hộp giới hạn và nhãn lớp.

Ví dụ sau đây minh họa cách sử dụng mô hình đã được huấn luyện trước để xử lý hình ảnh. Mặc dù mã lệnh đơn giản, nhưng bên trong mô hình đang thực hiện quá trình trích xuất đặc trưng phức tạp để định vị các đối tượng:

from ultralytics import YOLO

# Load a pretrained YOLO26 model, which includes a learned feature extraction backbone
model = YOLO("yolo26n.pt")

# Perform inference on an image
# The model internally extracts features to locate and classify objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes
results[0].show()

Đối với các nhóm muốn quản lý tập dữ liệu được sử dụng để huấn luyện các bộ trích xuất đặc trưng này, Nền tảng Ultralytics cung cấp một giải pháp toàn diện cho việc chú thích, huấn luyện và triển khai.

Phân biệt các thuật ngữ liên quan

Để hiểu rõ quy trình khoa học dữ liệu, việc phân biệt giữa trích xuất đặc trưng và các khái niệm tương tự là rất hữu ích.

  • Trích xuất đặc trưng so với kỹ thuật đặc trưng : Mặc dù thường được thảo luận cùng nhau, kỹ thuật đặc trưng là một thuật ngữ rộng hơn, thường ám chỉ một quy trình thủ công trong đó kiến ​​thức chuyên môn được sử dụng để tạo ra các biến mới (ví dụ: tính "giá trên mỗi mét vuông" từ "giá" và "diện tích"). Trích xuất đặc trưng là một kỹ thuật cụ thể—thường được tự động hóa trong học sâu—chiếu dữ liệu đa chiều (như pixel) thành một vectơ đặc trưng có chiều thấp hơn.
  • Trích xuất đặc trưng so với lựa chọn đặc trưng : Lựa chọn đặc trưng liên quan đến việc chọn một tập hợp con các đặc trưng hiện có mà không thay đổi chúng, chỉ đơn giản là loại bỏ những đặc trưng ít quan trọng hơn để giảm nhiễu. Ngược lại, trích xuất đặc trưng tạo ra các đặc trưng mới bằng cách biến đổi và kết hợp các điểm dữ liệu gốc, chẳng hạn như thông qua Phân tích thành phần chính (PCA) hoặc trọng số mạng được học.

Bằng cách nắm vững kỹ thuật trích xuất đặc trưng, các nhà phát triển có thể tận dụng các framework như PyTorchTensorFlow để xây dựng các mô hình không chỉ chính xác mà còn đủ hiệu quả cho việc triển khai trên thiết bị biên.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay