Khám phá cách học ít mẫu (few-shot learning) cho phép AI thích ứng với dữ liệu tối thiểu, chuyển đổi các lĩnh vực như chẩn đoán y tế và bảo tồn động vật hoang dã.
Few-Shot Learning (FSL) is a specialized subfield of machine learning (ML) designed to train models to recognize and classify new concepts using a very small number of labeled examples. In traditional deep learning (DL), achieving high accuracy typically requires massive datasets containing thousands of images per category. However, FSL mimics the human cognitive ability to generalize rapidly from limited experience—much like a child can recognize a giraffe after seeing just one or two pictures in a book. This capability is essential for deploying artificial intelligence (AI) in scenarios where collecting large amounts of training data is prohibitively expensive, time-consuming, or practically impossible.
Mục tiêu chính của FSL là giảm sự phụ thuộc vào việc thu thập dữ liệu rộng rãi bằng cách tận dụng kiến thức có sẵn. Thay vì học các mẫu từ đầu, mô hình sử dụng "tập dữ liệu hỗ trợ" chứa một vài ví dụ đã được gắn nhãn để hiểu các lớp mới. Điều này thường đạt được thông qua các kỹ thuật tiên tiến như siêu học , hay còn gọi là "học cách học". Trong mô hình này, mô hình được huấn luyện trên nhiều nhiệm vụ khác nhau để học được quy tắc khởi tạo hoặc cập nhật tối ưu, cho phép nó thích ứng với các nhiệm vụ mới với sự điều chỉnh tối thiểu.
Một phương pháp phổ biến khác liên quan đến học dựa trên số liệu, trong đó mô hình học cách ánh xạ dữ liệu đầu vào vào không gian vectơ bằng cách sử dụng các embedding . Trong không gian này, các mục tương tự được nhóm lại gần nhau trong khi các mục không giống nhau bị đẩy ra xa. Các thuật toán như Mạng Nguyên mẫu (Prototypical Networks) tính toán một biểu diễn trung bình, hay nguyên mẫu, cho mỗi lớp và classify Các mẫu truy vấn mới được tạo ra dựa trên khoảng cách của chúng đến các nguyên mẫu này. Điều này thường dựa vào khả năng trích xuất đặc trưng được phát triển trong quá trình huấn luyện trước trên các tập dữ liệu tổng quát lớn hơn.
Học máy dựa trên dữ liệu ít (Few-Shot Learning) đang làm thay đổi các ngành công nghiệp nơi mà trước đây sự khan hiếm dữ liệu đã cản trở việc áp dụng các công nghệ AI.
In the field of medical image analysis, obtaining thousands of labeled scans for rare pathologies is often unfeasible. FSL allows researchers to train computer vision (CV) systems to detect rare tumor types or specific genetic anomalies using only a handful of annotated case studies. This capability democratizes access to advanced diagnostic tools, a goal pursued by institutions like Stanford Medicine, helping to identify conditions that would otherwise require specialized human expertise.
Ứng dụng trí tuệ nhân tạo hiện đại trong sản xuất phụ thuộc rất nhiều vào việc kiểm tra tự động. Tuy nhiên, các lỗi cụ thể có thể xảy ra rất hiếm khi, khiến việc xây dựng một tập dữ liệu lớn về các bộ phận "hỏng" trở nên khó khăn. FSL cho phép các hệ thống phát hiện bất thường học được các đặc điểm của một loại lỗi mới chỉ từ một vài hình ảnh. Điều này cho phép các nhà điều hành nhà máy nhanh chóng cập nhật các quy trình đảm bảo chất lượng mà không cần dừng sản xuất để thu thập dữ liệu, cải thiện đáng kể hiệu quả trong môi trường sản xuất năng động.
Việc phân biệt FSL với các mô hình học máy dựa trên dữ liệu thấp tương tự sẽ giúp hiểu rõ hơn về vị trí đặc thù của nó:
In practice, one of the most effective ways to perform Few-Shot Learning is to leverage a highly robust pre-trained model. State-of-the-art models like the newer YOLO26 have learned rich feature representations from massive datasets like COCO or ImageNet. By fine-tuning these models on a tiny custom dataset, they can adapt to new tasks with remarkable speed and accuracy.
Sau đây Python Ví dụ này minh họa cách huấn luyện mô hình trên một tập dữ liệu nhỏ bằng cách sử dụng...
ultralytics gói phần mềm, thực hiện thích ứng hiệu quả với số lượng mẫu ít:
from ultralytics import YOLO
# Load a pre-trained YOLO26 model (incorporates learned features)
model = YOLO("yolo26n.pt")
# Fine-tune on a tiny dataset (e.g., coco8 has only 4 images per batch)
# This leverages the model's prior knowledge for the new task
results = model.train(data="coco8.yaml", epochs=20, imgsz=640)
# The model adapts to detect objects in the small dataset
print("Few-shot adaptation complete.")
While powerful, FSL faces challenges regarding reliability. If the few provided examples are outliers or noisy, the model's performance can degrade, a problem known as overfitting. Research into data augmentation and synthetic data generation is critical for mitigating these risks. As foundation models become larger and more capable, and tools like the Ultralytics Platform simplify model training and management, the ability to create custom AI solutions with minimal data will become increasingly accessible to developers worldwide.