Few-Shot Learning (FSL) là một phân ngành của Machine Learning (ML) tập trung vào việc thiết kế các mô hình có thể khái quát hóa từ một số lượng rất nhỏ các ví dụ đào tạo trên mỗi lớp, thường chỉ là một số ít. Điều này trái ngược hẳn với các phương pháp Deep Learning (DL) truyền thống thường yêu cầu một lượng lớn dữ liệu đào tạo được gắn nhãn. Ý tưởng cốt lõi được lấy cảm hứng từ quá trình học tập của con người, trong đó chúng ta thường có thể nhận ra các khái niệm mới sau khi chỉ nhìn thấy một hoặc hai trường hợp. FSL đặc biệt quan trọng trong các lĩnh vực mà việc thu thập dữ liệu tốn kém, mất thời gian hoặc vốn có hạn chế, giúp Trí tuệ nhân tạo (AI) thích ứng hơn và hiệu quả hơn về dữ liệu.
Học theo phương pháp Few-Shot hoạt động như thế nào
Kỹ thuật học tập Few-Shot nhằm mục đích tận dụng kiến thức trước đó để học các khái niệm mới một cách nhanh chóng từ dữ liệu hạn chế. Các chiến lược phổ biến bao gồm:
- Meta-Learning: Thường được mô tả là "học để học", meta-learning liên quan đến việc đào tạo một mô hình về nhiều nhiệm vụ học tập khác nhau trong giai đoạn meta-training. Điều này cho phép mô hình học một thuật toán học tập hiệu quả hoặc các tham số ban đầu có thể nhanh chóng thích ứng với một nhiệm vụ mới với một vài ví dụ. Một số thuật toán meta-learning đã được phát triển cho mục đích này.
- Học chuyển giao: FSL thường sử dụng Học chuyển giao bằng cách bắt đầu với một mô hình được đào tạo trước trên một tập dữ liệu lớn (như ImageNet hoặc COCO ). Mô hình được đào tạo trước này, vốn đã hiểu các tính năng chung từ tập dữ liệu lớn, sau đó được tinh chỉnh bằng cách sử dụng số lượng nhỏ các ví dụ có sẵn cho nhiệm vụ mục tiêu cụ thể. Cách tiếp cận này tận dụng kiến thức chung được nhúng trong các trọng số của mô hình .
- Tăng cường dữ liệu: Việc tạo ra các biến thể của một số ít mẫu đào tạo có sẵn bằng cách sử dụng các kỹ thuật tăng cường dữ liệu có thể giúp mở rộng tập dữ liệu hạn chế, mặc dù hiệu quả của nó có thể thay đổi trong các chế độ dữ liệu cực kỳ thấp. Có thể cần đến các chiến lược tăng cường nâng cao .
Các phương pháp này cho phép Mạng nơ-ron (NN) đạt được hiệu suất hợp lý ngay cả với dữ liệu tác vụ cụ thể tối thiểu.
Học tập ít lần so với các khái niệm liên quan
Điều quan trọng là phải phân biệt FSL với các mô hình học tập tương tự:
- Zero-Shot Learning (ZSL) : ZSL hướng đến mục tiêu phân loại các trường hợp từ các lớp chưa từng thấy trong quá trình đào tạo. Điều này thường đạt được bằng cách sử dụng thông tin bổ trợ, chẳng hạn như mô tả văn bản hoặc thuộc tính của các lớp chưa thấy, để thu hẹp khoảng cách giữa dữ liệu đã thấy và chưa thấy. Ngược lại, FSL yêu cầu ít nhất một vài ví dụ được gắn nhãn cho mỗi lớp mới. Tổng quan về ZSL, FSL và Transfer Learning có thể cung cấp thêm bối cảnh.
- One-Shot Learning (OSL) : OSL là một biến thể cực đoan của FSL, trong đó mô hình phải học cách nhận dạng một lớp mới chỉ từ một ví dụ được gắn nhãn. Nó chia sẻ cùng mục tiêu với FSL nhưng hoạt động theo các ràng buộc dữ liệu thậm chí còn nghiêm ngặt hơn.
- Chuyển giao học tập : Mặc dù FSL thường sử dụng chuyển giao học tập như một kỹ thuật, các thuật ngữ không thể thay thế cho nhau. Chuyển giao học tập là một khái niệm rộng hơn liên quan đến việc tận dụng kiến thức từ một nhiệm vụ nguồn để cải thiện hiệu suất trên một nhiệm vụ mục tiêu. FSL đặc biệt giải quyết thách thức của việc học tập hiệu quả khi nhiệm vụ mục tiêu có dữ liệu được gắn nhãn cực kỳ hạn chế.
Ứng dụng của Học tập ít lần
FSL cho phép ứng dụng AI trong các tình huống mà bộ dữ liệu lớn là không thực tế hoặc không thể có được:
- Chẩn đoán bệnh hiếm: Trong phân tích hình ảnh y khoa , việc thu thập nhiều ví dụ về các bệnh hiếm để đào tạo các mô hình chẩn đoán là một thách thức. FSL cho phép các mô hình học cách xác định các tình trạng như vậy (ví dụ, các loại khối u cụ thể trong quá trình quét) từ một tập hợp nhỏ hình ảnh bệnh nhân, có khả năng đẩy nhanh quá trình chẩn đoán và nghiên cứu. Đây là một lĩnh vực quan trọng đối với AI trong chăm sóc sức khỏe , với các nghiên cứu được công bố trên các tạp chí như Radiology: Artificial Intelligence .
- Phát hiện đối tượng tùy chỉnh: Cân nhắc việc cần một mô hình Phát hiện đối tượng để xác định một sản phẩm mới được thiết kế trên dây chuyền sản xuất hoặc một loài quý hiếm trong cảnh quay bảo tồn động vật hoang dã . Việc thu thập hàng nghìn hình ảnh được gắn nhãn có thể là không khả thi. FSL cho phép đào tạo các mô hình tùy chỉnh , chẳng hạn như điều chỉnh mô hình Ultralytics YOLO bằng các nền tảng như Ultralytics HUB , chỉ với một số ít ví dụ cho mỗi lớp đối tượng mới. Điều này giúp tăng tốc triển khai cho các tác vụ Thị giác máy tính (CV) chuyên biệt.
- Dịch ngôn ngữ ít tài nguyên: Đào tạo các mô hình dịch cho các ngôn ngữ có văn bản kỹ thuật số hạn chế yêu cầu các kỹ thuật FSL trong Xử lý ngôn ngữ tự nhiên (NLP) .
- Kỹ thuật robot: Một ứng dụng khác được khám phá trong nghiên cứu trình bày tại các hội nghị như ICRA là cho phép robot ( Kỹ thuật robot ) học cách nhận biết và tương tác nhanh chóng với các vật thể mới trong môi trường không quen thuộc dựa trên mức độ tiếp xúc tối thiểu.
Thách thức và định hướng tương lai
Mặc dù có triển vọng, FSL vẫn phải đối mặt với những thách thức, bao gồm độ nhạy của mô hình đối với một số ít ví dụ cụ thể được cung cấp và đảm bảo khái quát hóa mạnh mẽ ngoài những ví dụ đó. Vượt qua tình trạng quá khớp với dữ liệu hạn chế như vậy là một rào cản đáng kể. Nghiên cứu đang diễn ra tập trung vào việc phát triển các thuật toán siêu học mạnh mẽ hơn, tận dụng tốt hơn việc học không giám sát hoặc học tự giám sát để đào tạo trước và tạo ra các khuôn khổ lý thuyết để hiểu khái quát hóa trong các chế độ dữ liệu thấp. Các tổ chức như Google AI và Meta AI tích cực đóng góp vào việc thúc đẩy các kỹ thuật FSL, nhằm mục đích làm cho các hệ thống AI linh hoạt hơn và ít đói dữ liệu hơn.