One-Shot Learning (OSL) là một lĩnh vực chuyên biệt trong học máy (ML) với mục tiêu là phân loại các ví dụ mới dựa trên chỉ một trường hợp đào tạo duy nhất cho mỗi lớp. Điều này trái ngược hẳn với các phương pháp học có giám sát truyền thống, thường yêu cầu hàng nghìn ví dụ được gắn nhãn cho mỗi lớp để đạt được độ chính xác cao. OSL đặc biệt có liên quan trong các tình huống mà dữ liệu đào tạo khan hiếm, tốn kém hoặc mất nhiều thời gian để thu thập, khiến nó trở thành một kỹ thuật quan trọng cho các ứng dụng thực tế trong đó hạn chế dữ liệu là phổ biến.
Học một lần hoạt động như thế nào
Thay vì học cách ánh xạ trực tiếp đầu vào vào nhãn lớp từ nhiều ví dụ, các mô hình OSL thường học một hàm tương tự. Ý tưởng cốt lõi là xác định mức độ giống nhau của một ví dụ mới, chưa từng thấy (truy vấn) với ví dụ có nhãn duy nhất khả dụng (hỗ trợ) cho mỗi lớp. Nếu ví dụ truy vấn rất giống với ví dụ hỗ trợ của một lớp cụ thể, thì nó sẽ được gán nhãn lớp đó. Điều này thường liên quan đến việc sử dụng các kiến trúc học sâu (DL) như Siamese Networks , xử lý hai đầu vào đồng thời để xác định mức độ giống nhau của chúng. Các mạng này thường được đào tạo trước trên các tập dữ liệu lớn (như ImageNet ) bằng cách sử dụng học chuyển giao để học các biểu diễn tính năng mạnh mẽ trước khi được điều chỉnh cho tác vụ OSL thông qua các kỹ thuật như học số liệu .
Các khái niệm chính trong học tập một lần
- Bộ hỗ trợ: Bao gồm ví dụ có nhãn duy nhất được cung cấp cho mỗi lớp mà mô hình cần học.
- Bộ truy vấn: Chứa các ví dụ chưa được gắn nhãn mà mô hình cần phân loại dựa trên bộ hỗ trợ.
- Học độ tương đồng/đo lường: Quá trình học hàm khoảng cách hoặc đo lường độ tương đồng giữa các điểm dữ liệu, rất quan trọng để so sánh các ví dụ truy vấn với các ví dụ hỗ trợ.
- Đào tạo theo từng đợt: Một chiến lược đào tạo phổ biến trong đó mô hình được đào tạo trên nhiều tác vụ OSL nhỏ (các đợt) lấy mẫu từ một tập dữ liệu lớn hơn để mô phỏng tình huống một lần trong quá trình đào tạo.
Học một lần so với các mô hình liên quan
Để hiểu được OSL, bạn cần phân biệt nó với các khái niệm liên quan:
- Học ít lần (FSL) : OSL được coi là một biến thể cực đoan của FSL. Trong khi OSL chỉ sử dụng một ví dụ cho mỗi lớp, FSL sử dụng một số lượng nhỏ (k > 1, thường là 5 hoặc 10) ví dụ cho mỗi lớp. Cả hai đều giải quyết tình trạng khan hiếm dữ liệu nhưng khác nhau về số lượng mẫu có sẵn. Bạn có thể đọc thêm về các mô hình này trong bài đăng trên blog của chúng tôi về hiểu về học ít lần, học không lần và học chuyển giao .
- Zero-Shot Learning (ZSL) : ZSL giải quyết một vấn đề thậm chí còn khó hơn: phân loại các trường hợp từ các lớp chưa từng thấy trong quá trình đào tạo. Điều này thường đạt được bằng cách tận dụng thông tin bổ trợ, chẳng hạn như các thuộc tính ngữ nghĩa hoặc mô tả văn bản, kết nối các lớp đã thấy và chưa thấy. OSL yêu cầu phải xem một ví dụ; ZSL yêu cầu phải xem không có ví dụ nào nhưng cần ngữ cảnh ngữ nghĩa bổ sung.
- Chuyển giao học tập & tinh chỉnh : Trong khi OSL thường sử dụng chuyển giao học tập (đào tạo trước trên một tập dữ liệu lớn), mục tiêu thì khác. Chuyển giao học tập tiêu chuẩn hoặc tinh chỉnh thường giả định một lượng dữ liệu mục tiêu hợp lý có sẵn để điều chỉnh, trong khi OSL xử lý cụ thể ràng buộc một ví dụ. Các kỹ thuật như đào tạo tùy chỉnh Các mô hình YOLO Ultralytics thường liên quan đến việc tinh chỉnh các trọng số được đào tạo trước, nhưng thường có nhiều hơn một ví dụ cho mỗi lớp.
Ứng dụng trong thế giới thực
OSL cho phép nhiều ứng dụng trước đây bị cản trở bởi giới hạn dữ liệu:
- Nhận dạng khuôn mặt : Hệ thống an ninh hoặc thiết bị cá nhân có thể cần phải xác định hoặc xác minh một người sau khi đăng ký họ chỉ bằng một bức ảnh duy nhất. NIST tiến hành thử nghiệm rộng rãi về các công nghệ nhận dạng khuôn mặt, nhiều công nghệ phải đối mặt với những thách thức tương tự như chụp một vài bức ảnh hoặc chụp một bức ảnh.
- Phát hiện vật thể hiếm: Trong các lĩnh vực như kiểm soát chất lượng sản xuất hoặc bảo tồn động vật hoang dã , việc xác định các khiếm khuyết hiếm hoặc các loài có nguy cơ tuyệt chủng chỉ có thể thực hiện được với một hoặc rất ít ví dụ trước đó. Trong khi các mô hình như Ultralytics YOLO11 vượt trội trong việc phát hiện vật thể với dữ liệu đầy đủ, các kỹ thuật OSL có thể tăng cường chúng cho các lớp cực kỳ hiếm.
- Xác minh chữ ký: Xác thực chữ ký của một người dựa trên một chữ ký tham chiếu duy nhất được lưu trữ trong tệp. Nghiên cứu khám phá học sâu cho nhiệm vụ này, thường trong chế độ dữ liệu thấp.
- Khám phá thuốc: Xác định các ứng cử viên thuốc mới tiềm năng hoặc dự đoán các đặc tính phân tử dựa trên kết quả thử nghiệm rất hạn chế, đẩy nhanh quá trình nghiên cứu. Các nghiên cứu cho thấy ứng dụng của OSL trong việc dự đoán tương tác thuốc-mục tiêu.
Thách thức và định hướng tương lai
Thách thức chính trong OSL là khái quát hóa: làm thế nào một mô hình có thể học đáng tin cậy bản chất của một lớp chỉ từ một ví dụ mà không bị quá khớp ? Việc lựa chọn và chất lượng của ví dụ hỗ trợ duy nhất trở nên cực kỳ quan trọng. Nghiên cứu đang diễn ra tập trung vào việc phát triển các biểu diễn tính năng mạnh mẽ hơn, các số liệu tương đồng tốt hơn và tận dụng các kỹ thuật như siêu học ("học cách học") để cải thiện hiệu suất OSL. Việc tích hợp các khả năng của OSL vào các mô hình và nền tảng tầm nhìn mục đích chung như Ultralytics HUB có thể mở rộng đáng kể khả năng áp dụng của chúng trong các môi trường hạn chế dữ liệu. Đánh giá các mô hình OSL đòi hỏi phải cân nhắc cẩn thận các số liệu hiệu suất trong những điều kiện đầy thách thức này.