Khám phá sức mạnh của One-Shot Learning, một kỹ thuật AI mang tính cách mạng cho phép các mô hình khái quát hóa từ dữ liệu tối thiểu cho các ứng dụng thực tế.
One-Shot Learning (OSL) là một nhiệm vụ phân loại trong học máy (ML) trong đó một mô hình được huấn luyện để nhận ra một lớp đối tượng mới chỉ từ một ví dụ duy nhất. Không giống như các mô hình học sâu truyền thống đòi hỏi một lượng lớn dữ liệu huấn luyện, OSL nhằm mục đích bắt chước khả năng của con người để tìm hiểu về một khái niệm mới từ một trường hợp duy nhất. Điều này làm cho nó đặc biệt có giá trị trong các tình huống mà việc thu thập dữ liệu tốn kém, khó khăn hoặc không thể thực hiện được. Ý tưởng cốt lõi không phải là học cách phân loại trực tiếp các đối tượng, mà là học một hàm tương đồng có thể xác định xem hai hình ảnh có thuộc cùng một lớp hay không.
Thay vì huấn luyện một mô hình để xác định các lớp cụ thể, các mô hình OSL thường được huấn luyện trên một nhiệm vụ khác: xác định xem hai ảnh đầu vào có giống nhau hay khác nhau. Một kiến trúc phổ biến được sử dụng cho việc này là Mạng Siamese, bao gồm hai mạng nơ-ron giống hệt nhau, dùng chung trọng số. Mỗi mạng xử lý một trong hai ảnh đầu vào để tạo ra một embedding (vector đặc trưng)—một biểu diễn số nhỏ gọn của ảnh.
Sau đó, mô hình so sánh hai embedding này để tính điểm tương đồng. Trong quá trình huấn luyện mô hình, mạng học cách tạo ra các embedding tương tự cho hình ảnh của cùng một lớp và các embedding khác nhau cho hình ảnh từ các lớp khác nhau. Sau khi được huấn luyện, mô hình có thể phân loại một hình ảnh mới bằng cách so sánh nó với "shot" duy nhất hoặc ví dụ từ mỗi lớp đã biết. Hình ảnh mới được gán cho lớp có điểm tương đồng cao nhất. Cách tiếp cận này phụ thuộc nhiều vào trích xuất đặc trưng tốt để xây dựng các biểu diễn mạnh mẽ.
OSL là một phần của họ các phương pháp học tập rộng lớn hơn được thiết kế cho các tình huống dữ liệu thấp:
One-Shot Learning rất hiệu quả trong các tình huống có dữ liệu khan hiếm.
Thách thức chính trong OSL là khái quát hóa. Một mô hình phải học được bản chất cốt lõi của một lớp từ một ví dụ duy nhất mà không quá khớp với các đặc trưng cụ thể của nó. Do đó, chất lượng của ví dụ duy nhất là rất quan trọng. Nghiên cứu đang diễn ra, chẳng hạn như công việc được nêu bật trên Papers with Code, tập trung vào việc phát triển các biểu diễn đặc trưng mạnh mẽ hơn và các chiến lược siêu học nâng cao. Tích hợp các khả năng OSL vào các nền tảng thị giác đa năng như Ultralytics HUB có thể mở rộng đáng kể việc sử dụng chúng trong môi trường giới hạn dữ liệu. Khi các mô hình trở nên mạnh mẽ hơn, việc đánh giá chúng bằng các số liệu hiệu suất phù hợp trong các điều kiện khó khăn này cũng là một lĩnh vực nghiên cứu quan trọng.