Thuật ngữ

Học một lần

Khám phá sức mạnh của One-Shot Learning, một kỹ thuật AI mang tính cách mạng cho phép các mô hình khái quát hóa từ dữ liệu tối thiểu cho các ứng dụng thực tế.

Học một lần (OSL) là một nhiệm vụ phân loại trong học máy (ML), trong đó một mô hình được huấn luyện để nhận ra một lớp đối tượng mới chỉ từ một ví dụ duy nhất. Không giống như các mô hình học sâu truyền thống đòi hỏi một lượng lớn dữ liệu huấn luyện , OSL hướng đến việc mô phỏng khả năng học về một khái niệm mới của con người từ một ví dụ duy nhất. Điều này làm cho nó đặc biệt hữu ích trong các tình huống mà việc thu thập dữ liệu tốn kém, khó khăn hoặc bất khả thi. Ý tưởng cốt lõi không phải là học cách phân loại đối tượng trực tiếp, mà là học một hàm tương đồng có thể xác định xem hai hình ảnh có thuộc cùng một lớp hay không.

Học một lần hoạt động như thế nào

Thay vì huấn luyện một mô hình để xác định các lớp cụ thể, các mô hình OSL thường được huấn luyện cho một nhiệm vụ khác: xác định xem hai hình ảnh đầu vào giống nhau hay khác nhau. Một kiến trúc phổ biến được sử dụng cho việc này là Mạng Siamese, bao gồm hai mạng nơ-ron giống hệt nhau có cùng trọng số . Mỗi mạng xử lý một trong hai hình ảnh đầu vào để tạo ra một phép nhúng —một biểu diễn số học nhỏ gọn của hình ảnh.

Sau đó, mô hình so sánh hai phép nhúng này để tính điểm tương đồng. Trong quá trình huấn luyện mô hình , mạng học cách tạo ra các phép nhúng tương tự cho các ảnh cùng lớp và các phép nhúng khác nhau cho các ảnh từ các lớp khác nhau. Sau khi được huấn luyện, mô hình có thể phân loại một ảnh mới bằng cách so sánh nó với một "ảnh chụp" hoặc ví dụ duy nhất từ mỗi lớp đã biết. Ảnh mới được gán vào lớp có điểm tương đồng cao nhất. Phương pháp này dựa rất nhiều vào việc trích xuất đặc trưng tốt để xây dựng các biểu diễn mạnh mẽ.

Mối quan hệ với các mô hình học tập khác

OSL là một phần của nhóm phương pháp học tập rộng hơn được thiết kế cho các tình huống dữ liệu thấp:

  • Học ít lần (FSL) : Một dạng tổng quát của OSL, trong đó mô hình học từ một số lượng nhỏ ví dụ (ví dụ: 2 đến 5 ví dụ) cho mỗi lớp, thay vì chỉ một. FSL cung cấp nhiều thông tin hơn OSL, thường mang lại hiệu suất tốt hơn.
  • Học Zero-Shot (ZSL) : Một mô hình đầy thách thức hơn, trong đó mô hình phải nhận ra các lớp mà nó chưa từng thấy trong quá trình đào tạo, thường bằng cách học cách ánh xạ giữa các đặc điểm trực quan và mô tả ngữ nghĩa cấp cao.
  • Học siêu hình : Thường được gọi là "học để học", phương pháp này huấn luyện một mô hình trên nhiều loại nhiệm vụ học tập khác nhau để cho phép nó giải quyết các nhiệm vụ mới hiệu quả hơn. Nhiều kỹ thuật OSL và FSL dựa trên các nguyên tắc học siêu hình, như được mô tả trong nghiên cứu từ các tổ chức như BAIR của UC Berkeley .
  • Học chuyển giao : Phương pháp này bao gồm việc sử dụng một mô hình được đào tạo trước trên một tập dữ liệu lớn (như ImageNet ) và sau đó tinh chỉnh nó trên một tập dữ liệu nhỏ hơn, cụ thể hơn. Mặc dù có liên quan, OSL tập trung vào việc học từ một ví dụ duy nhất mà không cần tinh chỉnh sâu rộng.

Ứng dụng trong thế giới thực

Học một lần có hiệu quả cao trong những tình huống dữ liệu khan hiếm.

  1. Nhận dạng Khuôn mặt: Hệ thống an ninh có thể sử dụng OSL để nhận dạng một người sau khi chỉ được hiển thị một ảnh. Hệ thống học cách tạo ra một dấu hiệu khuôn mặt duy nhất (nhúng) và sau đó có thể nhận dạng người đó từ các góc độ và điều kiện ánh sáng khác nhau. Điều này được sử dụng trong các ứng dụng, từ mở khóa điện thoại thông minh đến bảo mật ra vào tòa nhà. Một bài báo có ảnh hưởng ban đầu, DeepFace của Facebook AI , đã chứng minh sức mạnh của mạng lưới sâu cho nhiệm vụ này.
  2. Khám phá thuốc: Trong dược lý học, việc xác định các phân tử mới có khả năng trở thành thuốc hiệu quả là một quá trình tốn kém. OSL có thể được sử dụng để xây dựng các mô hình dự đoán đặc tính của một phân tử mới dựa trên một ví dụ đã biết với các đặc điểm mong muốn. Điều này giúp đẩy nhanh quá trình sàng lọc, như đã được thảo luận trong nghiên cứu về học sâu dựa trên đồ thị để phát triển thuốc .

Thách thức và hướng đi trong tương lai

Thách thức chính trong OSL là khái quát hóa. Một mô hình phải học được bản chất cốt lõi của một lớp từ một ví dụ duy nhất mà không bị quá khớp với các đặc điểm cụ thể của nó. Do đó, chất lượng của từng ví dụ là rất quan trọng. Các nghiên cứu đang được tiến hành, chẳng hạn như công trình được nêu bật trên Papers with Code , tập trung vào việc phát triển các biểu diễn đặc điểm mạnh mẽ hơn và các chiến lược siêu học tiên tiến. Việc tích hợp các khả năng của OSL vào các nền tảng thị giác đa năng như Ultralytics HUB có thể mở rộng đáng kể việc sử dụng chúng trong các môi trường hạn chế dữ liệu. Khi các mô hình trở nên mạnh mẽ hơn, việc đánh giá chúng bằng các chỉ số hiệu suất phù hợp trong những điều kiện khắc nghiệt này cũng là một lĩnh vực nghiên cứu quan trọng.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard