Yolo Vision Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học Một Lần

Khám phá sức mạnh của One-Shot Learning, một kỹ thuật AI mang tính cách mạng cho phép các mô hình khái quát hóa từ dữ liệu tối thiểu cho các ứng dụng thực tế.

One-Shot Learning (OSL) là một nhiệm vụ phân loại trong học máy (ML) trong đó một mô hình được huấn luyện để nhận ra một lớp đối tượng mới chỉ từ một ví dụ duy nhất. Không giống như các mô hình học sâu truyền thống đòi hỏi một lượng lớn dữ liệu huấn luyện, OSL nhằm mục đích bắt chước khả năng của con người để tìm hiểu về một khái niệm mới từ một trường hợp duy nhất. Điều này làm cho nó đặc biệt có giá trị trong các tình huống mà việc thu thập dữ liệu tốn kém, khó khăn hoặc không thể thực hiện được. Ý tưởng cốt lõi không phải là học cách phân loại trực tiếp các đối tượng, mà là học một hàm tương đồng có thể xác định xem hai hình ảnh có thuộc cùng một lớp hay không.

Học một lần (One-Shot Learning) hoạt động như thế nào

Thay vì huấn luyện một mô hình để xác định các lớp cụ thể, các mô hình OSL thường được huấn luyện trên một nhiệm vụ khác: xác định xem hai ảnh đầu vào có giống nhau hay khác nhau. Một kiến trúc phổ biến được sử dụng cho việc này là Mạng Siamese, bao gồm hai mạng nơ-ron giống hệt nhau, dùng chung trọng số. Mỗi mạng xử lý một trong hai ảnh đầu vào để tạo ra một embedding (vector đặc trưng)—một biểu diễn số nhỏ gọn của ảnh.

Sau đó, mô hình so sánh hai embedding này để tính điểm tương đồng. Trong quá trình huấn luyện mô hình, mạng học cách tạo ra các embedding tương tự cho hình ảnh của cùng một lớp và các embedding khác nhau cho hình ảnh từ các lớp khác nhau. Sau khi được huấn luyện, mô hình có thể phân loại một hình ảnh mới bằng cách so sánh nó với "shot" duy nhất hoặc ví dụ từ mỗi lớp đã biết. Hình ảnh mới được gán cho lớp có điểm tương đồng cao nhất. Cách tiếp cận này phụ thuộc nhiều vào trích xuất đặc trưng tốt để xây dựng các biểu diễn mạnh mẽ.

Mối quan hệ với các mô hình học tập khác

OSL là một phần của họ các phương pháp học tập rộng lớn hơn được thiết kế cho các tình huống dữ liệu thấp:

  • Học với ít mẫu (Few-Shot Learning - FSL): Một khái quát hóa của OSL, trong đó mô hình học từ một số lượng nhỏ các ví dụ (ví dụ: 2 đến 5) trên mỗi lớp, thay vì chỉ một. FSL cung cấp nhiều thông tin hơn OSL, thường dẫn đến hiệu suất tốt hơn.
  • Học không cần ví dụ (Zero-Shot Learning - ZSL): Một mô hình khó khăn hơn, trong đó mô hình phải nhận ra các lớp mà nó chưa từng thấy trong quá trình huấn luyện, thường bằng cách học một ánh xạ giữa các đặc trưng trực quan và các mô tả ngữ nghĩa cấp cao.
  • Meta-Learning: Thường được gọi là "học cách học", phương pháp này huấn luyện một mô hình trên nhiều tác vụ học tập khác nhau để cho phép nó giải quyết các tác vụ mới hiệu quả hơn. Nhiều kỹ thuật OSL và FSL dựa trên các nguyên tắc meta-learning, như được mô tả bởi nghiên cứu từ các tổ chức như BAIR của UC Berkeley.
  • Học chuyển giao: Điều này liên quan đến việc sử dụng một mô hình được huấn luyện trước trên một bộ dữ liệu lớn (như ImageNet) và sau đó tinh chỉnh nó trên một bộ dữ liệu nhỏ hơn, cụ thể. Mặc dù có liên quan, OSL tập trung vào việc học từ một ví dụ duy nhất mà không cần tinh chỉnh mở rộng.

Các Ứng dụng Thực tế

One-Shot Learning rất hiệu quả trong các tình huống có dữ liệu khan hiếm.

  1. Nhận diện khuôn mặt: Các hệ thống an ninh có thể sử dụng OSL để xác định một người chỉ sau khi được xem một ảnh duy nhất. Hệ thống học cách tạo ra một chữ ký khuôn mặt (embedding) duy nhất và sau đó có thể nhận ra người đó từ các góc độ khác nhau và trong các điều kiện ánh sáng khác nhau. Điều này được sử dụng trong các ứng dụng từ mở khóa điện thoại thông minh đến truy cập tòa nhà an toàn. Một bài báo có ảnh hưởng ban đầu, DeepFace của Facebook AI, đã chứng minh sức mạnh của mạng lưới sâu cho nhiệm vụ này.
  2. Drug Discovery (Khám phá thuốc): Trong dược lý học, việc xác định các phân tử mới có thể trở thành thuốc hiệu quả là một quá trình tốn kém. OSL có thể được sử dụng để xây dựng các mô hình dự đoán các đặc tính của một phân tử mới dựa trên một ví dụ đã biết duy nhất với các đặc điểm mong muốn. Điều này đẩy nhanh quá trình sàng lọc, như được thảo luận trong nghiên cứu về học sâu dựa trên đồ thị để phát triển thuốc.

Thách thức và Định hướng Tương lai

Thách thức chính trong OSL là khái quát hóa. Một mô hình phải học được bản chất cốt lõi của một lớp từ một ví dụ duy nhất mà không quá khớp với các đặc trưng cụ thể của nó. Do đó, chất lượng của ví dụ duy nhất là rất quan trọng. Nghiên cứu đang diễn ra, chẳng hạn như công việc được nêu bật trên Papers with Code, tập trung vào việc phát triển các biểu diễn đặc trưng mạnh mẽ hơn và các chiến lược siêu học nâng cao. Tích hợp các khả năng OSL vào các nền tảng thị giác đa năng như Ultralytics HUB có thể mở rộng đáng kể việc sử dụng chúng trong môi trường giới hạn dữ liệu. Khi các mô hình trở nên mạnh mẽ hơn, việc đánh giá chúng bằng các số liệu hiệu suất phù hợp trong các điều kiện khó khăn này cũng là một lĩnh vực nghiên cứu quan trọng.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard