Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Tìm hiểu về few-shot learning, zero-shot learning và transfer learning

Abirami Vina

5 phút đọc

Ngày 29 tháng 1, 2025

Khám phá sự khác biệt giữa học ít mẫu (few-shot learning), học không mẫu (zero-shot learning) và học chuyển giao (transfer learning) trong thị giác máy tính và cách các mô hình này định hình quá trình đào tạo mô hình AI.

Các hệ thống trí tuệ nhân tạo (AI) có thể xử lý các tác vụ phức tạp như nhận dạng khuôn mặt, phân loại hình ảnh và lái xe với sự can thiệp tối thiểu của con người. Chúng thực hiện điều này bằng cách nghiên cứu dữ liệu, nhận dạng các mẫu và sử dụng các mẫu đó để đưa ra dự đoán hoặc quyết định. Khi AI tiến bộ, chúng ta đang chứng kiến những cách thức ngày càng tinh vi hơn trong đó các mô hình AI có thể học hỏi, thích ứng và thực hiện các tác vụ với hiệu quả đáng kể.

Ví dụ: thị giác máy tính (computer vision) là một nhánh của AI tập trung vào việc cho phép máy móc diễn giải và hiểu thông tin trực quan từ thế giới. Việc phát triển mô hình thị giác máy tính truyền thống phụ thuộc nhiều vào tập dữ liệu (datasets) lớn, được gán nhãn để huấn luyện. Việc thu thập và dán nhãn dữ liệu như vậy có thể tốn nhiều thời gian và chi phí. 

Để giải quyết những thách thức này, các nhà nghiên cứu đã giới thiệu các phương pháp tiếp cận sáng tạo như học ít mẫu (FSL), học từ các ví dụ hạn chế; học không mẫu (ZSL), xác định các đối tượng chưa từng thấy; và học chuyển giao (TL), áp dụng kiến thức từ các mô hình được đào tạo trước cho các tác vụ mới.

Trong bài viết này, chúng ta sẽ khám phá cách các mô hình học tập này hoạt động, làm nổi bật những khác biệt chính của chúng và xem xét các ứng dụng thực tế. Hãy cùng bắt đầu!

Tổng quan về các mô hình học máy

Hãy cùng khám phá học ít mẫu (few-shot learning), học không mẫu (zero-shot learning) và học chuyển giao (transfer learning) là gì đối với thị giác máy tính và cách chúng hoạt động. 

Học Ít Mẫu (Few-shot learning)

Học ít mẫu là một phương pháp mà các hệ thống học cách nhận dạng các đối tượng mới chỉ bằng một số ít ví dụ. Ví dụ: nếu bạn cho mô hình xem một vài bức ảnh về chim cánh cụt, bồ nông và chim puffin (nhóm nhỏ này được gọi là "tập hợp hỗ trợ"), nó sẽ học hình dáng của những loài chim này. 

Sau đó, nếu bạn cho mô hình xem một bức ảnh mới, chẳng hạn như chim cánh cụt, nó sẽ so sánh bức ảnh mới này với những bức ảnh trong tập hợp hỗ trợ của nó và chọn kết quả phù hợp nhất. Khi việc thu thập một lượng lớn dữ liệu trở nên khó khăn, phương pháp này rất hữu ích vì hệ thống vẫn có thể học hỏi và thích ứng chỉ với một vài ví dụ.

__wf_reserved_inherit
Hình 1. Tổng quan về cách thức hoạt động của few-shot learning.

Học không cần dữ liệu (Zero-shot learning)

Học không cần dữ liệu (Zero-shot learning) là một phương pháp để máy móc nhận dạng những thứ chúng chưa từng thấy trước đây mà không cần các ví dụ về chúng. Nó sử dụng thông tin ngữ nghĩa, như mô tả, để giúp tạo ra các kết nối.

Ví dụ: nếu một máy đã học về các loài động vật như mèo, sư tử và ngựa bằng cách hiểu các đặc điểm như “nhỏ và mềm mại”, “mèo hoang lớn” hoặc “mặt dài”, nó có thể sử dụng kiến thức này để xác định một loài động vật mới, như hổ. Ngay cả khi nó chưa từng nhìn thấy hổ trước đây, nó có thể sử dụng một mô tả như “một con vật giống sư tử với những vằn đen” để xác định chính xác. Điều này giúp máy móc dễ dàng học hỏi và thích ứng hơn mà không cần nhiều ví dụ.

__wf_reserved_inherit
Hình 2. Zero-shot learning (học không cần huấn luyện) xác định các đối tượng mới bằng cách sử dụng mô tả.

Học chuyển giao

Học chuyển giao (Transfer learning) là một mô hình học tập trong đó một mô hình sử dụng những gì nó đã học được từ một tác vụ để giúp giải quyết một tác vụ mới, tương tự. Kỹ thuật này đặc biệt hữu ích khi nói đến các tác vụ thị giác máy tính như phát hiện đối tượng, phân loại hình ảnh và nhận dạng mẫu. 

Ví dụ: Trong thị giác máy tính, một mô hình được đào tạo trước có thể nhận ra các đối tượng chung, như động vật, và sau đó được tinh chỉnh thông qua học chuyển giao để xác định các đối tượng cụ thể, chẳng hạn như các giống chó khác nhau. Bằng cách tái sử dụng kiến thức từ các tác vụ trước đó, học chuyển giao giúp dễ dàng đào tạo các mô hình thị giác máy tính trên các tập dữ liệu nhỏ hơn, tiết kiệm thời gian và công sức.

__wf_reserved_inherit
Hình 3. Tổng quan về cách hoạt động của học chuyển giao (transfer learning).

Bạn có thể đang tự hỏi loại mô hình nào hỗ trợ học chuyển giao. Ultralytics YOLO11 là một ví dụ tuyệt vời về mô hình thị giác máy tính có thể thực hiện điều này. Đây là một mô hình phát hiện đối tượng hiện đại, trước tiên được đào tạo trước trên một bộ dữ liệu lớn, chung. Sau đó, nó có thể được tinh chỉnh và đào tạo tùy chỉnh trên một bộ dữ liệu nhỏ hơn, chuyên biệt cho các tác vụ cụ thể.

So sánh các mô hình học

Sau khi nói về học ít mẫu, học không mẫu và học chuyển giao, hãy so sánh chúng để xem chúng khác nhau như thế nào.

__wf_reserved_inherit
Hình 4. Sự khác biệt chính giữa few-shot learning, zero-shot learning và transfer learning. Ảnh của tác giả.

Học ít mẫu (Few-shot learning) rất hữu ích khi bạn chỉ có một lượng nhỏ dữ liệu được gắn nhãn. Nó giúp cho một mô hình AI có thể học hỏi chỉ từ một vài ví dụ. Mặt khác, học không mẫu (Zero-shot learning) không yêu cầu bất kỳ dữ liệu được gắn nhãn nào. Thay vào đó, nó sử dụng các mô tả hoặc ngữ cảnh để giúp hệ thống xử lý các tác vụ mới. Trong khi đó, học chuyển giao (Transfer learning) sử dụng một phương pháp khác bằng cách sử dụng kiến thức từ các mô hình được huấn luyện trước, cho phép chúng nhanh chóng thích ứng với các tác vụ mới với dữ liệu bổ sung tối thiểu. Mỗi phương pháp có những điểm mạnh riêng tùy thuộc vào loại dữ liệu và tác vụ bạn đang thực hiện.

Các ứng dụng thực tế của các mô hình học tập khác nhau

Những mô hình học tập này đang tạo ra sự khác biệt trong nhiều lĩnh vực, giải quyết các vấn đề phức tạp bằng các giải pháp sáng tạo. Hãy xem xét kỹ hơn cách chúng có thể được áp dụng trong thế giới thực.

Chẩn đoán các bệnh hiếm gặp bằng phương pháp học ít mẫu

Học ít mẫu (Few-shot learning) là một yếu tố thay đổi cuộc chơi cho lĩnh vực chăm sóc sức khỏe, đặc biệt là trong chẩn đoán hình ảnh y tế. Nó có thể giúp các bác sĩ chẩn đoán các bệnh hiếm gặp chỉ bằng một vài ví dụ hoặc thậm chí mô tả, mà không cần lượng lớn dữ liệu. Điều này đặc biệt hữu ích khi dữ liệu bị hạn chế, điều thường xảy ra vì việc thu thập các tập dữ liệu lớn cho các tình trạng hiếm gặp có thể là một thách thức.

Ví dụ: SHEPHERD sử dụng few-shot learning (học với ít dữ liệu) và đồ thị tri thức y sinh để chẩn đoán các rối loạn di truyền hiếm gặp. Nó ánh xạ thông tin bệnh nhân, chẳng hạn như các triệu chứng và kết quả xét nghiệm, lên một mạng lưới các gen và bệnh đã biết. Điều này giúp xác định nguyên nhân di truyền có khả năng và tìm các trường hợp tương tự, ngay cả khi dữ liệu bị hạn chế. 

__wf_reserved_inherit
Hình 5. Mô hình Shepherd chẩn đoán các bệnh hiếm gặp bằng cách sử dụng dữ liệu tối thiểu.

Cải thiện phát hiện bệnh trên thực vật bằng zero-shot learning

Trong nông nghiệp, việc xác định nhanh chóng các bệnh thực vật là rất cần thiết vì sự chậm trễ trong việc phát hiện có thể dẫn đến thiệt hại cây trồng lan rộng, giảm năng suất và tổn thất tài chính đáng kể. Các phương pháp truyền thống thường dựa vào các bộ dữ liệu lớn và kiến thức chuyên môn, có thể không phải lúc nào cũng có thể truy cập được, đặc biệt là ở các khu vực vùng sâu vùng xa hoặc hạn chế về nguồn lực. Đây là nơi những tiến bộ trong AI, như học không cần mẫu (zero-shot learning), phát huy tác dụng.

Giả sử một người nông dân đang trồng cà chua và khoai tây và nhận thấy các triệu chứng như lá vàng hoặc đốm nâu. Học không mẫu (Zero-shot learning) có thể giúp xác định các bệnh như bệnh mốc sương muộn mà không cần bộ dữ liệu lớn. Bằng cách sử dụng mô tả các triệu chứng, mô hình có thể phân loại các bệnh mà nó chưa từng thấy trước đây. Cách tiếp cận này nhanh chóng, có khả năng mở rộng và cho phép nông dân phát hiện nhiều vấn đề về thực vật. Nó giúp họ theo dõi sức khỏe cây trồng hiệu quả hơn, hành động kịp thời và giảm thiểu thiệt hại.

__wf_reserved_inherit
Hình 6. Sử dụng zero-shot learning để xác định bệnh thực vật.

Xe tự hành và học chuyển giao

Xe tự hành thường cần thích ứng với các môi trường khác nhau để di chuyển an toàn. Học chuyển giao (Transfer learning) giúp chúng sử dụng kiến thức trước đó để nhanh chóng điều chỉnh theo các điều kiện mới mà không cần bắt đầu quá trình huấn luyện lại từ đầu. Kết hợp với thị giác máy tính (computer vision), giúp xe diễn giải thông tin trực quan, các công nghệ này cho phép điều hướng mượt mà hơn trên các địa hình và điều kiện thời tiết khác nhau, làm cho việc lái xe tự động hiệu quả và đáng tin cậy hơn.

Một ví dụ điển hình về điều này trong thực tế là một hệ thống quản lý bãi đậu xe sử dụng Ultralytics YOLO11 để theo dõi các chỗ đậu xe. YOLO11, một mô hình phát hiện đối tượng được huấn luyện trước, có thể được tinh chỉnh bằng cách sử dụng học chuyển giao để xác định các chỗ đậu xe trống và có người trong thời gian thực. Bằng cách huấn luyện mô hình trên một tập dữ liệu nhỏ hơn gồm các hình ảnh bãi đậu xe, nó học cách phát hiện chính xác các chỗ trống, chỗ đầy và thậm chí cả các khu vực dành riêng.

__wf_reserved_inherit
Hình 7. Quản lý bãi đỗ xe bằng Ultralytics YOLO11.

Được tích hợp với các công nghệ khác, hệ thống này có thể hướng dẫn người lái xe đến chỗ trống gần nhất, giúp giảm thời gian tìm kiếm và tắc nghẽn giao thông. Transfer learning giúp điều này có thể thực hiện được bằng cách xây dựng trên các khả năng phát hiện đối tượng hiện có của YOLO11, cho phép nó thích ứng với các nhu cầu cụ thể của việc quản lý bãi đậu xe mà không cần bắt đầu lại từ đầu. Cách tiếp cận này giúp tiết kiệm thời gian và nguồn lực, đồng thời tạo ra một giải pháp có tính mở rộng và hiệu quả cao, giúp cải thiện hoạt động đỗ xe và nâng cao trải nghiệm tổng thể của người dùng.

Xu hướng mới nổi trong các mô hình học tập

Tương lai của các mô hình học tập trong thị giác máy tính đang nghiêng về việc phát triển các hệ thống Vision AI thông minh và bền vững hơn. Đặc biệt, một xu hướng ngày càng tăng là sử dụng các phương pháp tiếp cận kết hợp kết hợp few-shot learning (học với ít dữ liệu), zero-shot learning (học không cần dữ liệu) và transfer learning (học chuyển giao). Bằng cách kết hợp các điểm mạnh của các phương pháp này, các mô hình có thể học các tác vụ mới với dữ liệu tối thiểu và áp dụng kiến thức của chúng trên các lĩnh vực khác nhau.

Một ví dụ thú vị là sử dụng nhúng sâu được điều chỉnh để tinh chỉnh các mô hình bằng cách sử dụng kiến thức từ các tác vụ trước đó và một lượng nhỏ dữ liệu mới, giúp bạn dễ dàng làm việc với các tập dữ liệu hạn chế. 

Tương tự, học X-shot được thiết kế để xử lý các tác vụ với lượng dữ liệu khác nhau. Nó sử dụng giám sát yếu, trong đó các mô hình học hỏi từ các nhãn giới hạn hoặc nhiễu, và các hướng dẫn rõ ràng để giúp chúng nhanh chóng thích ứng, ngay cả với ít hoặc không có ví dụ trước đó. Các phương pháp kết hợp này cho thấy cách tích hợp các phương pháp học tập khác nhau có thể giúp hệ thống AI giải quyết các thách thức hiệu quả hơn.

Những điều cần nhớ

Học ít mẫu (Few-shot learning), học không mẫu (zero-shot learning) và học chuyển giao (transfer learning) mỗi loại giải quyết các thách thức cụ thể trong thị giác máy tính, làm cho chúng phù hợp với các tác vụ khác nhau. Phương pháp phù hợp phụ thuộc vào ứng dụng cụ thể và lượng dữ liệu có sẵn. Ví dụ: học ít mẫu hoạt động tốt với dữ liệu hạn chế, trong khi học không mẫu rất phù hợp để xử lý các lớp chưa từng thấy hoặc không quen thuộc.

Hướng tới tương lai, có khả năng việc kết hợp các phương pháp này để tạo ra các mô hình kết hợp tích hợp thị giác, ngôn ngữ và âm thanh sẽ là một trọng tâm chính. Những tiến bộ này nhằm mục đích làm cho các hệ thống AI linh hoạt hơn, hiệu quả hơn và có khả năng giải quyết các vấn đề phức tạp, mở ra những khả năng mới cho sự đổi mới trong lĩnh vực này.

Tìm hiểu thêm về AI bằng cách tham gia cộng đồng của chúng tôi và xem kho lưu trữ GitHub của chúng tôi. Tìm hiểu cách AI trong xe tự láithị giác máy tính trong nông nghiệp đang định hình lại tương lai. Xem các tùy chọn giấy phép YOLO có sẵn để bắt đầu!

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard