Hướng dẫn học Few-Shot, Zero-Shot & Transfer

Các hệ thống trí tuệ nhân tạo (AI) có thể xử lý các tác vụ phức tạp như nhận dạng khuôn mặt, phân loại hình ảnh và lái xe với sự can thiệp tối thiểu của con người. Chúng thực hiện điều này bằng cách nghiên cứu dữ liệu, nhận dạng các mẫu và sử dụng các mẫu đó để đưa ra dự đoán hoặc quyết định. Khi AI tiến bộ, chúng ta đang chứng kiến những cách thức ngày càng tinh vi hơn trong đó các mô hình AI có thể học hỏi, thích ứng và thực hiện các tác vụ với hiệu quả đáng kể.

Ví dụ: thị giác máy tính (computer vision) là một nhánh của AI tập trung vào việc cho phép máy móc diễn giải và hiểu thông tin trực quan từ thế giới. Việc phát triển mô hình thị giác máy tính truyền thống phụ thuộc nhiều vào tập dữ liệu (datasets) lớn, được gán nhãn để huấn luyện. Việc thu thập và dán nhãn dữ liệu như vậy có thể tốn nhiều thời gian và chi phí.

Để giải quyết những thách thức này, các nhà nghiên cứu đã giới thiệu các phương pháp tiếp cận sáng tạo như học ít mẫu (FSL), học từ các ví dụ hạn chế; học không mẫu (ZSL), xác định các đối tượng chưa từng thấy; và học chuyển giao (TL), áp dụng kiến thức từ các mô hình được đào tạo trước cho các tác vụ mới.

Trong bài viết này, chúng ta sẽ khám phá cách các mô hình học tập này hoạt động, làm nổi bật những khác biệt chính của chúng và xem xét các ứng dụng thực tế. Hãy cùng bắt đầu!

Tổng quan về các mô hình học máy

Hãy cùng khám phá học ít mẫu (few-shot learning), học không mẫu (zero-shot learning) và học chuyển giao (transfer learning) là gì đối với thị giác máy tính và cách chúng hoạt động.

Học Ít Mẫu (Few-shot learning)

Học ít mẫu là một phương pháp mà các hệ thống học cách nhận dạng các đối tượng mới chỉ bằng một số ít ví dụ. Ví dụ: nếu bạn cho mô hình xem một vài bức ảnh về chim cánh cụt, bồ nông và chim puffin (nhóm nhỏ này được gọi là "tập hợp hỗ trợ"), nó sẽ học hình dáng của những loài chim này.

Sau đó, nếu bạn cho mô hình xem một bức ảnh mới, chẳng hạn như chim cánh cụt, nó sẽ so sánh bức ảnh mới này với những bức ảnh trong tập hợp hỗ trợ của nó và chọn kết quả phù hợp nhất. Khi việc thu thập một lượng lớn dữ liệu trở nên khó khăn, phương pháp này rất hữu ích vì hệ thống vẫn có thể học hỏi và thích ứng chỉ với một vài ví dụ.

__wf_reserved_inherit — Hình 1. Tổng quan về cách thức hoạt động của few-shot learning.

‍

Học không cần dữ liệu (Zero-shot learning)

Học không cần dữ liệu (Zero-shot learning) là một phương pháp để máy móc nhận dạng những thứ chúng chưa từng thấy trước đây mà không cần các ví dụ về chúng. Nó sử dụng thông tin ngữ nghĩa, như mô tả, để giúp tạo ra các kết nối.

Ví dụ: nếu một máy đã học về các loài động vật như mèo, sư tử và ngựa bằng cách hiểu các đặc điểm như “nhỏ và mềm mại”, “mèo hoang lớn” hoặc “mặt dài”, nó có thể sử dụng kiến thức này để xác định một loài động vật mới, như hổ. Ngay cả khi nó chưa từng nhìn thấy hổ trước đây, nó có thể sử dụng một mô tả như “một con vật giống sư tử với những vằn đen” để xác định chính xác. Điều này giúp máy móc dễ dàng học hỏi và thích ứng hơn mà không cần nhiều ví dụ.

‍

Học chuyển giao

Học chuyển giao (Transfer learning) là một mô hình học tập trong đó một mô hình sử dụng những gì nó đã học được từ một tác vụ để giúp giải quyết một tác vụ mới, tương tự. Kỹ thuật này đặc biệt hữu ích khi nói đến các tác vụ thị giác máy tính như phát hiện đối tượng, phân loại hình ảnh và nhận dạng mẫu.

Ví dụ: Trong thị giác máy tính, một mô hình được đào tạo trước có thể nhận ra các đối tượng chung, như động vật, và sau đó được tinh chỉnh thông qua học chuyển giao để xác định các đối tượng cụ thể, chẳng hạn như các giống chó khác nhau. Bằng cách tái sử dụng kiến thức từ các tác vụ trước đó, học chuyển giao giúp dễ dàng đào tạo các mô hình thị giác máy tính trên các tập dữ liệu nhỏ hơn, tiết kiệm thời gian và công sức.

‍

Bạn có thể đang thắc mắc loại mô hình nào hỗ trợ học chuyển giao. Ultralytics YOLO11 là một ví dụ tuyệt vời về mô hình thị giác máy tính có thể làm được điều này. Đây là một mô hình phát hiện đối tượng tiên tiến được đào tạo trước trên một tập dữ liệu chung lớn. Sau đó, nó có thể được tinh chỉnh và đào tạo tùy chỉnh trên một tập dữ liệu nhỏ hơn, chuyên biệt cho các tác vụ cụ thể.

So sánh các mô hình học

Sau khi nói về học ít mẫu, học không mẫu và học chuyển giao, hãy so sánh chúng để xem chúng khác nhau như thế nào.

‍

Học ít mẫu (Few-shot learning) rất hữu ích khi bạn chỉ có một lượng nhỏ dữ liệu được gắn nhãn. Nó giúp cho một mô hình AI có thể học hỏi chỉ từ một vài ví dụ. Mặt khác, học không mẫu (Zero-shot learning) không yêu cầu bất kỳ dữ liệu được gắn nhãn nào. Thay vào đó, nó sử dụng các mô tả hoặc ngữ cảnh để giúp hệ thống xử lý các tác vụ mới. Trong khi đó, học chuyển giao (Transfer learning) sử dụng một phương pháp khác bằng cách sử dụng kiến thức từ các mô hình được huấn luyện trước, cho phép chúng nhanh chóng thích ứng với các tác vụ mới với dữ liệu bổ sung tối thiểu. Mỗi phương pháp có những điểm mạnh riêng tùy thuộc vào loại dữ liệu và tác vụ bạn đang thực hiện.

Các ứng dụng thực tế của các mô hình học tập khác nhau

Những mô hình học tập này đang tạo ra sự khác biệt trong nhiều lĩnh vực, giải quyết các vấn đề phức tạp bằng các giải pháp sáng tạo. Hãy xem xét kỹ hơn cách chúng có thể được áp dụng trong thế giới thực.

Chẩn đoán các bệnh hiếm gặp bằng phương pháp học ít mẫu

Học ít mẫu (Few-shot learning) là một yếu tố thay đổi cuộc chơi cho lĩnh vực chăm sóc sức khỏe, đặc biệt là trong chẩn đoán hình ảnh y tế. Nó có thể giúp các bác sĩ chẩn đoán các bệnh hiếm gặp chỉ bằng một vài ví dụ hoặc thậm chí mô tả, mà không cần lượng lớn dữ liệu. Điều này đặc biệt hữu ích khi dữ liệu bị hạn chế, điều thường xảy ra vì việc thu thập các tập dữ liệu lớn cho các tình trạng hiếm gặp có thể là một thách thức.

Ví dụ: SHEPHERD sử dụng few-shot learning (học với ít dữ liệu) và đồ thị tri thức y sinh để chẩn đoán các rối loạn di truyền hiếm gặp. Nó ánh xạ thông tin bệnh nhân, chẳng hạn như các triệu chứng và kết quả xét nghiệm, lên một mạng lưới các gen và bệnh đã biết. Điều này giúp xác định nguyên nhân di truyền có khả năng và tìm các trường hợp tương tự, ngay cả khi dữ liệu bị hạn chế.

‍

Cải thiện phát hiện bệnh trên thực vật bằng zero-shot learning

Trong nông nghiệp, việc xác định nhanh chóng các bệnh thực vật là rất cần thiết vì sự chậm trễ trong việc phát hiện có thể dẫn đến thiệt hại cây trồng lan rộng, giảm năng suất và tổn thất tài chính đáng kể. Các phương pháp truyền thống thường dựa vào các bộ dữ liệu lớn và kiến thức chuyên môn, có thể không phải lúc nào cũng có thể truy cập được, đặc biệt là ở các khu vực vùng sâu vùng xa hoặc hạn chế về nguồn lực. Đây là nơi những tiến bộ trong AI, như học không cần mẫu (zero-shot learning), phát huy tác dụng.

Giả sử một nông dân đang trồng cà chua và khoai tây và nhận thấy các triệu chứng như lá vàng hoặc đốm nâu. Học không cần bắn có thể giúp xác định các bệnh như bệnh mốc sương mà không cần bộ dữ liệu lớn. Bằng cách sử dụng mô tả về các triệu chứng, mô hình có thể classify những căn bệnh mà nó chưa từng thấy trước đây. Cách tiếp cận này nhanh chóng, có thể mở rộng và cho phép nông dân detect nhiều vấn đề khác nhau của cây trồng. Nó giúp họ theo dõi sức khỏe cây trồng hiệu quả hơn, hành động kịp thời và giảm thiểu tổn thất.

‍

Xe tự hành và học chuyển giao

Xe tự hành thường cần thích ứng với các môi trường khác nhau để di chuyển an toàn. Học chuyển giao (Transfer learning) giúp chúng sử dụng kiến thức trước đó để nhanh chóng điều chỉnh theo các điều kiện mới mà không cần bắt đầu quá trình huấn luyện lại từ đầu. Kết hợp với thị giác máy tính (computer vision), giúp xe diễn giải thông tin trực quan, các công nghệ này cho phép điều hướng mượt mà hơn trên các địa hình và điều kiện thời tiết khác nhau, làm cho việc lái xe tự động hiệu quả và đáng tin cậy hơn.

Một ví dụ điển hình về điều này trong thực tế là hệ thống quản lý bãi đậu xe sử dụng Ultralytics YOLO11 để theo dõi chỗ đậu xe. YOLO11 , một mô hình phát hiện đối tượng được đào tạo trước, có thể được tinh chỉnh bằng phương pháp học chuyển giao để xác định các điểm đỗ xe trống và có người đỗ theo thời gian thực. Bằng cách đào tạo mô hình trên một tập dữ liệu nhỏ hơn gồm các hình ảnh bãi đỗ xe, nó học cách nhận diện chính xác detect không gian mở, chỗ trống và thậm chí cả khu vực dành riêng.

‍

Được tích hợp với các công nghệ khác, hệ thống này có thể hướng dẫn tài xế đến điểm đỗ xe gần nhất, giúp giảm thời gian tìm kiếm và ùn tắc giao thông. Học chuyển giao giúp điều này trở nên khả thi bằng cách xây dựng dựa trên YOLO11 Khả năng phát hiện vật thể hiện có của hệ thống, cho phép thích ứng với các nhu cầu cụ thể của quản lý bãi đậu xe mà không cần phải bắt đầu lại từ đầu. Phương pháp này tiết kiệm thời gian và nguồn lực, đồng thời tạo ra một giải pháp hiệu quả cao và có khả năng mở rộng, giúp cải thiện hoạt động đỗ xe và nâng cao trải nghiệm người dùng tổng thể.

Xu hướng mới nổi trong các mô hình học tập

Tương lai của các mô hình học tập trong thị giác máy tính đang nghiêng về việc phát triển các hệ thống Vision AI thông minh và bền vững hơn. Đặc biệt, một xu hướng ngày càng tăng là sử dụng các phương pháp tiếp cận kết hợp kết hợp few-shot learning (học với ít dữ liệu), zero-shot learning (học không cần dữ liệu) và transfer learning (học chuyển giao). Bằng cách kết hợp các điểm mạnh của các phương pháp này, các mô hình có thể học các tác vụ mới với dữ liệu tối thiểu và áp dụng kiến thức của chúng trên các lĩnh vực khác nhau.

Một ví dụ thú vị là sử dụng nhúng sâu được điều chỉnh để tinh chỉnh các mô hình bằng cách sử dụng kiến thức từ các tác vụ trước đó và một lượng nhỏ dữ liệu mới, giúp bạn dễ dàng làm việc với các tập dữ liệu hạn chế.

Tương tự, học X-shot được thiết kế để xử lý các tác vụ với lượng dữ liệu khác nhau. Nó sử dụng giám sát yếu, trong đó các mô hình học hỏi từ các nhãn giới hạn hoặc nhiễu, và các hướng dẫn rõ ràng để giúp chúng nhanh chóng thích ứng, ngay cả với ít hoặc không có ví dụ trước đó. Các phương pháp kết hợp này cho thấy cách tích hợp các phương pháp học tập khác nhau có thể giúp hệ thống AI giải quyết các thách thức hiệu quả hơn.

Những điều cần nhớ

Học ít mẫu (Few-shot learning), học không mẫu (zero-shot learning) và học chuyển giao (transfer learning) mỗi loại giải quyết các thách thức cụ thể trong thị giác máy tính, làm cho chúng phù hợp với các tác vụ khác nhau. Phương pháp phù hợp phụ thuộc vào ứng dụng cụ thể và lượng dữ liệu có sẵn. Ví dụ: học ít mẫu hoạt động tốt với dữ liệu hạn chế, trong khi học không mẫu rất phù hợp để xử lý các lớp chưa từng thấy hoặc không quen thuộc.

Hướng tới tương lai, có khả năng việc kết hợp các phương pháp này để tạo ra các mô hình kết hợp tích hợp thị giác, ngôn ngữ và âm thanh sẽ là một trọng tâm chính. Những tiến bộ này nhằm mục đích làm cho các hệ thống AI linh hoạt hơn, hiệu quả hơn và có khả năng giải quyết các vấn đề phức tạp, mở ra những khả năng mới cho sự đổi mới trong lĩnh vực này.

Khám phá thêm về AI bằng cách tham gia cộng đồng của chúng tôi và xem kho lưu trữ GitHub . Tìm hiểu cách AI trong xe tự lái và thị giác máy tính trong nông nghiệp đang định hình lại tương lai. Hãy xem các tùy chọn giấy phép YOLO hiện có để bắt đầu!

Tìm hiểu về few-shot learning, zero-shot learning và transfer learning

Tổng quan về các mô hình học máy

Học Ít Mẫu (Few-shot learning)

Học không cần dữ liệu (Zero-shot learning)

Học chuyển giao

So sánh các mô hình học

Các ứng dụng thực tế của các mô hình học tập khác nhau

Chẩn đoán các bệnh hiếm gặp bằng phương pháp học ít mẫu

Cải thiện phát hiện bệnh trên thực vật bằng zero-shot learning

Xe tự hành và học chuyển giao

Xu hướng mới nổi trong các mô hình học tập

Những điều cần nhớ

Đọc thêm trong danh mục này

Ước lượng độ sâu đơn ảnh là gì? Tổng quan

Xử lý ảnh là gì? Giới thiệu ngắn gọn

Đối sánh mẫu là gì? Hướng dẫn nhanh

Hãy cùng nhau xây dựng tương lai
của AI!

Tìm hiểu về few-shot learning, zero-shot learning và transfer learning

Tổng quan về các mô hình học máy

Học Ít Mẫu (Few-shot learning)

Học không cần dữ liệu (Zero-shot learning)

Học chuyển giao

So sánh các mô hình học

Các ứng dụng thực tế của các mô hình học tập khác nhau

Chẩn đoán các bệnh hiếm gặp bằng phương pháp học ít mẫu

Cải thiện phát hiện bệnh trên thực vật bằng zero-shot learning

Xe tự hành và học chuyển giao

Xu hướng mới nổi trong các mô hình học tập

Những điều cần nhớ

Đọc thêm trong danh mục này

Ước lượng độ sâu đơn ảnh là gì? Tổng quan

Xử lý ảnh là gì? Giới thiệu ngắn gọn

Đối sánh mẫu là gì? Hướng dẫn nhanh

Hãy cùng nhau xây dựng tương lai của AI!

Hãy cùng nhau xây dựng tương lai
của AI!