Hiểu về học ít mẫu, không mẫu và học chuyển đổi
Khám phá sự khác biệt giữa học ít mẫu (few-shot learning), học không mẫu (zero-shot learning) và học chuyển đổi (transfer learning) trong thị giác máy tính và cách các mô hình này định hình việc huấn luyện mô hình AI.

Các hệ thống trí tuệ nhân tạo (AI) có thể xử lý các tác vụ phức tạp như nhận diện khuôn mặt, phân loại hình ảnh và lái xe với lượng dữ liệu đầu vào tối thiểu từ con người. Chúng thực hiện điều này bằng cách nghiên cứu dữ liệu, nhận diện các mẫu và sử dụng các mẫu đó để đưa ra dự đoán hoặc quyết định. Khi AI phát triển, chúng ta đang chứng kiến những phương thức ngày càng tinh vi hơn, giúp các model AI học hỏi, thích nghi và thực hiện tác vụ với hiệu suất đáng kinh ngạc.
Ví dụ, thị giác máy tính là một nhánh của AI tập trung vào việc cho phép máy móc diễn giải và hiểu thông tin hình ảnh từ thế giới thực. Việc phát triển model thị giác máy tính truyền thống phụ thuộc rất nhiều vào các tập dữ liệu lớn có chú thích để huấn luyện. Việc thu thập và dán nhãn dữ liệu như vậy có thể tốn kém và mất nhiều thời gian.
Để giải quyết những thách thức này, các nhà nghiên cứu đã giới thiệu các phương pháp đổi mới như học ít mẫu (few-shot learning - FSL), giúp học hỏi từ các ví dụ hạn chế; học không mẫu (zero-shot learning - ZSL), giúp nhận diện các đối tượng chưa từng thấy; và học chuyển đổi (transfer learning - TL), giúp áp dụng kiến thức từ các model đã được huấn luyện trước vào các tác vụ mới.
Trong bài viết này, chúng ta sẽ khám phá cách các mô hình học tập này hoạt động, nêu bật những khác biệt chính và xem xét các ứng dụng trong thực tế. Hãy bắt đầu thôi!
Link to this sectionTổng quan về các mô hình học tập#
Hãy cùng khám phá học ít mẫu, học không mẫu và học chuyển đổi là gì trong lĩnh vực thị giác máy tính và cách chúng hoạt động.
Link to this sectionHọc ít mẫu (Few-shot learning)#
Học ít mẫu là phương pháp mà các hệ thống học cách nhận diện đối tượng mới chỉ bằng một số lượng ví dụ nhỏ. Ví dụ, nếu bạn cho model xem một vài bức ảnh về chim cánh cụt, bồ nông và chim hải âu (nhóm nhỏ này được gọi là "tập hỗ trợ" - support set), nó sẽ học được hình dáng của những loài chim này.
Sau đó, nếu bạn đưa cho model một bức ảnh mới, chẳng hạn như chim cánh cụt, nó sẽ so sánh bức ảnh mới này với các bức ảnh trong tập hỗ trợ của mình và chọn kết quả khớp gần nhất. Khi việc thu thập một lượng lớn dữ liệu trở nên khó khăn, phương pháp này rất hữu ích vì hệ thống vẫn có thể học hỏi và thích nghi chỉ với vài ví dụ.

Hình 1. Tổng quan về cách hoạt động của học ít mẫu.
Link to this sectionHọc không mẫu (Zero-shot learning)#
Học không mẫu là cách để máy móc nhận diện những thứ chúng chưa từng thấy trước đây mà không cần các ví dụ về chúng. Phương pháp này sử dụng thông tin ngữ nghĩa, như các mô tả, để giúp thiết lập các kết nối.
Ví dụ, nếu máy đã học về các loài động vật như mèo, sư tử và ngựa bằng cách hiểu các đặc điểm như "nhỏ và có lông", "mèo hoang lớn" hoặc "mặt dài", nó có thể sử dụng kiến thức này để nhận diện một loài động vật mới, chẳng hạn như hổ. Ngay cả khi chưa bao giờ nhìn thấy hổ, nó có thể sử dụng mô tả như "một loài động vật giống sư tử với các sọc tối màu" để nhận diện chính xác. Điều này giúp máy móc học hỏi và thích nghi dễ dàng hơn mà không cần nhiều ví dụ.

Hình 2. Học không mẫu nhận diện các đối tượng mới bằng mô tả.
Link to this sectionHọc chuyển đổi (Transfer learning)#
Học chuyển đổi là một mô hình học tập trong đó model sử dụng những gì đã học từ một tác vụ để giúp giải quyết một tác vụ tương tự, mới hơn. Kỹ thuật này đặc biệt hữu ích đối với các tác vụ thị giác máy tính như phát hiện đối tượng, phân loại hình ảnh và nhận diện mẫu.
Ví dụ, trong thị giác máy tính, một model đã được huấn luyện trước có thể nhận diện các đối tượng chung, như động vật, sau đó được tinh chỉnh (fine-tune) thông qua học chuyển đổi để nhận diện các đối tượng cụ thể, chẳng hạn như các giống chó khác nhau. Bằng cách tái sử dụng kiến thức từ các tác vụ trước đó, học chuyển đổi giúp việc huấn luyện các model thị giác máy tính trên các tập dữ liệu nhỏ hơn trở nên dễ dàng hơn, tiết kiệm thời gian và công sức.

Hình 3. Tổng quan về cách hoạt động của học chuyển đổi.
Bạn có thể tự hỏi loại model nào hỗ trợ học chuyển đổi. Ultralytics YOLO11 là một ví dụ tuyệt vời về model thị giác máy tính có thể làm được điều này. Đây là model phát hiện đối tượng tiên tiến được huấn luyện trước trên một tập dữ liệu lớn, tổng quát. Sau đó, nó có thể được tinh chỉnh và huấn luyện tùy chỉnh trên một tập dữ liệu nhỏ hơn, chuyên biệt cho các tác vụ cụ thể.
Link to this sectionSo sánh các mô hình học tập#
Giờ đây, sau khi đã thảo luận về học ít mẫu, học không mẫu và học chuyển đổi, hãy so sánh chúng để xem chúng khác biệt như thế nào.

Hình 4. Sự khác biệt chính giữa học ít mẫu, học không mẫu và học chuyển đổi. Ảnh của tác giả.
Học ít mẫu rất hữu ích khi bạn chỉ có một lượng nhỏ dữ liệu được dán nhãn. Nó giúp model AI có thể học từ chỉ một vài ví dụ. Mặt khác, học không mẫu không yêu cầu bất kỳ dữ liệu được dán nhãn nào. Thay vào đó, nó sử dụng các mô tả hoặc ngữ cảnh để giúp hệ thống xử lý các tác vụ mới. Trong khi đó, học chuyển đổi áp dụng cách tiếp cận khác bằng cách sử dụng kiến thức từ các model đã được huấn luyện trước, cho phép chúng nhanh chóng thích nghi với các tác vụ mới với lượng dữ liệu bổ sung tối thiểu. Mỗi phương pháp đều có thế mạnh riêng tùy thuộc vào loại dữ liệu và tác vụ mà bạn đang thực hiện.
Link to this sectionCác ứng dụng thực tế của nhiều mô hình học tập khác nhau#
Các mô hình học tập này đang tạo ra sự khác biệt trong nhiều lĩnh vực, giải quyết các vấn đề phức tạp bằng những giải pháp đổi mới. Hãy cùng xem xét kỹ hơn cách chúng có thể được áp dụng trong thế giới thực.
Link to this sectionChẩn đoán các bệnh hiếm gặp với học ít mẫu#
Học ít mẫu là một yếu tố thay đổi cuộc chơi cho lĩnh vực chăm sóc sức khỏe, đặc biệt là trong chẩn đoán hình ảnh y tế. Nó có thể giúp bác sĩ chẩn đoán các bệnh hiếm gặp chỉ bằng một vài ví dụ hoặc thậm chí là mô tả, mà không cần một lượng dữ liệu lớn. Điều này đặc biệt hữu ích khi dữ liệu bị hạn chế, đây thường là trường hợp phổ biến vì việc thu thập các tập dữ liệu lớn cho các tình trạng bệnh hiếm gặp có thể rất khó khăn.
Ví dụ, SHEPHERD sử dụng học ít mẫu và các biểu đồ kiến thức y sinh để chẩn đoán các rối loạn di truyền hiếm gặp. Nó ánh xạ thông tin bệnh nhân, như triệu chứng và kết quả xét nghiệm, vào một mạng lưới các gen và bệnh tật đã biết. Điều này giúp xác định chính xác nguyên nhân di truyền có thể xảy ra và tìm ra các trường hợp tương tự, ngay cả khi dữ liệu bị hạn chế.

Hình 5. Model SHEPHERD chẩn đoán các bệnh hiếm gặp bằng dữ liệu tối thiểu.
Link to this sectionCải thiện khả năng phát hiện bệnh trên cây trồng với học không mẫu#
Trong nông nghiệp, việc xác định nhanh bệnh trên cây trồng là điều cần thiết vì sự chậm trễ trong phát hiện có thể dẫn đến thiệt hại mùa màng trên diện rộng, giảm năng suất và tổn thất tài chính đáng kể. Các phương pháp truyền thống thường dựa vào các tập dữ liệu lớn và kiến thức chuyên gia, vốn có thể không phải lúc nào cũng tiếp cận được, đặc biệt là ở các khu vực xa xôi hoặc hạn chế về tài nguyên. Đây là lúc các tiến bộ trong AI, như học không mẫu, phát huy tác dụng.
Giả sử một nông dân đang trồng cà chua và khoai tây và nhận thấy các triệu chứng như lá vàng hoặc đốm nâu. Học không mẫu có thể giúp xác định các bệnh như bệnh mốc sương (late blight) mà không cần các tập dữ liệu lớn. Bằng cách sử dụng các mô tả về triệu chứng, model có thể phân loại các loại bệnh mà nó chưa từng thấy trước đây. Phương pháp này nhanh chóng, có khả năng mở rộng và cho phép nông dân phát hiện nhiều vấn đề trên cây trồng. Nó giúp họ theo dõi sức khỏe cây trồng hiệu quả hơn, hành động kịp thời và giảm thiểu tổn thất.

Hình 6. Sử dụng học không mẫu để nhận diện bệnh trên cây trồng.
Link to this sectionXe tự hành và học chuyển đổi#
Xe tự hành thường cần thích nghi với các môi trường khác nhau để di chuyển an toàn. Học chuyển đổi giúp chúng sử dụng kiến thức trước đó để nhanh chóng điều chỉnh với các điều kiện mới mà không cần bắt đầu lại quá trình huấn luyện từ đầu. Kết hợp với thị giác máy tính, giúp xe diễn giải thông tin hình ảnh, các công nghệ này cho phép việc di chuyển mượt mà hơn trên các địa hình và điều kiện thời tiết khác nhau, giúp xe tự lái trở nên hiệu quả và đáng tin cậy hơn.
Một ví dụ điển hình về điều này trong thực tế là hệ thống quản lý bãi đỗ xe sử dụng Ultralytics YOLO11 để giám sát các chỗ đỗ xe. YOLO11, một model phát hiện đối tượng đã được huấn luyện trước, có thể được tinh chỉnh bằng cách sử dụng học chuyển đổi để nhận diện các chỗ đỗ xe trống và đã có xe trong thời gian thực. Bằng cách huấn luyện model trên một tập dữ liệu nhỏ hơn về hình ảnh bãi đỗ xe, nó học cách phát hiện chính xác các chỗ trống, chỗ đã kín và thậm chí là các khu vực dành riêng.

Hình 7. Quản lý bãi đỗ xe sử dụng Ultralytics YOLO11.
Được tích hợp với các công nghệ khác, hệ thống này có thể hướng dẫn tài xế đến chỗ trống gần nhất, giúp giảm thời gian tìm kiếm và ùn tắc giao thông. Học chuyển đổi làm cho điều này trở nên khả thi bằng cách xây dựng dựa trên các khả năng phát hiện đối tượng hiện có của YOLO11, cho phép nó thích nghi với các nhu cầu cụ thể của việc quản lý bãi đỗ xe mà không cần phải bắt đầu lại từ đầu. Cách tiếp cận này giúp tiết kiệm thời gian và tài nguyên, đồng thời tạo ra một giải pháp có khả năng mở rộng cao và hiệu quả, giúp cải thiện hoạt động quản lý bãi đỗ xe và nâng cao trải nghiệm người dùng tổng thể.
Link to this sectionCác xu hướng mới nổi trong các mô hình học tập#
Tương lai của các mô hình học tập trong thị giác máy tính đang hướng tới việc phát triển các hệ thống AI thị giác bền vững và thông minh hơn. Đặc biệt, một xu hướng đang phát triển là việc sử dụng các phương pháp tiếp cận lai kết hợp học ít mẫu, học không mẫu và học chuyển đổi. Bằng cách kết hợp thế mạnh của các phương pháp này, các model có thể học các tác vụ mới với dữ liệu tối thiểu và áp dụng kiến thức của mình trên nhiều lĩnh vực khác nhau.
Một ví dụ thú vị là sử dụng các nhúng sâu thích nghi để tinh chỉnh các model bằng cách sử dụng kiến thức từ các tác vụ trước đó và một lượng nhỏ dữ liệu mới, giúp việc làm việc với các tập dữ liệu hạn chế trở nên dễ dàng hơn.
Tương tự, Học X-shot được thiết kế để xử lý các tác vụ với lượng dữ liệu khác nhau. Nó sử dụng cơ chế giám sát yếu (weak supervision), nơi các model học từ các nhãn hạn chế hoặc nhiễu, cùng các hướng dẫn rõ ràng để giúp chúng nhanh chóng thích nghi, ngay cả khi có rất ít hoặc không có ví dụ trước đó. Các phương pháp tiếp cận lai này cho thấy việc tích hợp các phương pháp học tập khác nhau có thể giúp các hệ thống AI giải quyết các thách thức hiệu quả hơn.
Link to this sectionCác điểm chính cần lưu ý#
Học ít mẫu, học không mẫu và học chuyển đổi, mỗi phương pháp đều giải quyết các thách thức cụ thể trong thị giác máy tính, giúp chúng phù hợp với các tác vụ khác nhau. Phương pháp phù hợp phụ thuộc vào ứng dụng cụ thể và lượng dữ liệu khả dụng. Ví dụ, học ít mẫu hoạt động tốt với dữ liệu hạn chế, trong khi học không mẫu rất tuyệt vời để xử lý các lớp đối tượng chưa từng thấy hoặc chưa quen thuộc.
Nhìn về tương lai, có khả năng việc kết hợp các phương pháp này để tạo ra các model lai tích hợp thị giác, ngôn ngữ và âm thanh sẽ là một trọng tâm chính. Những tiến bộ này nhằm mục đích làm cho các hệ thống AI trở nên linh hoạt hơn, hiệu quả hơn và có khả năng giải quyết các vấn đề phức tạp, mở ra những khả năng mới cho sự đổi mới trong lĩnh vực này.
Khám phá thêm về AI bằng cách tham gia cộng đồng của chúng tôi và xem qua kho lưu trữ GitHub của chúng tôi. Tìm hiểu cách AI trong xe tự lái và thị giác máy tính trong nông nghiệp đang định hình lại tương lai. Hãy xem qua các tùy chọn giấy phép YOLO hiện có để bắt đầu!






