Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Học chủ động tăng tốc phát triển thị giác máy tính

Abirami Vina

3 phút đọc

Ngày 23 tháng 1, 2025

Tìm hiểu cách học chủ động (active learning) được sử dụng trong thị giác máy tính để giảm thiểu nỗ lực gán nhãn và khám phá các ứng dụng thực tế của nó trong nhiều ngành công nghiệp khác nhau.

Huấn luyện một mô hình computer vision giống như dạy một đứa trẻ nhận biết màu sắc. Đầu tiên, bạn cần một bộ sưu tập các vật thể có màu. Sau đó, bạn sẽ hướng dẫn đứa trẻ xác định chính xác từng màu, một công việc thường tốn thời gian và lặp đi lặp lại.

Giống như một đứa trẻ cần nhiều ví dụ để học hỏi, một mô hình thị giác cần một tập dữ liệu được gắn nhãn lớn để nhận ra các mẫu và đối tượng trong hình ảnh. Tuy nhiên, việc gắn nhãn một lượng lớn dữ liệu tốn rất nhiều thời gian và công sức, chưa kể đến nguồn lực. Các kỹ thuật như active learning có thể giúp đơn giản hóa quy trình này.

Học chủ động (Active learning) là một quy trình từng bước, trong đó dữ liệu quan trọng nhất từ một tập dữ liệu lớn được chọn và gắn nhãn. Mô hình học hỏi từ dữ liệu đã gắn nhãn này, làm cho nó chính xác và hiệu quả hơn. Chỉ tập trung vào dữ liệu có giá trị nhất giúp giảm số lượng nhãn cần thiết và tăng tốc độ phát triển của mô hình.

Trong bài viết này, chúng ta sẽ xem xét cách học chủ động giúp ích cho việc huấn luyện mô hình, giảm chi phí gắn nhãn và cải thiện độ chính xác tổng thể của mô hình.

Bộ dữ liệu hình ảnh không dễ xây dựng

Các tập dữ liệu là nền tảng cho thị giác máy tính và các mô hình học sâu. Các tập dữ liệu phổ biến như ImageNet cung cấp hàng triệu hình ảnh với các danh mục đối tượng đa dạng. Tuy nhiên, việc tạo và duy trì khối lượng lớn các tập dữ liệu chất lượng cao như vậy đi kèm với nhiều thách thức. 

Ví dụ: Việc thu thập và dán nhãn dữ liệu tốn thời gian, tài nguyên và người chú thích lành nghề, khiến quá trình này trở nên khó khăn tùy thuộc vào ứng dụng cụ thể. Cần có các giải pháp sáng tạo và hiệu quả hơn để theo kịp nhu cầu ngày càng tăng đối với tập dữ liệu hình ảnh, và đó chính xác là những gì mà học chủ động hướng đến để giải quyết. 

Học chủ động cung cấp một giải pháp hoàn hảo bằng cách tối ưu hóa quy trình gán nhãn dữ liệu. Bằng cách lựa chọn một cách chiến lược các điểm dữ liệu mang tính thông tin nhất để chú thích, học chủ động tối đa hóa hiệu suất mô hình đồng thời giảm thiểu nỗ lực gán nhãn. 

Active learning là gì?

Học chủ động là một kỹ thuật học máy lặp đi lặp lại, trong đó mô hình chọn ra các điểm dữ liệu quan trọng nhất để gán nhãn từ một nhóm lớn dữ liệu chưa được gán nhãn. Các điểm dữ liệu được chọn này được gán nhãn thủ công và thêm vào bộ dữ liệu huấn luyện. 

Sau đó, mô hình được huấn luyện lại trên bộ dữ liệu đã cập nhật và chọn tập hợp điểm dữ liệu tiếp theo để gán nhãn. Quá trình này lặp lại, với việc mô hình liên tục cải thiện bằng cách tập trung vào các điểm dữ liệu giàu thông tin nhất. Chu kỳ tiếp tục cho đến khi mô hình đạt được độ chính xác mong muốn hoặc đáp ứng các tiêu chí gán nhãn được thiết lập trước.

__wf_reserved_inherit
Hình 1. Tổng quan về active learning.

Tìm hiểu cách active learning hoạt động

Bạn có thể tự hỏi làm thế nào kỹ thuật học chủ động quyết định điểm dữ liệu nào cần được gắn nhãn thủ công và điểm nào cần được gắn nhãn tiếp theo. Hãy cùng tìm hiểu cách học chủ động hoạt động bằng cách so sánh nó với việc học cho một bài kiểm tra - bạn tập trung vào các chủ đề mà bạn không chắc chắn và cũng đảm bảo bao quát nhiều môn học khác nhau để chuẩn bị tốt.

Đối với bộ quy trình lựa chọn dữ liệu ban đầu, active learning sử dụng các chiến lược như lấy mẫu không chắc chắn và lấy mẫu dựa trên sự đa dạng. Lấy mẫu không chắc chắn ưu tiên các điểm dữ liệu mà mô hình ít tự tin nhất trong các dự đoán của nó, nhằm mục đích cải thiện độ chính xác trong các trường hợp khó khăn. Lấy mẫu dựa trên sự đa dạng chọn các điểm dữ liệu bao gồm một loạt các đặc điểm, đảm bảo mô hình khái quát hóa tốt cho dữ liệu chưa thấy bằng cách hiển thị nó với các ví dụ đa dạng.

__wf_reserved_inherit
Hình 2. Lấy mẫu không chắc chắn (bên trái) và lấy mẫu dựa trên sự đa dạng (bên phải).

Sau khi chọn dữ liệu ban đầu, active learning sử dụng hai phương pháp chính để gán nhãn: lấy mẫu dựa trên nhóm (pool-based sampling) và lấy mẫu dựa trên luồng (stream-based sampling), tương tự như cách giáo viên giúp học sinh tập trung vào những gì quan trọng nhất. 

Trong lấy mẫu dựa trên nhóm (pool-based sampling), mô hình quét một nhóm lớn dữ liệu chưa được gắn nhãn và chọn các ví dụ khó khăn hoặc giàu thông tin nhất để gắn nhãn, giống như một học sinh ưu tiên các thẻ ghi nhớ mà họ thấy khó nhất. Đối với lấy mẫu dựa trên luồng (stream-based sampling), mô hình xử lý dữ liệu khi nó đến, quyết định có gắn nhãn hay bỏ qua nó, tương tự như một học sinh chỉ yêu cầu trợ giúp khi họ gặp khó khăn. Trong cả hai trường hợp, dữ liệu đã được gắn nhãn được thêm vào bộ huấn luyện và mô hình tự huấn luyện lại, liên tục cải thiện sau mỗi lần lặp.

Khám phá các ứng dụng của active learning

Học chủ động đóng một vai trò quan trọng trong các ứng dụng thị giác máy tính, chẳng hạn như hình ảnh y tế và xe tự hành, bằng cách cải thiện độ chính xác của mô hình và hợp lý hóa quy trình gán nhãn dữ liệu. Một ví dụ thú vị về điều này là các mô hình thị giác máy tính được sử dụng trong xe tự lái để phát hiện người đi bộ hoặc vật thể trong điều kiện ánh sáng yếu hoặc sương mù. Học chủ động có thể nâng cao độ chính xác bằng cách tập trung vào các tình huống lái xe đa dạng và đầy thách thức. 

Cụ thể, active learning có thể được sử dụng để xác định dữ liệu hoặc khung hình không chắc chắn từ các tình huống như vậy để gắn nhãn có chọn lọc. Việc thêm các ví dụ được gắn nhãn này vào tập huấn luyện giúp mô hình nhận dạng người đi bộ và các vật thể tốt hơn trong môi trường khó khăn, chẳng hạn như trong thời tiết xấu hoặc lái xe ban đêm.

Ví dụ: NVIDIA đã sử dụng học chủ động để cải thiện khả năng phát hiện người đi bộ vào ban đêm trong các mô hình tự lái của mình. Bằng cách lựa chọn một cách chiến lược dữ liệu nhiều thông tin nhất để đào tạo, đặc biệt là trong các tình huống đầy thách thức, hiệu suất của mô hình tăng lên đáng kể.

__wf_reserved_inherit
Hình 3. Phát hiện người đi bộ có ô bằng cách sử dụng active learning.

Học chủ động có thể giảm chi phí gán nhãn

Một khía cạnh quan trọng khác của học chủ động là tiềm năng giảm chi phí gắn nhãn. Nó thực hiện điều này bằng cách chỉ tập trung vào các điểm dữ liệu quan trọng nhất, thay vì yêu cầu chú thích cho toàn bộ tập dữ liệu. Cách tiếp cận có mục tiêu này giúp tiết kiệm thời gian, công sức và tiền bạc. Bằng cách tập trung vào các mẫu không chắc chắn hoặc đa dạng, học chủ động làm giảm số lượng chú thích cần thiết trong khi vẫn duy trì độ chính xác cao của mô hình.

Trên thực tế, nghiên cứu cho thấy rằng học chủ động có thể cắt giảm chi phí dán nhãn từ 40-60% mà không làm giảm hiệu suất. Điều này đặc biệt hữu ích trong các ngành như chăm sóc sức khỏe và sản xuất, nơi việc dán nhãn dữ liệu tốn kém. Bằng cách đơn giản hóa quy trình chú thích, học chủ động giúp các doanh nghiệp phát triển mô hình nhanh hơn và triển khai chúng hiệu quả hơn trong khi vẫn duy trì độ chính xác.

Lợi ích của active learning

Dưới đây là một số ưu điểm chính khác mà học chủ động có thể mang lại:

  • Giải quyết sự mất cân bằng lớp (Address class imbalance): Học chủ động có thể giúp giải quyết các vấn đề mất cân bằng lớp bằng cách gắn nhãn các phiên bản từ các lớp dữ liệu thiểu số. Mô hình có thể hoạt động tốt hơn trên các tình huống hiếm gặp với dữ liệu hạn chế.
  • Chu kỳ phát triển nhanh hơn: Việc gán nhãn ít dữ liệu hơn gián tiếp có nghĩa là đẩy nhanh quá trình phát triển các mô hình máy học và thị giác máy tính, cho phép có thêm thời gian và nguồn lực cho các thử nghiệm và vòng lặp bổ sung.
  • Khả năng thích ứng (Adaptability): Nó có thể liên tục cải thiện dữ liệu huấn luyện bằng cách lặp lại trên các mẫu không chắc chắn hoặc các trường hợp đặc biệt, làm cho nó phù hợp với các bộ dữ liệu động hoặc đang phát triển.

Học chủ động và AutoML có thể phối hợp với nhau

Học máy tự động (AutoML) tập trung vào việc tự động hóa các tác vụ lặp đi lặp lại và tốn thời gian liên quan đến việc xây dựng và triển khai các mô hình học máy. Nó đơn giản hóa quy trình làm việc của học máy bằng cách tự động hóa các tác vụ như lựa chọn mô hình và đánh giá hiệu suất để giảm nhu cầu nỗ lực thủ công. 

Khi được tích hợp với active learning, AutoML có thể tăng tốc và tối ưu hóa vòng đời phát triển mô hình. Thành phần active learning sẽ lựa chọn một cách chiến lược các điểm dữ liệu giàu thông tin nhất để gán nhãn, trong khi AutoML tinh chỉnh mô hình bằng cách tự động hóa việc lựa chọn kiến trúc, tham số và điều chỉnh.

__wf_reserved_inherit
Hình 4. Quy trình AutoML.

Hãy cùng tìm hiểu sự kết hợp của các công nghệ này thông qua một ví dụ. 

Giả sử bạn đang cố gắng phát hiện các tình trạng hiếm gặp trong chẩn đoán hình ảnh y tế (một trường hợp sử dụng mà bộ dữ liệu được gắn nhãn bị hạn chế và tốn kém để thu thập). Học chủ động (Active learning) có thể xác định và chọn dữ liệu không chắc chắn, chẳng hạn như những thay đổi nhỏ trong hình ảnh X-quang, mà mô hình không phân loại được. Sau đó, dữ liệu không chắc chắn có thể được ưu tiên để chú thích thủ công nhằm cải thiện khả năng hiểu của mô hình. 

Với dữ liệu đã được gán nhãn, AutoML có thể tối ưu hóa mô hình bằng cách khám phá các kiến trúc, siêu tham số và các kỹ thuật tăng cường dữ liệu khác nhau. Quá trình lặp đi lặp lại này giúp tăng tốc độ phát triển của các mô hình thị giác đáng tin cậy như Ultralytics YOLO11, giúp các chuyên gia chăm sóc sức khỏe đưa ra chẩn đoán chính xác.

Những thách thức của học chủ động (active learning)

Học chủ động và các kỹ thuật của nó mang lại nhiều lợi thế, nhưng có một vài điều cần lưu ý khi triển khai các chiến lược này:

  • Lựa chọn chiến lược truy vấn: Active learning bao gồm nhiều kỹ thuật và việc chọn phương pháp tốt nhất sẽ ảnh hưởng đáng kể đến hiệu quả của mô hình. Chọn một chiến lược không phù hợp có thể làm giảm hiệu suất của mô hình cho một ứng dụng cụ thể.
  • Chi phí đào tạo lại: Bản chất lặp đi lặp lại của active learning đòi hỏi tài nguyên tính toán tốn kém, đặc biệt đối với các tập dữ liệu lớn. Mô hình được đào tạo lại sau mỗi vòng gắn nhãn, làm tăng độ phức tạp của nó.
  • Chất lượng mô hình ban đầu: Hiệu quả của active learning phụ thuộc vào chất lượng của mô hình ban đầu. Một mô hình ban đầu hoạt động kém có thể không xác định chính xác các điểm dữ liệu thông tin, dẫn đến các yêu cầu gắn nhãn không đạt tiêu chuẩn và giảm hiệu suất tổng thể.

Con đường phía trước cho học chủ động và AutoML

Với những tiến bộ gần đây trong AI và thị giác máy tính, active learning (học chủ động) được thiết lập để giải quyết những thách thức phức tạp hơn và hợp lý hóa quy trình làm việc của machine learning. Kết hợp active learning với các kỹ thuật như federated learning (học liên kết) và self-supervised learning (học tự giám sát) có thể nâng cao hơn nữa hiệu quả và khả năng mở rộng của các mô hình thị giác. 

Học liên kết cho phép một mô hình được huấn luyện trên nhiều thiết bị hoặc máy chủ với một framework phân tán mà không yêu cầu dữ liệu rời khỏi vị trí ban đầu của nó. Hãy xem xét các ngành như chăm sóc sức khỏe, nơi quyền riêng tư dữ liệu rất quan trọng, học liên kết giúp có thể huấn luyện trực tiếp trên dữ liệu cục bộ nhạy cảm trong khi vẫn giữ an toàn cho nó. Thay vì chia sẻ dữ liệu thô, chỉ các bản cập nhật hoặc thông tin chi tiết của mô hình được chia sẻ, đảm bảo rằng thông tin cá nhân vẫn được bảo vệ trong khi vẫn đóng góp vào quá trình huấn luyện.

Trong khi đó, học tự giám sát giúp giảm nhu cầu về dữ liệu được gắn nhãn bằng cách huấn luyện trước các mô hình trên dữ liệu chưa được gắn nhãn. Quá trình này tạo ra một nền tảng vững chắc cho mô hình. Sau đó, học chủ động có thể xây dựng dựa trên điều này bằng cách xác định và chọn các điểm dữ liệu quan trọng nhất để con người chú thích, tinh chỉnh thêm mô hình.

Từ học tập chủ động đến tác động chủ động

Học chủ động cung cấp một cách thiết thực để giải quyết những thách thức lớn trong thị giác máy tính, như chi phí cao của việc chú thích dữ liệu và nhu cầu về các mô hình chính xác hơn. Bằng cách tập trung vào việc gán nhãn chỉ các điểm dữ liệu có giá trị nhất, nó làm giảm nỗ lực cần thiết từ con người đồng thời tăng cường hiệu suất của mô hình.

Khi kết hợp với các công nghệ như AutoML, active learning hợp lý hóa quá trình phát triển mô hình bằng cách tự động hóa các tác vụ tốn thời gian. Khi những tiến bộ tiếp tục, active learning được thiết lập để trở thành một công cụ thiết yếu để xây dựng các hệ thống thị giác máy tính thông minh hơn và hiệu quả hơn.

Khám phá kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi để tìm hiểu thêm về AI và các mô hình thị giác máy tính. Khám phá thêm các ứng dụng của thị giác máy tính trong sản xuấtchăm sóc sức khỏe trên các trang giải pháp của chúng tôi. Bạn cũng có thể xem các tùy chọn cấp phép của chúng tôi để bắt đầu hành trình Vision AI của bạn ngay hôm nay.

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard