Tìm hiểu cách học chủ động (active learning) được sử dụng trong thị giác máy tính để giảm thiểu nỗ lực gán nhãn và khám phá các ứng dụng thực tế của nó trong nhiều ngành công nghiệp khác nhau.

Tìm hiểu cách học chủ động (active learning) được sử dụng trong thị giác máy tính để giảm thiểu nỗ lực gán nhãn và khám phá các ứng dụng thực tế của nó trong nhiều ngành công nghiệp khác nhau.
Huấn luyện một mô hình computer vision giống như dạy một đứa trẻ nhận biết màu sắc. Đầu tiên, bạn cần một bộ sưu tập các vật thể có màu. Sau đó, bạn sẽ hướng dẫn đứa trẻ xác định chính xác từng màu, một công việc thường tốn thời gian và lặp đi lặp lại.
Giống như một đứa trẻ cần nhiều ví dụ để học hỏi, một mô hình thị giác cần một tập dữ liệu được gắn nhãn lớn để nhận ra các mẫu và đối tượng trong hình ảnh. Tuy nhiên, việc gắn nhãn một lượng lớn dữ liệu tốn rất nhiều thời gian và công sức, chưa kể đến nguồn lực. Các kỹ thuật như active learning có thể giúp đơn giản hóa quy trình này.
Học chủ động (Active learning) là một quy trình từng bước, trong đó dữ liệu quan trọng nhất từ một tập dữ liệu lớn được chọn và gắn nhãn. Mô hình học hỏi từ dữ liệu đã gắn nhãn này, làm cho nó chính xác và hiệu quả hơn. Chỉ tập trung vào dữ liệu có giá trị nhất giúp giảm số lượng nhãn cần thiết và tăng tốc độ phát triển của mô hình.
Trong bài viết này, chúng ta sẽ xem xét cách học chủ động giúp ích cho việc huấn luyện mô hình, giảm chi phí gắn nhãn và cải thiện độ chính xác tổng thể của mô hình.
Các tập dữ liệu là nền tảng cho thị giác máy tính và các mô hình học sâu. Các tập dữ liệu phổ biến như ImageNet cung cấp hàng triệu hình ảnh với các danh mục đối tượng đa dạng. Tuy nhiên, việc tạo và duy trì khối lượng lớn các tập dữ liệu chất lượng cao như vậy đi kèm với nhiều thách thức.
Ví dụ: Việc thu thập và dán nhãn dữ liệu tốn thời gian, tài nguyên và người chú thích lành nghề, khiến quá trình này trở nên khó khăn tùy thuộc vào ứng dụng cụ thể. Cần có các giải pháp sáng tạo và hiệu quả hơn để theo kịp nhu cầu ngày càng tăng đối với tập dữ liệu hình ảnh, và đó chính xác là những gì mà học chủ động hướng đến để giải quyết.
Học chủ động cung cấp một giải pháp hoàn hảo bằng cách tối ưu hóa quy trình gán nhãn dữ liệu. Bằng cách lựa chọn một cách chiến lược các điểm dữ liệu mang tính thông tin nhất để chú thích, học chủ động tối đa hóa hiệu suất mô hình đồng thời giảm thiểu nỗ lực gán nhãn.
Học chủ động là một kỹ thuật học máy lặp đi lặp lại, trong đó mô hình chọn ra các điểm dữ liệu quan trọng nhất để gán nhãn từ một nhóm lớn dữ liệu chưa được gán nhãn. Các điểm dữ liệu được chọn này được gán nhãn thủ công và thêm vào bộ dữ liệu huấn luyện.
Sau đó, mô hình được huấn luyện lại trên bộ dữ liệu đã cập nhật và chọn tập hợp điểm dữ liệu tiếp theo để gán nhãn. Quá trình này lặp lại, với việc mô hình liên tục cải thiện bằng cách tập trung vào các điểm dữ liệu giàu thông tin nhất. Chu kỳ tiếp tục cho đến khi mô hình đạt được độ chính xác mong muốn hoặc đáp ứng các tiêu chí gán nhãn được thiết lập trước.
Bạn có thể tự hỏi làm thế nào kỹ thuật học chủ động quyết định điểm dữ liệu nào cần được gắn nhãn thủ công và điểm nào cần được gắn nhãn tiếp theo. Hãy cùng tìm hiểu cách học chủ động hoạt động bằng cách so sánh nó với việc học cho một bài kiểm tra - bạn tập trung vào các chủ đề mà bạn không chắc chắn và cũng đảm bảo bao quát nhiều môn học khác nhau để chuẩn bị tốt.
Đối với bộ quy trình lựa chọn dữ liệu ban đầu, active learning sử dụng các chiến lược như lấy mẫu không chắc chắn và lấy mẫu dựa trên sự đa dạng. Lấy mẫu không chắc chắn ưu tiên các điểm dữ liệu mà mô hình ít tự tin nhất trong các dự đoán của nó, nhằm mục đích cải thiện độ chính xác trong các trường hợp khó khăn. Lấy mẫu dựa trên sự đa dạng chọn các điểm dữ liệu bao gồm một loạt các đặc điểm, đảm bảo mô hình khái quát hóa tốt cho dữ liệu chưa thấy bằng cách hiển thị nó với các ví dụ đa dạng.
Sau khi chọn dữ liệu ban đầu, active learning sử dụng hai phương pháp chính để gán nhãn: lấy mẫu dựa trên nhóm (pool-based sampling) và lấy mẫu dựa trên luồng (stream-based sampling), tương tự như cách giáo viên giúp học sinh tập trung vào những gì quan trọng nhất.
Trong lấy mẫu dựa trên nhóm (pool-based sampling), mô hình quét một nhóm lớn dữ liệu chưa được gắn nhãn và chọn các ví dụ khó khăn hoặc giàu thông tin nhất để gắn nhãn, giống như một học sinh ưu tiên các thẻ ghi nhớ mà họ thấy khó nhất. Đối với lấy mẫu dựa trên luồng (stream-based sampling), mô hình xử lý dữ liệu khi nó đến, quyết định có gắn nhãn hay bỏ qua nó, tương tự như một học sinh chỉ yêu cầu trợ giúp khi họ gặp khó khăn. Trong cả hai trường hợp, dữ liệu đã được gắn nhãn được thêm vào bộ huấn luyện và mô hình tự huấn luyện lại, liên tục cải thiện sau mỗi lần lặp.
Học chủ động đóng một vai trò quan trọng trong các ứng dụng thị giác máy tính, chẳng hạn như hình ảnh y tế và xe tự hành, bằng cách cải thiện độ chính xác của mô hình và hợp lý hóa quy trình gán nhãn dữ liệu. Một ví dụ thú vị về điều này là các mô hình thị giác máy tính được sử dụng trong xe tự lái để phát hiện người đi bộ hoặc vật thể trong điều kiện ánh sáng yếu hoặc sương mù. Học chủ động có thể nâng cao độ chính xác bằng cách tập trung vào các tình huống lái xe đa dạng và đầy thách thức.
Cụ thể, active learning có thể được sử dụng để xác định dữ liệu hoặc khung hình không chắc chắn từ các tình huống như vậy để gắn nhãn có chọn lọc. Việc thêm các ví dụ được gắn nhãn này vào tập huấn luyện giúp mô hình nhận dạng người đi bộ và các vật thể tốt hơn trong môi trường khó khăn, chẳng hạn như trong thời tiết xấu hoặc lái xe ban đêm.
Ví dụ: NVIDIA đã sử dụng học chủ động để cải thiện khả năng phát hiện người đi bộ vào ban đêm trong các mô hình tự lái của mình. Bằng cách lựa chọn một cách chiến lược dữ liệu nhiều thông tin nhất để đào tạo, đặc biệt là trong các tình huống đầy thách thức, hiệu suất của mô hình tăng lên đáng kể.
Một khía cạnh quan trọng khác của học chủ động là tiềm năng giảm chi phí gắn nhãn. Nó thực hiện điều này bằng cách chỉ tập trung vào các điểm dữ liệu quan trọng nhất, thay vì yêu cầu chú thích cho toàn bộ tập dữ liệu. Cách tiếp cận có mục tiêu này giúp tiết kiệm thời gian, công sức và tiền bạc. Bằng cách tập trung vào các mẫu không chắc chắn hoặc đa dạng, học chủ động làm giảm số lượng chú thích cần thiết trong khi vẫn duy trì độ chính xác cao của mô hình.
Trên thực tế, nghiên cứu cho thấy rằng học chủ động có thể cắt giảm chi phí dán nhãn từ 40-60% mà không làm giảm hiệu suất. Điều này đặc biệt hữu ích trong các ngành như chăm sóc sức khỏe và sản xuất, nơi việc dán nhãn dữ liệu tốn kém. Bằng cách đơn giản hóa quy trình chú thích, học chủ động giúp các doanh nghiệp phát triển mô hình nhanh hơn và triển khai chúng hiệu quả hơn trong khi vẫn duy trì độ chính xác.
Dưới đây là một số ưu điểm chính khác mà học chủ động có thể mang lại:
Học máy tự động (AutoML) tập trung vào việc tự động hóa các tác vụ lặp đi lặp lại và tốn thời gian liên quan đến việc xây dựng và triển khai các mô hình học máy. Nó đơn giản hóa quy trình làm việc của học máy bằng cách tự động hóa các tác vụ như lựa chọn mô hình và đánh giá hiệu suất để giảm nhu cầu nỗ lực thủ công.
Khi được tích hợp với active learning, AutoML có thể tăng tốc và tối ưu hóa vòng đời phát triển mô hình. Thành phần active learning sẽ lựa chọn một cách chiến lược các điểm dữ liệu giàu thông tin nhất để gán nhãn, trong khi AutoML tinh chỉnh mô hình bằng cách tự động hóa việc lựa chọn kiến trúc, tham số và điều chỉnh.
Hãy cùng tìm hiểu sự kết hợp của các công nghệ này thông qua một ví dụ.
Giả sử bạn đang cố gắng phát hiện các tình trạng hiếm gặp trong chẩn đoán hình ảnh y tế (một trường hợp sử dụng mà bộ dữ liệu được gắn nhãn bị hạn chế và tốn kém để thu thập). Học chủ động (Active learning) có thể xác định và chọn dữ liệu không chắc chắn, chẳng hạn như những thay đổi nhỏ trong hình ảnh X-quang, mà mô hình không phân loại được. Sau đó, dữ liệu không chắc chắn có thể được ưu tiên để chú thích thủ công nhằm cải thiện khả năng hiểu của mô hình.
Với dữ liệu đã được gán nhãn, AutoML có thể tối ưu hóa mô hình bằng cách khám phá các kiến trúc, siêu tham số và các kỹ thuật tăng cường dữ liệu khác nhau. Quá trình lặp đi lặp lại này giúp tăng tốc độ phát triển của các mô hình thị giác đáng tin cậy như Ultralytics YOLO11, giúp các chuyên gia chăm sóc sức khỏe đưa ra chẩn đoán chính xác.
Học chủ động và các kỹ thuật của nó mang lại nhiều lợi thế, nhưng có một vài điều cần lưu ý khi triển khai các chiến lược này:
Với những tiến bộ gần đây trong AI và thị giác máy tính, active learning (học chủ động) được thiết lập để giải quyết những thách thức phức tạp hơn và hợp lý hóa quy trình làm việc của machine learning. Kết hợp active learning với các kỹ thuật như federated learning (học liên kết) và self-supervised learning (học tự giám sát) có thể nâng cao hơn nữa hiệu quả và khả năng mở rộng của các mô hình thị giác.
Học liên kết cho phép một mô hình được huấn luyện trên nhiều thiết bị hoặc máy chủ với một framework phân tán mà không yêu cầu dữ liệu rời khỏi vị trí ban đầu của nó. Hãy xem xét các ngành như chăm sóc sức khỏe, nơi quyền riêng tư dữ liệu rất quan trọng, học liên kết giúp có thể huấn luyện trực tiếp trên dữ liệu cục bộ nhạy cảm trong khi vẫn giữ an toàn cho nó. Thay vì chia sẻ dữ liệu thô, chỉ các bản cập nhật hoặc thông tin chi tiết của mô hình được chia sẻ, đảm bảo rằng thông tin cá nhân vẫn được bảo vệ trong khi vẫn đóng góp vào quá trình huấn luyện.
Trong khi đó, học tự giám sát giúp giảm nhu cầu về dữ liệu được gắn nhãn bằng cách huấn luyện trước các mô hình trên dữ liệu chưa được gắn nhãn. Quá trình này tạo ra một nền tảng vững chắc cho mô hình. Sau đó, học chủ động có thể xây dựng dựa trên điều này bằng cách xác định và chọn các điểm dữ liệu quan trọng nhất để con người chú thích, tinh chỉnh thêm mô hình.
Học chủ động cung cấp một cách thiết thực để giải quyết những thách thức lớn trong thị giác máy tính, như chi phí cao của việc chú thích dữ liệu và nhu cầu về các mô hình chính xác hơn. Bằng cách tập trung vào việc gán nhãn chỉ các điểm dữ liệu có giá trị nhất, nó làm giảm nỗ lực cần thiết từ con người đồng thời tăng cường hiệu suất của mô hình.
Khi kết hợp với các công nghệ như AutoML, active learning hợp lý hóa quá trình phát triển mô hình bằng cách tự động hóa các tác vụ tốn thời gian. Khi những tiến bộ tiếp tục, active learning được thiết lập để trở thành một công cụ thiết yếu để xây dựng các hệ thống thị giác máy tính thông minh hơn và hiệu quả hơn.
Khám phá kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi để tìm hiểu thêm về AI và các mô hình thị giác máy tính. Khám phá thêm các ứng dụng của thị giác máy tính trong sản xuất và chăm sóc sức khỏe trên các trang giải pháp của chúng tôi. Bạn cũng có thể xem các tùy chọn cấp phép của chúng tôi để bắt đầu hành trình Vision AI của bạn ngay hôm nay.