Thị giác AI

Học chủ động tăng tốc phát triển thị giác máy tính

Tìm hiểu cách học chủ động (active learning) được sử dụng trong thị giác máy tính để giảm thiểu nỗ lực gán nhãn và khám phá các ứng dụng thực tế của nó trong nhiều ngành công nghiệp.

ABAbirami Vina

3 min readJanuary 23, 2025

Học chủ động tăng tốc phát triển thị giác máy tính

Việc huấn luyện một model thị giác máy tính cũng giống như dạy một đứa trẻ nhận biết màu sắc. Đầu tiên, bạn cần một bộ sưu tập các vật thể có màu sắc. Sau đó, bạn hướng dẫn đứa trẻ xác định chính xác từng màu, một nhiệm vụ thường tốn thời gian và lặp đi lặp lại.

Giống như việc một đứa trẻ cần nhiều ví dụ để học tập, một vision model cần một tập dữ liệu gán nhãn lớn để nhận diện các mẫu hình và vật thể trong hình ảnh. Tuy nhiên, việc gán nhãn lượng lớn dữ liệu tiêu tốn nhiều thời gian, công sức và cả tài nguyên. Các kỹ thuật như active learning có thể giúp đơn giản hóa quy trình này.

Active learning là một quy trình từng bước, trong đó dữ liệu quan trọng nhất từ một tập dữ liệu lớn được chọn lọc và gán nhãn. Model học hỏi từ dữ liệu đã gán nhãn này, giúp nó trở nên chính xác và hiệu quả hơn. Chỉ tập trung vào những dữ liệu giá trị nhất sẽ giúp giảm khối lượng công việc gán nhãn và tăng tốc độ phát triển model.

Trong bài viết này, chúng ta sẽ xem xét cách active learning hỗ trợ huấn luyện model, giảm chi phí gán nhãn và cải thiện độ chính xác tổng thể của model.

Link to this sectionXây dựng các bộ dữ liệu hình ảnh không hề đơn giản#

Các tập dữ liệu là nền tảng cho thị giác máy tính và các model deep-learning. Những tập dữ liệu phổ biến như ImageNet cung cấp hàng triệu hình ảnh với các danh mục vật thể đa dạng. Tuy nhiên, việc tạo và duy trì những bộ dữ liệu chất lượng cao khổng lồ như vậy đi kèm với nhiều thách thức.

Ví dụ, việc thu thập và gán nhãn dữ liệu đòi hỏi thời gian, tài nguyên và các chuyên gia gán nhãn có kỹ năng, khiến quy trình trở nên đầy thách thức tùy thuộc vào ứng dụng cụ thể. Cần có những giải pháp sáng tạo và hiệu quả hơn để theo kịp nhu cầu ngày càng tăng đối với image datasets, và đó chính xác là vấn đề mà active learning hướng tới để giải quyết.

Active learning cung cấp một giải pháp hoàn hảo bằng cách tối ưu hóa quy trình gán nhãn dữ liệu. Bằng cách lựa chọn một cách chiến lược các điểm dữ liệu nhiều thông tin nhất để gán nhãn, active learning giúp tối đa hóa hiệu suất của model trong khi giảm thiểu công sức gán nhãn.

Link to this sectionActive learning là gì?#

Active learning là một kỹ thuật machine learning lặp đi lặp lại, trong đó model chọn ra các điểm dữ liệu quan trọng nhất để gán nhãn từ một tập hợp lớn dữ liệu chưa gán nhãn. Những điểm dữ liệu được chọn này sau đó được gán nhãn thủ công và thêm vào tập dữ liệu huấn luyện.

Model sau đó được huấn luyện lại trên tập dữ liệu đã cập nhật và chọn tập dữ liệu tiếp theo để gán nhãn. Quy trình này lặp lại, với việc model liên tục cải thiện bằng cách tập trung vào những điểm dữ liệu chứa nhiều thông tin nhất. Chu trình tiếp tục cho đến khi model đạt được độ chính xác mong muốn hoặc đáp ứng các tiêu chí gán nhãn đã đặt ra trước đó.

Tổng quan về active learning

Hình 1. Tổng quan về active learning.

Link to this sectionTìm hiểu cách thức hoạt động của active learning#

Bạn có thể tự hỏi kỹ thuật active learning quyết định điểm dữ liệu nào cần gán nhãn thủ công và điểm nào nên được gán nhãn tiếp theo như thế nào. Hãy hiểu cách active learning hoạt động bằng cách so sánh với việc ôn thi - bạn tập trung vào những chủ đề mình chưa chắc chắn và đồng thời đảm bảo bao quát nhiều chủ đề khác nhau để được chuẩn bị kỹ lưỡng.

Đối với các quy trình lựa chọn dữ liệu ban đầu, active learning sử dụng các chiến lược như uncertainty sampling (lấy mẫu không chắc chắn) và diversity-based sampling (lấy mẫu dựa trên tính đa dạng). Uncertainty sampling ưu tiên các điểm dữ liệu mà model ít tự tin nhất vào kết quả dự đoán, nhằm cải thiện độ chính xác trong các trường hợp khó. Diversity-based sampling chọn các điểm dữ liệu bao phủ một phạm vi đặc điểm rộng, đảm bảo model tổng quát hóa tốt trên dữ liệu mới bằng cách tiếp xúc với các ví dụ đa dạng.

Lấy mẫu dựa trên độ không chắc chắn (uncertainty sampling) bên trái và lấy mẫu dựa trên sự đa dạng (diversity-based sampling) bên phải

Hình 2. Uncertainty sampling (bên trái) và diversity-based sampling (bên phải).

Sau khi chọn dữ liệu ban đầu, active learning sử dụng hai phương pháp chính để gán nhãn: pool-based sampling và stream-based sampling. Chúng tương tự như cách một giáo viên giúp học sinh tập trung vào những điều quan trọng nhất.

Trong pool-based sampling, model quét một tập hợp lớn dữ liệu chưa gán nhãn và chọn các ví dụ khó hoặc giàu thông tin nhất để gán nhãn, giống như học sinh ưu tiên các thẻ ghi chú (flashcards) mà họ cảm thấy khó nhất. Đối với stream-based sampling, model xử lý dữ liệu ngay khi nó đến, quyết định gán nhãn hoặc bỏ qua, tương tự như học sinh chỉ yêu cầu giúp đỡ khi gặp khó khăn. Trong cả hai trường hợp, dữ liệu đã gán nhãn được thêm vào tập huấn luyện và model tự huấn luyện lại, cải thiện dần dần sau mỗi lần lặp.

Link to this sectionKhám phá các ứng dụng của active learning#

Active learning đóng vai trò quan trọng trong các ứng dụng thị giác máy tính, chẳng hạn như hình ảnh y tế và xe tự lái, bằng cách cải thiện độ chính xác của model và tinh giản quy trình gán nhãn dữ liệu. Một ví dụ thú vị là các computer vision model được sử dụng trong xe tự lái để phát hiện người đi bộ hoặc vật thể trong điều kiện thiếu sáng hoặc sương mù. Active learning có thể tăng cường độ chính xác bằng cách tập trung vào các kịch bản lái xe đa dạng và đầy thách thức.

Cụ thể, active learning có thể được sử dụng để xác định dữ liệu không chắc chắn hoặc các khung hình từ những kịch bản như vậy để gán nhãn có chọn lọc. Việc thêm các ví dụ đã gán nhãn này vào tập huấn luyện giúp model nhận diện người đi bộ và vật thể tốt hơn trong các môi trường khó khăn, chẳng hạn như thời tiết khắc nghiệt hoặc khi lái xe vào ban đêm.

Ví dụ, NVIDIA đã sử dụng active learning để cải thiện khả năng phát hiện người đi bộ vào ban đêm trong các model xe tự lái của mình. Bằng cách chọn lọc một cách chiến lược dữ liệu giàu thông tin nhất cho việc huấn luyện, đặc biệt là trong các kịch bản khó, hiệu suất của model tăng lên đáng kể.

Phát hiện người đi bộ đang cầm ô sử dụng active learning

Hình 3. Phát hiện người đi bộ cầm ô sử dụng active learning.

Link to this sectionActive learning có thể giảm chi phí gán nhãn#

Một khía cạnh quan trọng khác của active learning là khả năng giảm chi phí gán nhãn. Nó thực hiện điều này bằng cách chỉ tập trung vào các điểm dữ liệu quan trọng nhất, thay vì yêu cầu chú thích cho toàn bộ tập dữ liệu. Cách tiếp cận có mục tiêu này giúp tiết kiệm thời gian, công sức và tiền bạc. Bằng cách tập trung vào các mẫu không chắc chắn hoặc đa dạng, active learning giảm số lượng chú thích cần thiết trong khi vẫn duy trì độ chính xác cao cho model.

Trên thực tế, nghiên cứu cho thấy rằng active learning có thể cắt giảm chi phí gán nhãn từ 40-60% mà không làm giảm hiệu suất. Điều này đặc biệt hữu ích trong các ngành công nghiệp như chăm sóc sức khỏe và sản xuất, nơi việc gán nhãn dữ liệu rất tốn kém. Bằng cách đơn giản hóa quy trình chú thích, active learning giúp các doanh nghiệp phát triển model nhanh hơn và triển khai chúng hiệu quả hơn trong khi vẫn duy trì độ chính xác.

Link to this sectionLợi ích của active learning#

Dưới đây là một số ưu điểm quan trọng khác mà active learning có thể mang lại:

Giải quyết vấn đề mất cân bằng lớp (class imbalance): Active learning có thể giúp giải quyết các vấn đề mất cân bằng lớp bằng cách gán nhãn cho các trường hợp từ các lớp dữ liệu thiểu số. Model có thể hoạt động tốt hơn trong các kịch bản hiếm gặp với dữ liệu hạn chế.
Chu kỳ phát triển nhanh hơn: Việc gán nhãn ít dữ liệu hơn gián tiếp đồng nghĩa với việc tăng tốc quy trình phát triển các model machine learning và thị giác máy tính, cho phép dành nhiều thời gian và tài nguyên hơn cho các vòng lặp và thử nghiệm bổ sung.
Khả năng thích ứng: Nó có thể liên tục cải thiện dữ liệu huấn luyện bằng cách lặp lại trên các mẫu không chắc chắn hoặc các mẫu biên, làm cho nó rất phù hợp với các tập dữ liệu động hoặc đang phát triển.

Link to this sectionActive learning và AutoML có thể hoạt động cùng nhau#

Automated Machine Learning (AutoML) tập trung vào việc tự động hóa các tác vụ lặp đi lặp lại và tốn thời gian liên quan đến việc xây dựng và triển khai các model machine learning. Nó đơn giản hóa các quy trình làm việc của machine learning bằng cách tự động hóa các tác vụ như chọn model và đánh giá hiệu suất để giảm bớt nhu cầu nỗ lực thủ công.

Khi được tích hợp với active learning, AutoML có thể tăng tốc và tối ưu hóa vòng đời phát triển model. Thành phần active learning chọn lọc một cách chiến lược các điểm dữ liệu nhiều thông tin nhất để gán nhãn, trong khi AutoML tinh chỉnh model bằng cách tự động hóa việc chọn kiến trúc, tham số và điều chỉnh.

Quy trình làm việc AutoML

Hình 4. Quy trình làm việc của AutoML.

Hãy tìm hiểu sự kết hợp các công nghệ này qua một ví dụ.

Giả sử bạn đang cố gắng phát hiện các tình trạng hiếm gặp trong hình ảnh y tế (một trường hợp sử dụng mà các tập dữ liệu gán nhãn bị hạn chế và đắt đỏ để thu thập). Active learning có thể xác định và chọn ra dữ liệu không chắc chắn, chẳng hạn như những thay đổi nhỏ trong ảnh X-quang, mà model không phân loại được. Sau đó, dữ liệu không chắc chắn có thể được ưu tiên để gán nhãn thủ công nhằm cải thiện khả năng hiểu của model.

Với dữ liệu đã chú thích, AutoML có thể tối ưu hóa model bằng cách khám phá các kiến trúc, siêu tham số và các kỹ thuật tăng cường dữ liệu khác nhau. Quy trình lặp lại này tăng tốc quá trình phát triển các vision model đáng tin cậy như Ultralytics YOLO11, giúp các chuyên gia chăm sóc sức khỏe đưa ra chẩn đoán chính xác.

Link to this sectionThách thức của active learning#

Active learning và các kỹ thuật của nó cung cấp nhiều ưu điểm, nhưng có một vài cân nhắc cần ghi nhớ khi triển khai các chiến lược này:

Lựa chọn chiến lược truy vấn (Query strategy): Active learning liên quan đến nhiều kỹ thuật, và việc chọn phương pháp tốt nhất ảnh hưởng đáng kể đến hiệu quả của model. Việc chọn một chiến lược không phù hợp có thể làm giảm hiệu suất của model đối với một ứng dụng cụ thể.
Chi phí huấn luyện lại: Bản chất lặp lại của active learning đòi hỏi tài nguyên tính toán đắt đỏ, đặc biệt đối với các tập dữ liệu lớn. Model được huấn luyện lại sau mỗi vòng gán nhãn, làm tăng độ phức tạp của nó.
Chất lượng model ban đầu: Hiệu quả của active learning phụ thuộc vào chất lượng của model ban đầu. Một model ban đầu hoạt động kém có thể không xác định chính xác các điểm dữ liệu chứa nhiều thông tin, dẫn đến các yêu cầu gán nhãn không đạt chuẩn và làm giảm hiệu suất tổng thể.

Link to this sectionCon đường phía trước cho active learning và AutoML#

Với những tiến bộ gần đây trong AI và thị giác máy tính, active learning được thiết lập để giải quyết các thách thức phức tạp hơn và tinh giản các quy trình làm việc của machine learning. Việc kết hợp active learning với các kỹ thuật như federated learning và self-supervised learning có thể nâng cao hơn nữa hiệu quả và khả năng mở rộng của các vision model.

Federated learning cho phép model được huấn luyện trên nhiều thiết bị hoặc máy chủ với khung phân tán mà không yêu cầu dữ liệu rời khỏi vị trí ban đầu của nó. Hãy xem xét các ngành như chăm sóc sức khỏe, nơi quyền riêng tư dữ liệu rất quan trọng, federated learning giúp việc huấn luyện trực tiếp trên dữ liệu cục bộ nhạy cảm trở nên khả thi trong khi vẫn giữ an toàn cho nó. Thay vì chia sẻ dữ liệu thô, chỉ các cập nhật model hoặc thông tin chi tiết được chia sẻ, đảm bảo thông tin riêng tư vẫn được bảo vệ trong khi vẫn đóng góp vào quá trình huấn luyện.

Trong khi đó, self-supervised learning giúp giảm nhu cầu về dữ liệu gán nhãn bằng cách huấn luyện trước các model trên dữ liệu chưa gán nhãn. Quy trình này tạo ra một nền tảng vững chắc cho model. Sau đó, active learning có thể xây dựng dựa trên điều này bằng cách xác định và chọn các điểm dữ liệu quan trọng nhất để con người chú thích, tinh chỉnh thêm model.

Link to this sectionTừ active learning đến tác động chủ động#

Active learning cung cấp một cách thực tế để giải quyết những thách thức lớn trong thị giác máy tính, như chi phí chú thích dữ liệu cao và nhu cầu về các model chính xác hơn. Bằng cách tập trung vào việc gán nhãn chỉ những điểm dữ liệu có giá trị nhất, nó giảm bớt công sức cần thiết từ con người trong khi thúc đẩy hiệu suất của model.

Khi kết hợp với các công nghệ như AutoML, active learning tinh giản việc phát triển model bằng cách tự động hóa các tác vụ tốn thời gian. Khi những tiến bộ tiếp tục, active learning được thiết lập để trở thành một công cụ thiết yếu để xây dựng các hệ thống thị giác máy tính thông minh và hiệu quả hơn.

Khám phá GitHub repository của chúng tôi và tham gia cộng đồng của chúng tôi để tìm hiểu thêm về AI và các model thị giác máy tính. Khám phá thêm các ứng dụng của thị giác máy tính trong sản xuất và chăm sóc sức khỏe trên các trang giải pháp của chúng tôi. Bạn cũng có thể xem các tùy chọn cấp phép của chúng tôi để bắt đầu hành trình AI thị giác của bạn ngay hôm nay.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Học chủ động tăng tốc phát triển thị giác máy tính

Link to this sectionXây dựng các bộ dữ liệu hình ảnh không hề đơn giản#

Link to this sectionActive learning là gì?#

Link to this sectionTìm hiểu cách thức hoạt động của active learning#

Link to this sectionKhám phá các ứng dụng của active learning#

Link to this sectionActive learning có thể giảm chi phí gán nhãn#

Link to this sectionLợi ích của active learning#

Link to this sectionActive learning và AutoML có thể hoạt động cùng nhau#

Link to this sectionThách thức của active learning#

Link to this sectionCon đường phía trước cho active learning và AutoML#

Link to this sectionTừ active learning đến tác động chủ động#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!