Yolo Vision Thâm Quyến
Thâm Quyến
Tham gia ngay

Khai thác khả năng phát hiện màu sắc trong các ứng dụng thị giác máy tính

Abirami Vina

5 phút đọc

Ngày 28 tháng 2 năm 2025

Tìm hiểu cách phát hiện màu sắc kết nối thị giác người và máy tính, sử dụng không gian màu RGB và HSV để tự động hóa các giải pháp thị giác máy tính.

Màu sắc đóng một vai trò quan trọng trong cách con người trải nghiệm thế giới, giúp chúng ta nhận biết, hiểu và kết nối với môi trường xung quanh. Tuy nhiên, không giống như chúng ta, máy móc không nhìn thấy màu sắc - chúng xử lý chúng như dữ liệu, chuyển đổi các sắc thái và tông màu thành các giá trị số.

Một xe tự lái không chỉ nhìn thấy đèn giao thông màu đỏ - nó xử lý màu sắc như một tín hiệu để dừng lại. Khả năng nhận biết và giải thích màu sắc này giúp thu hẹp khoảng cách giữa thị giác của con người và thị giác máy tính.

Thị giác máy tính là một nhánh của AI cho phép máy móc phân tích và hiểu dữ liệu trực quan. Một khía cạnh quan trọng của điều này là phát hiện màu sắc, cho phép máy móc xác định và phân biệt các đối tượng dựa trên màu sắc. Bằng cách phân tích các giá trị pixel trong các không gian màu khác nhau, phát hiện màu sắc có thể được sử dụng trong các ứng dụng như theo dõi đối tượng, hình ảnh y tế và tự động hóa.

Trong bài viết này, chúng ta sẽ xem xét kỹ hơn về cách thức hoạt động của việc phát hiện màu sắc, tại sao nó lại quan trọng và cách nó được sử dụng trong các ứng dụng thị giác máy tính. Hãy cùng bắt đầu!

Nhận diện màu sắc là gì?

Phát hiện màu sắc giúp máy móc xác định các đối tượng và hiểu các cảnh dựa trên màu sắc. Khi kết hợp với các tác vụ thị giác máy tính khác, nó cải thiện độ chính xác và tăng cường các ứng dụng trong thế giới thực. Trước khi đi sâu vào cách phát hiện màu sắc hoạt động, bạn nên hiểu cách màu sắc được biểu diễn kỹ thuật số.

Hình ảnh kỹ thuật số được tạo thành từ các ô vuông nhỏ gọi là pixel, mỗi ô chứa thông tin màu sắc. Ví dụ: đối với mô hình màu RGB (Đỏ, Lục, Lam), màu sắc được tạo ra bằng cách trộn các cường độ khác nhau của màu đỏ, lục và lam. 

Mỗi màu được xác định bởi ba giá trị, từ 0 đến 255, trong đó 0 có nghĩa là không có màu và 255 có nghĩa là cường độ đầy đủ. Ví dụ: màu đỏ thuần là (255, 0, 0) vì nó có giá trị màu đỏ cao nhất và không có màu xanh lá cây hoặc xanh lam. Màu trắng là (255, 255, 255) vì cả ba màu đều ở cường độ đầy đủ.

__wf_reserved_inherit
Hình 1. Một ví dụ về cách máy tính nhìn thấy màu sắc của một quả táo.

Nếu bạn đã quen thuộc với các mô hình thị giác máy tính như Ultralytics YOLO11, bạn có thể tự hỏi tại sao phát hiện màu sắc lại là một kỹ thuật riêng biệt so với phát hiện đối tượng. Mặc dù cả hai đều phân tích hình ảnh, nhưng chúng phục vụ các mục đích khác nhau.

Phát hiện màu sắc tập trung vào việc xác định các màu cụ thể trong một hình ảnh, trong khi phát hiện đối tượng nhận dạng và phân loại các đối tượng bất kể màu sắc của chúng. Trong kịch bản xe tự lái, phát hiện màu sắc phát hiện màu đỏ trong đèn giao thông, trong khi phát hiện đối tượng xác định chính đèn giao thông, giúp xe đưa ra các quyết định lái xe an toàn.

Giới thiệu về không gian màu

Mô hình màu hoặc không gian màu là một hệ thống được sử dụng để biểu diễn màu sắc trong hình ảnh kỹ thuật số và là một phần quan trọng của việc phát hiện màu sắc. Nó gán các giá trị số cho màu sắc, cho phép máy tính diễn giải chúng một cách nhất quán trên các thiết bị khác nhau. Không gian màu cung cấp một cách có cấu trúc để lưu trữ, điều chỉnh và hiển thị màu sắc trong các hệ thống kỹ thuật số.

Một số không gian màu thường được sử dụng bao gồm RGB cho màn hình kỹ thuật số, HSV (Hue, Saturation, Value) để xử lý ảnh và CMYK (Cyan, Magenta, Yellow, Black) để in ấn. RGB và HSV là các không gian màu được sử dụng thường xuyên nhất để phát hiện màu sắc. Hãy cùng tìm hiểu cách chúng hoạt động.

Tổng quan về không gian màu RGB

Không gian màu RGB được sử dụng rộng rãi trong hình ảnh kỹ thuật số, được tìm thấy trong màn hình, máy ảnh và thiết bị hiển thị. Nó hoạt động bằng cách kết hợp các mức độ khác nhau của ánh sáng đỏ, lục và lam để tạo ra các màu khác nhau. Khi cả ba màu đều ở cường độ tối đa, kết quả là màu trắng và khi không có màu nào, nó sẽ có màu đen.

Không gian màu này thường được hình dung như một khối lập phương màu, trong đó mỗi trục đại diện cho một trong các màu cơ bản. Các góc của hình khối hiển thị màu đỏ, lục và lam thuần khiết, cùng với các tổ hợp của chúng, trong khi bên trong chứa tất cả các sắc thái có thể có.

Mặc dù RGB đơn giản và phổ biến, nhưng nó có một số hạn chế. Màu sắc có thể không phải lúc nào cũng giống nhau đối với mắt người vì RGB không khớp đều với cách chúng ta cảm nhận sự khác biệt về màu sắc. Nó cũng bị ảnh hưởng bởi điều kiện ánh sáng, có nghĩa là màu sắc có thể xuất hiện khác nhau tùy thuộc vào độ sáng và môi trường.

__wf_reserved_inherit
Hình 2. Khối màu RGB.

Tổng quan về không gian màu HSV

Không gian màu HSV (Hue, Saturation, Value) biểu diễn màu sắc dựa trên ba thành phần: hue (loại màu), saturation (cường độ của nó) và value (độ sáng của nó). Không giống như RGB, trộn cường độ ánh sáng, HSV gần gũi hơn với cách con người cảm nhận màu sắc, khiến nó trở thành một lựa chọn thiết thực hơn cho nhiều tác vụ xử lý ảnh.

Đặc biệt, Hue (màu sắc) đại diện cho màu thực tế và được đo bằng độ trên bánh xe màu, với màu đỏ ở 0° và màu xanh lam ở 240°. Trong khi đó, độ bão hòa (saturation) kiểm soát màu sắc trông sống động hay xỉn màu như thế nào, trong đó 0% là hoàn toàn màu xám và 100% là hoàn toàn rực rỡ. Mặt khác, giá trị (value) xác định độ sáng, từ 0% (màu đen) đến 100% (độ sáng đầy đủ).

Điều thú vị là, không gian màu HSV thường được hình dung như một hình nón, trong đó màu sắc bao quanh cạnh, độ bão hòa di chuyển ra ngoài và độ sáng tăng từ dưới lên trên. Vì nó tách màu sắc khỏi độ sáng, HSV được sử dụng rộng rãi trong các ứng dụng thị giác máy tính.

__wf_reserved_inherit
Hình 3. Hình nón HSV.

So sánh không gian màu RGB và HSV

Để so sánh RGB và HSV cạnh nhau, hãy lấy màu cam làm ví dụ. Trong không gian màu RGB, màu cam được tạo ra bằng cách trộn màu đỏ và màu lục ở các cường độ cụ thể, thường được biểu thị là (255, 165, 0) - có nghĩa là đỏ hoàn toàn, một ít lục và không có lam. Tuy nhiên, vì RGB không tách biệt màu sắc với độ sáng, nên nó có thể kém trực quan hơn đối với các tác vụ yêu cầu thao tác màu chính xác.

Trong HSV, màu cam được định nghĩa khác. Sắc độ của nó là khoảng 30°, xác định vị trí của nó trên bánh xe màu. Độ bão hòa của nó gần 100%, có nghĩa là nó là một màu sắc sống động, tinh khiết và giá trị của nó cũng là 100%, cho biết độ sáng đầy đủ. Vì HSV tách màu khỏi độ sáng, nên nó thường hữu ích hơn trong các ứng dụng phát hiện màu sắc, nơi điều kiện ánh sáng có thể thay đổi.

__wf_reserved_inherit
Hình 4. So sánh các giá trị RGB và HSV. Ảnh của tác giả.

Cách phát hiện màu sắc hoạt động

Thông thường, phát hiện màu sắc được tiếp cận như một kỹ thuật xử lý ảnh được sử dụng để xác định và cô lập màu sắc từ hình ảnh hoặc video. Màu sắc được phát hiện trong hình ảnh bằng cách sử dụng xử lý ảnh dựa trên không gian màu và các kỹ thuật ngưỡng để phân biệt các sắc thái, bóng và cường độ cụ thể. 

Sau đây là tổng quan nhanh về các bước chính liên quan đến việc phát hiện màu bằng xử lý ảnh:

  • Thu thập hình ảnh: Quá trình bắt đầu bằng cách chụp một hình ảnh hoặc khung video bằng máy ảnh. Hình ảnh thường được lưu trữ ở định dạng RGB dưới dạng một ma trận các pixel.
  • Chuyển đổi không gian màu: Vì RGB không phải lúc nào cũng lý tưởng cho việc phát hiện màu sắc, hình ảnh được chuyển đổi sang không gian màu HSV. Điều này giúp tách màu sắc khỏi độ sáng, giúp phát hiện ổn định hơn trong các điều kiện ánh sáng khác nhau.
  • Ngưỡng màu: Một phạm vi cụ thể được xác định cho màu mục tiêu ở định dạng HSV. Bước này tạo ra một mặt nạ nhị phân, trong đó các pixel trong phạm vi màu đã chọn xuất hiện màu trắng và tất cả các pixel khác xuất hiện màu đen.
  • Che mặt nạ (Masking): Mặt nạ nhị phân được áp dụng cho ảnh gốc để cô lập màu được phát hiện, loại bỏ mọi thứ khác. Điều này chỉ làm nổi bật các khu vực phù hợp với màu mong muốn.

Sau khi màu sắc được phát hiện và cô lập, nó có thể được sử dụng trong các tác vụ thị giác máy tính khác nhau, chẳng hạn như theo dõi đối tượng, phân đoạn hình ảnh và ra quyết định tự động trong các ứng dụng như robot, hình ảnh y tế và xe tự hành.

Vai trò của nhận diện màu sắc trong thị giác máy tính

Bây giờ chúng ta đã tìm hiểu cách phát hiện màu sắc hoạt động, hãy khám phá cách nó hỗ trợ các ứng dụng thị giác máy tính. 

Trong một số trường hợp nhất định, phát hiện màu sắc có thể là một giải pháp thay thế đơn giản hơn cho các mô hình thị giác máy tính, đặc biệt là trong môi trường được kiểm soát, nơi màu sắc là yếu tố chính để phân biệt các đối tượng. Thay vì đào tạo một mô hình với một tập dữ liệu khổng lồ, phát hiện màu sắc cung cấp một giải pháp nhanh chóng và hiệu quả mà không cần dán nhãn rộng rãi hoặc sức mạnh tính toán cao.

Ví dụ: trong một hệ thống phân loại táo tự động, một mô hình computer vision như YOLO11 có thể được huấn luyện để phân loại táo theo độ chín, nhưng nó sẽ yêu cầu một tập dữ liệu gồm các hình ảnh được gắn nhãn để xử lý các biến thể về ánh sáng, kết cấu và loại táo. 

Một cách tiếp cận đơn giản hơn là trước tiên phát hiện táo bằng cách sử dụng object detection (phát hiện đối tượng) và sau đó phân tích màu sắc của chúng để xác định độ chín. Vì phương pháp này dựa vào các ngưỡng màu được xác định trước thay vì huấn luyện một mô hình, nó hoạt động tốt trong các điều kiện ổn định, nơi ánh sáng và nền không thay đổi đáng kể.

Mặc dù một mô hình được huấn luyện tùy chỉnh có thể tốt hơn cho các môi trường phức tạp và biến đổi hơn, nhưng phát hiện màu sắc là một giải pháp nhanh chóng, thiết thực và dễ tiếp cận cho các ứng dụng thời gian thực. Đây cũng là một điểm khởi đầu tuyệt vời cho những người tìm hiểu về xử lý ảnh và thị giác máy tính trước khi chuyển sang các giải pháp nâng cao hơn.

Các ứng dụng thực tế của nhận dạng màu sắc

Phát hiện màu sắc được sử dụng trong một loạt các ngành công nghiệp cho các ứng dụng khác nhau. Hãy cùng điểm qua một vài trường hợp sử dụng thực tế.

Phát hiện màu sắc để đánh giá chất lượng vải

Phát hiện màu sắc là rất quan trọng trong sản xuất vải và dệt may. Nó thường được sử dụng trong các hệ thống kiểm soát chất lượng và xác định khuyết tật tự động. Không giống như kiểm tra thủ công, tốn thời gian và dễ xảy ra lỗi do con người, các hệ thống tự động cung cấp khả năng phát hiện lỗi chính xác và theo thời gian thực. 

Cụ thể, bằng cách phân tích hình ảnh vải, các hệ thống thị giác máy tính có thể xác định các khuyết tật như phân bố thuốc nhuộm không đều, phai màu và nhiễm bẩn. Các kỹ thuật phát hiện màu sắc tiên tiến giúp kiểm soát chất lượng chính xác hơn bằng cách đo lường tính nhất quán của màu sắc giữa các lô khác nhau.

__wf_reserved_inherit
Hình 5. Nhận diện màu sắc đóng vai trò quan trọng trong việc tạo ra các loại vải đầy màu sắc.

Sử dụng tính năng nhận diện màu sắc trong nông nghiệp

Như đã đề cập trước đó, màu sắc là một chỉ số quan trọng về độ chín và công nghệ phát hiện màu sắc có thể được sử dụng trong nông nghiệp để theo dõi sức khỏe cây trồng và cải thiện thu hoạch. 

Bằng cách phân tích các biến thể màu sắc, nông dân có thể đánh giá sức khỏe của cây trồng, phát hiện bệnh tật và xác định thời điểm thu hoạch. Robot tiên tiến được trang bị cảm biến màu và thị giác máy tính giúp tự động hóa quy trình bằng cách đảm bảo chỉ những cây trồng chín mới được hái. Các hệ thống này có thể tăng hiệu quả và năng suất, đặc biệt là ở những khu vực thiếu lao động.

__wf_reserved_inherit
Hình 6. Xoài ở các mức độ chín khác nhau: (a) thối, (b) chín và (c) xanh.

Những điều cần nhớ

Phát hiện màu sắc là một kỹ thuật thị giác máy tính tiên tiến với các ứng dụng trong nông nghiệp, sản xuất, chăm sóc sức khỏe và tự động hóa. Nó giúp máy móc nhận biết và diễn giải màu sắc để theo dõi đối tượng, kiểm soát chất lượng và ra quyết định. 

Mặc dù các mô hình AI tiên tiến tiếp tục phát triển, nhưng phát hiện màu sắc vẫn là một giải pháp đơn giản và hiệu quả, đặc biệt là trong các môi trường được kiểm soát. Khi công nghệ tiến bộ, nó có khả năng tiếp tục đóng một vai trò quan trọng trong việc cải thiện các ứng dụng thực tế.

Tìm hiểu sâu hơn về AI bằng cách khám phá cộng đồngkho lưu trữ GitHub của chúng tôi. Tìm hiểu về những đổi mới trong AI trong sản xuấtthị giác máy tính trong lĩnh vực chăm sóc sức khỏe, đồng thời khám phá cách bắt đầu tận dụng Vision AI với các tùy chọn cấp phép của chúng tôi.

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard