Tận dụng phát hiện màu sắc trong các ứng dụng thị giác máy tính
Khám phá cách phát hiện màu sắc kết nối thị giác con người và máy tính, sử dụng không gian màu RGB và HSV để tự động hóa các giải pháp thị giác máy tính.

Màu sắc đóng vai trò quan trọng trong cách con người trải nghiệm thế giới, giúp chúng ta nhận diện, thấu hiểu và kết nối với môi trường xung quanh. Tuy nhiên, khác với chúng ta, máy móc không nhìn thấy màu sắc - chúng xử lý chúng như dữ liệu, chuyển đổi các sắc thái và tông màu thành các giá trị số.
Một chiếc xe tự lái không chỉ nhìn thấy đèn giao thông màu đỏ - nó xử lý màu sắc đó như một tín hiệu để dừng lại. Khả năng nhận diện và diễn giải màu sắc này giúp thu hẹp khoảng cách giữa thị giác con người và thị giác máy tính.
Thị giác máy tính là một nhánh của AI cho phép máy móc phân tích và thấu hiểu dữ liệu hình ảnh. Một khía cạnh then chốt của việc này là phát hiện màu sắc, cho phép máy móc xác định và phân biệt các đối tượng dựa trên màu sắc. Bằng cách phân tích giá trị pixel trong các không gian màu khác nhau, phát hiện màu sắc có thể được sử dụng trong các ứng dụng như theo dõi đối tượng, chẩn đoán hình ảnh y tế và tự động hóa.
Trong bài viết này, chúng ta sẽ xem xét kỹ hơn về cách thức hoạt động của phát hiện màu sắc, lý do tại sao nó quan trọng và cách nó được sử dụng trong các ứng dụng thị giác máy tính. Hãy bắt đầu nào!
Link to this sectionPhát hiện màu sắc là gì?#
Phát hiện màu sắc giúp máy móc xác định các đối tượng và thấu hiểu các cảnh dựa trên màu sắc. Khi kết hợp với các tác vụ thị giác máy tính khác, nó cải thiện độ chính xác và nâng cao các ứng dụng trong thế giới thực. Trước khi đi sâu vào cách thức hoạt động của phát hiện màu sắc, việc hiểu cách các màu sắc được thể hiện kỹ thuật số sẽ rất hữu ích.
Hình ảnh kỹ thuật số được tạo thành từ các ô vuông nhỏ gọi là pixel, mỗi pixel chứa thông tin màu sắc. Ví dụ, đối với mô hình màu RGB (Đỏ, Xanh lá, Xanh dương), màu sắc được tạo ra bằng cách trộn các cường độ khác nhau của màu đỏ, xanh lá và xanh dương.
Mỗi màu được định nghĩa bằng ba giá trị, nằm trong khoảng từ 0 đến 255, trong đó 0 nghĩa là không có màu và 255 là cường độ tối đa. Ví dụ, màu đỏ thuần là (255, 0, 0) vì nó có giá trị đỏ cao nhất và không có màu xanh lá hay xanh dương. Màu trắng là (255, 255, 255) vì cả ba màu đều ở cường độ tối đa.

Hình 1. Một ví dụ về cách máy tính nhìn thấy màu sắc của một quả táo.
Nếu bạn đã quen thuộc với các model thị giác máy tính như Ultralytics YOLO11, bạn có thể tự hỏi tại sao phát hiện màu sắc lại là một kỹ thuật riêng biệt so với phát hiện đối tượng. Mặc dù cả hai đều phân tích hình ảnh, chúng phục vụ các mục đích khác nhau.
Phát hiện màu sắc tập trung vào việc xác định các màu cụ thể trong một hình ảnh, trong khi phát hiện đối tượng nhận diện và phân loại các đối tượng bất kể màu sắc của chúng. Trong tình huống xe tự lái, phát hiện màu sắc nhận ra màu đỏ của đèn giao thông, trong khi phát hiện đối tượng nhận diện chính cái đèn giao thông đó, giúp xe đưa ra các quyết định lái xe an toàn.
Link to this sectionGiới thiệu về không gian màu#
Một mô hình màu hoặc không gian màu là một hệ thống được sử dụng để thể hiện màu sắc trong hình ảnh kỹ thuật số và là một phần quan trọng của phát hiện màu sắc. Nó gán các giá trị số cho màu sắc, cho phép máy tính diễn giải chúng một cách nhất quán trên các thiết bị khác nhau. Không gian màu cung cấp một cách có cấu trúc để lưu trữ, điều chỉnh và hiển thị màu sắc trong các hệ thống kỹ thuật số.
Một số không gian màu thường được sử dụng bao gồm RGB cho màn hình kỹ thuật số, HSV (Hue, Saturation, Value) cho xử lý hình ảnh và CMYK (Cyan, Magenta, Yellow, Black) cho in ấn. RGB và HSV là những không gian màu được sử dụng thường xuyên nhất để phát hiện màu sắc. Hãy đi sâu vào cách chúng hoạt động.
Link to this sectionTổng quan về không gian màu RGB#
Không gian màu RGB được sử dụng rộng rãi trong hình ảnh kỹ thuật số, có mặt trên màn hình, máy ảnh và thiết bị hiển thị. Nó hoạt động bằng cách kết hợp các mức độ ánh sáng đỏ, xanh lá và xanh dương khác nhau để tạo ra các màu sắc đa dạng. Khi cả ba màu ở cường độ tối đa, kết quả là màu trắng, và khi không có màu nào, nó hiển thị là màu đen.
Không gian màu này thường được hình dung như một khối lập phương màu, nơi mỗi trục đại diện cho một trong các màu cơ bản. Các góc của khối lập phương hiển thị màu đỏ, xanh lá và xanh dương thuần, cùng với sự kết hợp của chúng, trong khi bên trong chứa tất cả các sắc thái có thể có.
Mặc dù RGB đơn giản và phổ biến, nó có một số hạn chế. Màu sắc có thể không phải lúc nào cũng trông giống nhau đối với mắt người vì RGB không khớp hoàn toàn với cách chúng ta cảm nhận sự khác biệt về màu sắc. Nó cũng bị ảnh hưởng bởi điều kiện ánh sáng, nghĩa là màu sắc có thể trông khác nhau tùy thuộc vào độ sáng và môi trường.

Hình 2. Khối lập phương màu RGB.
Link to this sectionTổng quan về không gian màu HSV#
Không gian màu HSV (Hue, Saturation, Value) thể hiện màu sắc dựa trên ba thành phần: hue (loại màu), saturation (cường độ), và value (độ sáng). Không giống như RGB, vốn pha trộn các cường độ ánh sáng, HSV gần hơn với cách con người cảm nhận màu sắc, khiến nó trở thành một lựa chọn thực tế hơn cho nhiều tác vụ xử lý hình ảnh.
Cụ thể, hue đại diện cho màu sắc thực tế và được đo bằng độ trên bánh xe màu, với màu đỏ ở 0° và màu xanh dương ở 240°. Trong khi đó, saturation kiểm soát độ sống động hoặc xỉn màu của một màu, trong đó 0% là màu xám hoàn toàn và 100% là sống động hoàn toàn. Mặt khác, value xác định độ sáng, dao động từ 0% (đen) đến 100% (độ sáng tối đa).
Thú vị là, không gian màu HSV thường được hình dung như một hình nón, nơi hue bao quanh cạnh, saturation di chuyển ra ngoài và độ sáng tăng dần từ dưới lên trên. Vì nó tách biệt màu sắc khỏi độ sáng, HSV được sử dụng rộng rãi trong các ứng dụng thị giác máy tính.

Hình 3. Hình nón HSV.
Link to this sectionSo sánh không gian màu RGB và HSV#
Để so sánh RGB và HSV cạnh nhau, hãy lấy màu cam làm ví dụ. Trong không gian màu RGB, màu cam được tạo ra bằng cách trộn màu đỏ và xanh lá ở các cường độ cụ thể, thường được biểu diễn là (255, 165, 0) - nghĩa là đỏ tối đa, một chút xanh lá và không có xanh dương. Tuy nhiên, vì RGB không tách biệt màu sắc khỏi độ sáng, nó có thể kém trực quan hơn đối với các tác vụ đòi hỏi sự thao tác màu sắc chính xác.
Trong HSV, màu cam được định nghĩa khác. Hue của nó là khoảng 30°, xác định vị trí của nó trên bánh xe màu. Saturation của nó gần bằng 100%, nghĩa là đó là một màu sống động, tinh khiết, và value cũng là 100%, cho thấy độ sáng tối đa. Vì HSV tách biệt màu sắc khỏi độ sáng, nó thường hữu ích hơn trong các ứng dụng phát hiện màu sắc nơi điều kiện ánh sáng có thể thay đổi.

Hình 4. So sánh các giá trị RGB và HSV. Hình ảnh bởi tác giả.
Link to this sectionCách thức hoạt động của phát hiện màu sắc#
Thông thường, phát hiện màu sắc được tiếp cận như một kỹ thuật xử lý hình ảnh dùng để nhận diện và tách biệt các màu sắc từ hình ảnh hoặc video. Các màu sắc được phát hiện trong hình ảnh bằng cách sử dụng xử lý hình ảnh dựa trên các không gian màu và kỹ thuật ngưỡng để phân biệt các tông màu, sắc thái và cường độ cụ thể.
Dưới đây là tổng quan nhanh về các bước chính trong phát hiện màu sắc sử dụng xử lý hình ảnh:
- Thu nhận hình ảnh: Quá trình bắt đầu bằng việc chụp một hình ảnh hoặc khung hình video bằng máy ảnh. Hình ảnh thường được lưu trữ ở định dạng RGB dưới dạng ma trận các pixel.
- Chuyển đổi không gian màu: Vì RGB không phải lúc nào cũng lý tưởng cho phát hiện màu sắc, hình ảnh được chuyển đổi sang không gian màu HSV. Điều này giúp tách biệt màu sắc khỏi độ sáng, làm cho việc phát hiện ổn định hơn dưới các điều kiện ánh sáng khác nhau.
- Ngưỡng màu: Một dải cụ thể được xác định cho màu mục tiêu ở định dạng HSV. Bước này tạo ra một mask nhị phân, trong đó các pixel nằm trong dải màu được chọn sẽ xuất hiện màu trắng, và tất cả các pixel khác xuất hiện màu đen.
- Masking (Che phủ): Mask nhị phân được áp dụng cho hình ảnh gốc để tách biệt màu đã phát hiện, lọc bỏ mọi thứ khác. Điều này làm nổi bật chỉ các khu vực khớp với màu mong muốn.
Sau khi màu được phát hiện và tách biệt, nó có thể được sử dụng trong các tác vụ thị giác máy tính khác nhau, chẳng hạn như theo dõi đối tượng, phân đoạn hình ảnh và đưa ra quyết định tự động trong các ứng dụng như robot, chẩn đoán hình ảnh y tế và phương tiện tự hành.
Link to this sectionVai trò của phát hiện màu sắc trong thị giác máy tính#
Giờ đây khi đã biết cách thức hoạt động của phát hiện màu sắc, hãy cùng khám phá cách nó hỗ trợ các ứng dụng thị giác máy tính.
Trong một số trường hợp, phát hiện màu sắc có thể là một giải pháp thay thế đơn giản hơn cho các model thị giác máy tính, đặc biệt là trong các môi trường được kiểm soát nơi màu sắc là yếu tố chính để phân biệt đối tượng. Thay vì huấn luyện một model với bộ dữ liệu khổng lồ, phát hiện màu sắc cung cấp một giải pháp nhanh chóng và hiệu quả mà không cần gắn nhãn quy mô lớn hoặc sức mạnh tính toán cao.
Ví dụ, trong một hệ thống phân loại táo tự động, một model thị giác máy tính như YOLO11 có thể được huấn luyện để phân loại táo theo độ chín, nhưng nó sẽ cần một bộ dữ liệu gồm các hình ảnh đã gắn nhãn để xử lý sự khác biệt về ánh sáng, kết cấu và các loại táo.
Một phương pháp trực tiếp hơn là trước tiên phát hiện táo bằng cách sử dụng phát hiện đối tượng và sau đó phân tích màu sắc của chúng để xác định độ chín. Vì phương pháp này dựa trên các ngưỡng màu được xác định trước thay vì huấn luyện một model, nó hoạt động hiệu quả trong các điều kiện ổn định nơi ánh sáng và nền không thay đổi đáng kể.
Mặc dù một model được huấn luyện tùy chỉnh có thể tốt hơn cho các môi trường phức tạp và thay đổi, phát hiện màu sắc là một giải pháp nhanh chóng, thiết thực và dễ tiếp cận cho các ứng dụng thời gian thực. Nó cũng là một điểm khởi đầu tuyệt vời cho những người đang tìm hiểu về xử lý hình ảnh và thị giác máy tính trước khi chuyển sang các giải pháp nâng cao hơn.
Link to this sectionCác ứng dụng thực tế của phát hiện màu sắc#
Phát hiện màu sắc được sử dụng trong nhiều ngành công nghiệp cho các ứng dụng đa dạng. Hãy cùng xem qua một số trường hợp sử dụng trong thế giới thực.
Link to this sectionPhát hiện màu sắc để đánh giá chất lượng vải#
Phát hiện màu sắc đóng vai trò quan trọng trong sản xuất vải và dệt may. Nó thường được sử dụng trong các hệ thống kiểm soát chất lượng tự động và nhận diện lỗi. Khác với kiểm tra thủ công, vốn tốn thời gian và dễ xảy ra sai sót do con người, các hệ thống tự động cung cấp khả năng phát hiện lỗi chính xác và theo thời gian thực.
Cụ thể, bằng cách phân tích hình ảnh vải, các hệ thống thị giác máy tính có thể nhận diện các lỗi như phân bổ thuốc nhuộm không đều, phai màu và nhiễm bẩn. Các kỹ thuật phát hiện màu sắc nâng cao giúp việc kiểm soát chất lượng chính xác hơn bằng cách đo lường tính nhất quán của màu sắc trên các lô hàng khác nhau.

Hình 5. Phát hiện màu sắc đóng vai trò chủ chốt trong việc tạo ra vải nhiều màu.
Link to this sectionSử dụng phát hiện màu sắc trong nông nghiệp#
Như đã đề cập trước đó, màu sắc là một chỉ báo quan trọng về độ chín, và công nghệ phát hiện màu sắc có thể được sử dụng trong nông nghiệp để giám sát sức khỏe cây trồng và cải thiện thu hoạch.
Bằng cách phân tích các biến đổi màu sắc, nông dân có thể đánh giá sức khỏe cây trồng, phát hiện dịch bệnh và xác định khi nào cây trồng sẵn sàng để thu hoạch. Các robot hiện đại được trang bị cảm biến màu sắc và thị giác máy tính giúp tự động hóa quy trình bằng cách đảm bảo chỉ những cây trồng chín mới được hái. Những hệ thống này có thể tăng hiệu quả và năng suất, đặc biệt là ở những khu vực thiếu hụt lao động.

Hình 6. Xoài ở các mức độ chín khác nhau: (a) thối, (b) chín và (c) chưa chín.
Link to this sectionCác điểm chính cần lưu ý#
Phát hiện màu sắc là một kỹ thuật thị giác máy tính sáng tạo với các ứng dụng trong nông nghiệp, sản xuất, chăm sóc sức khỏe và tự động hóa. Nó giúp máy móc nhận diện và diễn giải màu sắc để theo dõi đối tượng, kiểm soát chất lượng và đưa ra quyết định.
Trong khi các model AI nâng cao tiếp tục phát triển, phát hiện màu sắc vẫn là một giải pháp đơn giản và hiệu quả, đặc biệt là trong các môi trường được kiểm soát. Khi công nghệ tiến bộ, nó có khả năng sẽ tiếp tục đóng vai trò quan trọng trong việc cải thiện các ứng dụng trong thế giới thực.
Đi sâu hơn vào AI bằng cách khám phá cộng đồng và kho lưu trữ GitHub của chúng tôi. Tìm hiểu về các đổi mới trong AI trong sản xuất và thị giác máy tính trong chăm sóc sức khỏe, và khám phá cách bắt đầu tận dụng AI thị giác với các tùy chọn cấp phép của chúng tôi.






