Ngưỡng trong xử lý hình ảnh là gì?

5 phút đọc

Ngày 12 tháng 8 năm 2025

Khám phá ngưỡng trong xử lý hình ảnh với hướng dẫn này. Tìm hiểu ngưỡng là gì, các kỹ thuật ngưỡng hình ảnh khác nhau, bao gồm ngưỡng Otsu.

Con người nhìn nhận hình ảnh như những bức tranh mạch lạc, giàu ý nghĩa, trong khi máy tính nhìn nhận chúng như những lưới điểm ảnh nhỏ li ti, những thành phần nhỏ nhất của một hình ảnh kỹ thuật số. Trong một quá trình gọi là xử lý hình ảnh , những điểm ảnh này có thể được điều chỉnh hoặc phân tích để cải thiện hình ảnh và trích xuất thông tin hữu ích.

Một kỹ thuật xử lý hình ảnh phổ biến được gọi là ngưỡng ảnh. Phương pháp này chuyển đổi ảnh thang độ xám (mỗi điểm ảnh đại diện cho một sắc thái xám) thành ảnh đen trắng bằng cách so sánh từng điểm ảnh với một giá trị đã đặt. Phương pháp này tạo ra sự phân tách rõ ràng giữa các vùng quan trọng và nền.

Ngưỡng ảnh thường được sử dụng trong phân đoạn ảnh , một kỹ thuật chia ảnh thành các vùng có ý nghĩa để dễ phân tích hơn. Đây thường là một trong những bước đầu tiên giúp máy móc diễn giải dữ liệu hình ảnh. Trong bài viết này, chúng ta sẽ tìm hiểu ngưỡng ảnh là gì, cách thức hoạt động và ứng dụng của nó trong các tình huống thực tế. Cùng bắt đầu nào!

Thuật ngữ cơ bản trong ngưỡng hình ảnh

Trước khi đi sâu vào cách thức hoạt động của ngưỡng, trước tiên chúng ta hãy xem xét kỹ hơn những ý tưởng cơ bản đằng sau nó và cách nó được sử dụng trong xử lý hình ảnh.

Ngưỡng hình ảnh nhị phân

Giả sử bạn đang làm việc với một hình ảnh và muốn tách các đối tượng trong đó khỏi nền. Một cách để thực hiện việc này là sử dụng ngưỡng. Nó đơn giản hóa hình ảnh sao cho mỗi điểm ảnh hoặc hoàn toàn đen hoặc hoàn toàn trắng. Kết quả là một hình ảnh nhị phân, trong đó mỗi điểm ảnh có giá trị 0 (đen) hoặc 255 (trắng). Bước này thường hữu ích trong xử lý ảnh vì nó làm nổi bật rõ ràng các phần quan trọng của hình ảnh.

Hình 1. Ảnh thang độ xám và đầu ra nhị phân của ảnh sau khi ngưỡng hóa. (Nguồn) 

Biểu đồ tần suất

Tương tự, nếu bạn muốn hiểu cách các giá trị độ sáng được phân bổ trên một hình ảnh, biểu đồ histogram có thể hữu ích. Đây là một biểu đồ hiển thị tần suất xuất hiện của từng cường độ điểm ảnh, từ đen (0) đến trắng (255). 

Bằng cách xem biểu đồ histogram, bạn có thể biết ảnh tối, sáng hay ở mức trung bình. Điều này giúp bạn dễ dàng chọn ngưỡng màu phù hợp khi chuyển ảnh sang đen trắng, vì bạn có thể nhận ra các họa tiết và mức độ tương phản chỉ trong nháy mắt.

Tiền cảnh và hậu cảnh

Sau khi hình ảnh được phân ngưỡng, nó sẽ được chia thành hai phần: tiền cảnh và hậu cảnh. Tiền cảnh, thường được hiển thị bằng màu trắng, làm nổi bật các yếu tố quan trọng, chẳng hạn như văn bản, hình dạng hoặc đối tượng bạn muốn phát hiện. Hậu cảnh, được hiển thị bằng màu đen, là tất cả các yếu tố còn lại. Sự phân tách này giúp máy tính tập trung vào những gì quan trọng trong hình ảnh.

Phân đoạn

Như đã đề cập trước đó, phân đoạn ảnh chia hình ảnh thành các vùng có ý nghĩa dựa trên các đặc điểm như độ sáng hoặc kết cấu. Ngưỡng là một cách đơn giản để thực hiện việc này và thường là một trong những bước đầu tiên trong quy trình xử lý thị giác máy tính. 

Thị giác máy tính là một nhánh của AI, cho phép máy móc xử lý và diễn giải dữ liệu hình ảnh, tương tự như con người. Bằng cách sử dụng ngưỡng ở giai đoạn đầu, hệ thống thị giác máy tính có thể tách vật thể khỏi nền, giúp các bước sau, chẳng hạn như phát hiện hoặc nhận dạng, hoạt động chính xác hơn.

Ngưỡng toàn cầu

Bây giờ chúng ta đã hiểu rõ hơn về ngưỡng là gì, hãy cùng tìm hiểu cách ngưỡng hóa hình ảnh và các loại ngưỡng hóa khác nhau trong xử lý hình ảnh.

Ví dụ, ngưỡng toàn cục là một trong những cách dễ nhất để tạo ảnh nhị phân. Nó áp dụng một giá trị cường độ duy nhất trên toàn bộ ảnh. Các điểm ảnh sáng hơn ngưỡng này sẽ chuyển sang màu trắng, trong khi các điểm ảnh tối hơn sẽ chuyển sang màu đen. Điều này giúp tách vật thể khỏi nền.

Tính năng này hoạt động tốt nhất khi hình ảnh có ánh sáng đều và độ tương phản mạnh. Tuy nhiên, trong điều kiện ánh sáng không đồng đều hoặc độ tương phản thấp, một ngưỡng duy nhất có thể bỏ sót chi tiết hoặc làm mờ các cạnh.

Để xử lý vấn đề này, các phương pháp như ngưỡng Otsu được sử dụng. Thay vì đặt giá trị thủ công, phương pháp ngưỡng Otsu sẽ phân tích biểu đồ histogram của hình ảnh và chọn ngưỡng phù hợp nhất để phân tách cường độ điểm ảnh thành tiền cảnh và hậu cảnh. 

Hình 2. Hình ảnh Sao Thổ trước và sau khi áp dụng ngưỡng Otsu. (Nguồn)

Ngưỡng cục bộ (thích ứng)

Không giống như ngưỡng toàn cục, ngưỡng thích ứng hoặc ngưỡng cục bộ tính toán giá trị ngưỡng riêng biệt cho các phần khác nhau của hình ảnh. Điều này giúp hiệu quả hơn đối với hình ảnh có ánh sáng không đồng đều, chẳng hạn như tài liệu được quét có bóng hoặc bề mặt có kết cấu.

Phương pháp này hoạt động bằng cách chia hình ảnh thành các vùng nhỏ và tính toán ngưỡng cục bộ cho mỗi khối, giúp duy trì độ tương phản giữa tiền cảnh và hậu cảnh. Phương pháp này được sử dụng rộng rãi trong các tác vụ như nhận dạng văn bản, chụp ảnh y tế và kiểm tra bề mặt, trong đó ánh sáng thay đổi trên toàn bộ hình ảnh.

Một số phương pháp phổ biến để ngưỡng thích ứng trong xử lý ảnh bao gồm ngưỡng trung bình thích ứng và ngưỡng Gaussian thích ứng. Trong ngưỡng trung bình thích ứng, cường độ điểm ảnh trung bình trong một vùng lân cận cục bộ được sử dụng làm ngưỡng cho điểm ảnh trung tâm. Mặt khác, ngưỡng Gaussian thích ứng sử dụng giá trị trung bình có trọng số với cửa sổ Gaussian, ưu tiên các điểm ảnh gần tâm hơn.

Ứng dụng thực tế của ngưỡng trong xử lý hình ảnh

Tiếp theo, chúng ta hãy cùng khám phá ngưỡng hình ảnh được sử dụng như thế nào trong các ứng dụng thực tế.

Ngưỡng hình ảnh để nhị phân hóa tài liệu và OCR

Sách cũ và thư viết tay thường được quét để lưu trữ hoặc chuyển đổi thành văn bản kỹ thuật số bằng OCR (Nhận dạng Ký tự Quang học) , một công nghệ đọc các ký tự in hoặc viết tay. Trước khi có thể trích xuất văn bản, tài liệu thường cần được làm sạch hoặc xử lý sơ bộ. Hình ảnh được quét thường có bóng, mực bị phai hoặc ánh sáng không đều, gây khó khăn cho việc nhận dạng ký tự.

Để cải thiện độ rõ nét, ngưỡng được sử dụng để chuyển đổi hình ảnh thang độ xám sang định dạng nhị phân, giúp tách biệt văn bản khỏi nền. Các vùng tối hơn, chẳng hạn như chữ cái, sẽ chuyển sang màu đen, trong khi nền sáng hơn sẽ chuyển sang màu trắng - giúp hệ thống OCR đọc văn bản dễ dàng hơn nhiều.

Hình 3. Ví dụ về một tài liệu lịch sử và hình ảnh ngưỡng của nó. (Nguồn)

Sử dụng ngưỡng trong xử lý hình ảnh y tế 

Tương tự, trong chẩn đoán hình ảnh y tế, ngưỡng ảnh thường được sử dụng để phân lập các cấu trúc cụ thể trong ảnh chụp, chẳng hạn như xương hoặc phổi trong ảnh X-quang. Bằng cách chuyển đổi ảnh thang độ xám sang định dạng nhị phân, việc tách các vùng quan tâm khỏi mô xung quanh và chuẩn bị hình ảnh cho các phân tích sâu hơn trở nên dễ dàng hơn. Trong các trường hợp phức tạp hơn, ngưỡng ảnh đa cấp có thể được áp dụng để chia hình ảnh thành nhiều vùng riêng biệt, cho phép xác định đồng thời các loại mô hoặc cấu trúc khác nhau.

Hình 4. Sử dụng phương pháp ngưỡng đa cấp trên phim chụp X-quang ngực. (Nguồn)

Ưu và nhược điểm của ngưỡng trong xử lý hình ảnh

Sau đây là một số lợi ích chính của việc sử dụng ngưỡng trong xử lý hình ảnh:

  • Tiêu tốn ít tài nguyên: Ngưỡng hoạt động tốt trên các thiết bị có công suất thấp và không cần truy cập đám mây hoặc phần cứng cao cấp, do đó phù hợp với các hệ thống nhúng và thiết lập ngoại tuyến.
  • Dễ diễn giải: Logic đơn giản của nó giúp cho việc xác định ngưỡng đầu ra dễ hiểu và dễ gỡ lỗi, điều này rất quan trọng trong các lĩnh vực như chăm sóc sức khỏe hoặc xử lý tài liệu, nơi tính minh bạch rất quan trọng.
  • Kiểm tra nhanh: Ngưỡng cho phép các nhóm nhanh chóng khám phá các ý tưởng phân đoạn trong các dự án giai đoạn đầu trước khi chuyển sang các mô hình phức tạp hơn.

Mặc dù ngưỡng ảnh hữu ích trong nhiều trường hợp, nhưng nó cũng đi kèm với một số hạn chế nhất định. Dưới đây là một số thách thức liên quan đến ngưỡng ảnh cần cân nhắc:

  • Thiếu khả năng thích ứng: Ngưỡng tuân theo các quy tắc cố định và không điều chỉnh theo điều kiện ánh sáng mới hoặc các biến thể trong dữ liệu nếu không điều chỉnh thủ công.
  • Nhạy cảm với nhiễu: Những thay đổi nhỏ về độ sáng từ bóng đổ hoặc phản chiếu có thể làm ảnh hưởng đến kết quả, đặc biệt là khi làm việc với hình ảnh có nhiều chi tiết hoặc có kết cấu.
  • Tĩnh và dựa trên quy tắc: Không giống như các mô hình AI, ngưỡng không học hỏi từ dữ liệu hoặc cải thiện theo thời gian. Nó chỉ hoạt động trong những điều kiện hạn hẹp mà nó được thiết kế.

Vượt ra ngoài ngưỡng hình ảnh: Khi thị giác máy tính là công cụ phù hợp

Ngưỡng hoạt động tốt cho các tác vụ phân đoạn đơn giản trong điều kiện được kiểm soát. Tuy nhiên, nó thường gặp khó khăn khi xử lý các hình ảnh phức tạp có nhiều đối tượng hoặc nhiễu nền. Vì dựa trên các quy tắc cố định, ngưỡng thiếu tính linh hoạt cần thiết cho hầu hết các ứng dụng thực tế.

Để vượt qua những giới hạn này, nhiều hệ thống tiên tiến hiện nay sử dụng thị giác máy tính. Trái ngược với ngưỡng, các mô hình AI thị giác được đào tạo để phát hiện các mẫu và đặc điểm phức tạp, giúp chúng chính xác và thích ứng hơn nhiều.

Ví dụ, các mô hình thị giác máy tính như Ultralytics YOLO11 có thể phát hiện vật thể và phân đoạn hình ảnh theo thời gian thực. Điều này khiến chúng trở nên lý tưởng cho các nhiệm vụ như phát hiện tín hiệu giao thông trên xe tự hành hoặc xác định các vấn đề về cây trồng trong nông nghiệp. 

Đặc biệt, YOLO11 hỗ trợ một loạt các tác vụ thị giác máy tính , chẳng hạn như phân đoạn thực thể, trong đó mỗi đối tượng trong ảnh được phân đoạn riêng biệt. Nó cũng có thể thực hiện các tác vụ thị giác khác, bao gồm ước tính tư thế (xác định vị trí hoặc tư thế của đối tượng) và theo dõi đối tượng (theo dõi đối tượng khi nó di chuyển qua các khung hình video).

Hình 5. YOLO11 giúp phát hiện và phân đoạn đối tượng dễ dàng. ( Nguồn )

Trong khi ngưỡng hoạt động tốt đối với các tác vụ đơn giản hoặc thử nghiệm các ý tưởng ban đầu, các ứng dụng cần tốc độ, độ chính xác và tính linh hoạt thường được xử lý tốt hơn bằng thị giác máy tính.

Những điểm chính

Ngưỡng ảnh là một công cụ quan trọng trong xử lý ảnh vì nó nhanh chóng và dễ sử dụng để tách vật thể khỏi nền. Công cụ này hoạt động tốt với tài liệu được quét, hình ảnh y tế và kiểm tra lỗi sản phẩm trong nhà máy. 

Tuy nhiên, khi hình ảnh và video ngày càng phức tạp, các phương pháp xử lý hình ảnh cơ bản như ngưỡng hình ảnh có thể gặp khó khăn. Đó là lúc các mô hình thị giác máy tính tiên tiến có thể phát huy tác dụng. Các mô hình như YOLO11 có thể hiểu và thực hiện nhiều tác vụ hơn, phát hiện nhiều đối tượng cùng lúc và hoạt động theo thời gian thực, khiến chúng hữu ích cho nhiều trường hợp sử dụng.

Bạn muốn tìm hiểu thêm về AI? Hãy xem cộng đồngkho lưu trữ GitHub của chúng tôi. Khám phá các trang giải pháp của chúng tôi để tìm hiểu về AI trong robotthị giác máy tính trong nông nghiệp . Khám phá các tùy chọn cấp phép của chúng tôi và bắt đầu xây dựng với thị giác máy tính ngay hôm nay!

Hãy cùng xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của máy học

Bắt đầu miễn phí
Liên kết đã được sao chép vào clipboard