Khám phá ngưỡng trong xử lý hình ảnh với hướng dẫn này. Tìm hiểu ngưỡng là gì, các kỹ thuật ngưỡng hình ảnh khác nhau, bao gồm ngưỡng Otsu.

Khám phá ngưỡng trong xử lý hình ảnh với hướng dẫn này. Tìm hiểu ngưỡng là gì, các kỹ thuật ngưỡng hình ảnh khác nhau, bao gồm ngưỡng Otsu.
Con người nhìn nhận hình ảnh như những bức tranh mạch lạc, giàu ý nghĩa, trong khi máy tính nhìn nhận chúng như những lưới điểm ảnh nhỏ li ti, những thành phần nhỏ nhất của một hình ảnh kỹ thuật số. Trong một quá trình gọi là xử lý hình ảnh , những điểm ảnh này có thể được điều chỉnh hoặc phân tích để cải thiện hình ảnh và trích xuất thông tin hữu ích.
Một kỹ thuật xử lý hình ảnh phổ biến được gọi là ngưỡng ảnh. Phương pháp này chuyển đổi ảnh thang độ xám (mỗi điểm ảnh đại diện cho một sắc thái xám) thành ảnh đen trắng bằng cách so sánh từng điểm ảnh với một giá trị đã đặt. Phương pháp này tạo ra sự phân tách rõ ràng giữa các vùng quan trọng và nền.
Ngưỡng ảnh thường được sử dụng trong phân đoạn ảnh , một kỹ thuật chia ảnh thành các vùng có ý nghĩa để dễ phân tích hơn. Đây thường là một trong những bước đầu tiên giúp máy móc diễn giải dữ liệu hình ảnh. Trong bài viết này, chúng ta sẽ tìm hiểu ngưỡng ảnh là gì, cách thức hoạt động và ứng dụng của nó trong các tình huống thực tế. Cùng bắt đầu nào!
Trước khi đi sâu vào cách thức hoạt động của ngưỡng, trước tiên chúng ta hãy xem xét kỹ hơn những ý tưởng cơ bản đằng sau nó và cách nó được sử dụng trong xử lý hình ảnh.
Giả sử bạn đang làm việc với một hình ảnh và muốn tách các đối tượng trong đó khỏi nền. Một cách để thực hiện việc này là sử dụng ngưỡng. Nó đơn giản hóa hình ảnh sao cho mỗi điểm ảnh hoặc hoàn toàn đen hoặc hoàn toàn trắng. Kết quả là một hình ảnh nhị phân, trong đó mỗi điểm ảnh có giá trị 0 (đen) hoặc 255 (trắng). Bước này thường hữu ích trong xử lý ảnh vì nó làm nổi bật rõ ràng các phần quan trọng của hình ảnh.
Tương tự, nếu bạn muốn hiểu cách các giá trị độ sáng được phân bổ trên một hình ảnh, biểu đồ histogram có thể hữu ích. Đây là một biểu đồ hiển thị tần suất xuất hiện của từng cường độ điểm ảnh, từ đen (0) đến trắng (255).
Bằng cách xem biểu đồ histogram, bạn có thể biết ảnh tối, sáng hay ở mức trung bình. Điều này giúp bạn dễ dàng chọn ngưỡng màu phù hợp khi chuyển ảnh sang đen trắng, vì bạn có thể nhận ra các họa tiết và mức độ tương phản chỉ trong nháy mắt.
Sau khi hình ảnh được phân ngưỡng, nó sẽ được chia thành hai phần: tiền cảnh và hậu cảnh. Tiền cảnh, thường được hiển thị bằng màu trắng, làm nổi bật các yếu tố quan trọng, chẳng hạn như văn bản, hình dạng hoặc đối tượng bạn muốn phát hiện. Hậu cảnh, được hiển thị bằng màu đen, là tất cả các yếu tố còn lại. Sự phân tách này giúp máy tính tập trung vào những gì quan trọng trong hình ảnh.
Như đã đề cập trước đó, phân đoạn ảnh chia hình ảnh thành các vùng có ý nghĩa dựa trên các đặc điểm như độ sáng hoặc kết cấu. Ngưỡng là một cách đơn giản để thực hiện việc này và thường là một trong những bước đầu tiên trong quy trình xử lý thị giác máy tính.
Thị giác máy tính là một nhánh của AI, cho phép máy móc xử lý và diễn giải dữ liệu hình ảnh, tương tự như con người. Bằng cách sử dụng ngưỡng ở giai đoạn đầu, hệ thống thị giác máy tính có thể tách vật thể khỏi nền, giúp các bước sau, chẳng hạn như phát hiện hoặc nhận dạng, hoạt động chính xác hơn.
Bây giờ chúng ta đã hiểu rõ hơn về ngưỡng là gì, hãy cùng tìm hiểu cách ngưỡng hóa hình ảnh và các loại ngưỡng hóa khác nhau trong xử lý hình ảnh.
Ví dụ, ngưỡng toàn cục là một trong những cách dễ nhất để tạo ảnh nhị phân. Nó áp dụng một giá trị cường độ duy nhất trên toàn bộ ảnh. Các điểm ảnh sáng hơn ngưỡng này sẽ chuyển sang màu trắng, trong khi các điểm ảnh tối hơn sẽ chuyển sang màu đen. Điều này giúp tách vật thể khỏi nền.
Tính năng này hoạt động tốt nhất khi hình ảnh có ánh sáng đều và độ tương phản mạnh. Tuy nhiên, trong điều kiện ánh sáng không đồng đều hoặc độ tương phản thấp, một ngưỡng duy nhất có thể bỏ sót chi tiết hoặc làm mờ các cạnh.
Để xử lý vấn đề này, các phương pháp như ngưỡng Otsu được sử dụng. Thay vì đặt giá trị thủ công, phương pháp ngưỡng Otsu sẽ phân tích biểu đồ histogram của hình ảnh và chọn ngưỡng phù hợp nhất để phân tách cường độ điểm ảnh thành tiền cảnh và hậu cảnh.
Không giống như ngưỡng toàn cục, ngưỡng thích ứng hoặc ngưỡng cục bộ tính toán giá trị ngưỡng riêng biệt cho các phần khác nhau của hình ảnh. Điều này giúp hiệu quả hơn đối với hình ảnh có ánh sáng không đồng đều, chẳng hạn như tài liệu được quét có bóng hoặc bề mặt có kết cấu.
Phương pháp này hoạt động bằng cách chia hình ảnh thành các vùng nhỏ và tính toán ngưỡng cục bộ cho mỗi khối, giúp duy trì độ tương phản giữa tiền cảnh và hậu cảnh. Phương pháp này được sử dụng rộng rãi trong các tác vụ như nhận dạng văn bản, chụp ảnh y tế và kiểm tra bề mặt, trong đó ánh sáng thay đổi trên toàn bộ hình ảnh.
Một số phương pháp phổ biến để ngưỡng thích ứng trong xử lý ảnh bao gồm ngưỡng trung bình thích ứng và ngưỡng Gaussian thích ứng. Trong ngưỡng trung bình thích ứng, cường độ điểm ảnh trung bình trong một vùng lân cận cục bộ được sử dụng làm ngưỡng cho điểm ảnh trung tâm. Mặt khác, ngưỡng Gaussian thích ứng sử dụng giá trị trung bình có trọng số với cửa sổ Gaussian, ưu tiên các điểm ảnh gần tâm hơn.
Tiếp theo, chúng ta hãy cùng khám phá ngưỡng hình ảnh được sử dụng như thế nào trong các ứng dụng thực tế.
Sách cũ và thư viết tay thường được quét để lưu trữ hoặc chuyển đổi thành văn bản kỹ thuật số bằng OCR (Nhận dạng Ký tự Quang học) , một công nghệ đọc các ký tự in hoặc viết tay. Trước khi có thể trích xuất văn bản, tài liệu thường cần được làm sạch hoặc xử lý sơ bộ. Hình ảnh được quét thường có bóng, mực bị phai hoặc ánh sáng không đều, gây khó khăn cho việc nhận dạng ký tự.
Để cải thiện độ rõ nét, ngưỡng được sử dụng để chuyển đổi hình ảnh thang độ xám sang định dạng nhị phân, giúp tách biệt văn bản khỏi nền. Các vùng tối hơn, chẳng hạn như chữ cái, sẽ chuyển sang màu đen, trong khi nền sáng hơn sẽ chuyển sang màu trắng - giúp hệ thống OCR đọc văn bản dễ dàng hơn nhiều.
Tương tự, trong chẩn đoán hình ảnh y tế, ngưỡng ảnh thường được sử dụng để phân lập các cấu trúc cụ thể trong ảnh chụp, chẳng hạn như xương hoặc phổi trong ảnh X-quang. Bằng cách chuyển đổi ảnh thang độ xám sang định dạng nhị phân, việc tách các vùng quan tâm khỏi mô xung quanh và chuẩn bị hình ảnh cho các phân tích sâu hơn trở nên dễ dàng hơn. Trong các trường hợp phức tạp hơn, ngưỡng ảnh đa cấp có thể được áp dụng để chia hình ảnh thành nhiều vùng riêng biệt, cho phép xác định đồng thời các loại mô hoặc cấu trúc khác nhau.
Sau đây là một số lợi ích chính của việc sử dụng ngưỡng trong xử lý hình ảnh:
Mặc dù ngưỡng ảnh hữu ích trong nhiều trường hợp, nhưng nó cũng đi kèm với một số hạn chế nhất định. Dưới đây là một số thách thức liên quan đến ngưỡng ảnh cần cân nhắc:
Ngưỡng hoạt động tốt cho các tác vụ phân đoạn đơn giản trong điều kiện được kiểm soát. Tuy nhiên, nó thường gặp khó khăn khi xử lý các hình ảnh phức tạp có nhiều đối tượng hoặc nhiễu nền. Vì dựa trên các quy tắc cố định, ngưỡng thiếu tính linh hoạt cần thiết cho hầu hết các ứng dụng thực tế.
Để vượt qua những giới hạn này, nhiều hệ thống tiên tiến hiện nay sử dụng thị giác máy tính. Trái ngược với ngưỡng, các mô hình AI thị giác được đào tạo để phát hiện các mẫu và đặc điểm phức tạp, giúp chúng chính xác và thích ứng hơn nhiều.
Ví dụ, các mô hình thị giác máy tính như Ultralytics YOLO11 có thể phát hiện vật thể và phân đoạn hình ảnh theo thời gian thực. Điều này khiến chúng trở nên lý tưởng cho các nhiệm vụ như phát hiện tín hiệu giao thông trên xe tự hành hoặc xác định các vấn đề về cây trồng trong nông nghiệp.
Đặc biệt, YOLO11 hỗ trợ một loạt các tác vụ thị giác máy tính , chẳng hạn như phân đoạn thực thể, trong đó mỗi đối tượng trong ảnh được phân đoạn riêng biệt. Nó cũng có thể thực hiện các tác vụ thị giác khác, bao gồm ước tính tư thế (xác định vị trí hoặc tư thế của đối tượng) và theo dõi đối tượng (theo dõi đối tượng khi nó di chuyển qua các khung hình video).
Trong khi ngưỡng hoạt động tốt đối với các tác vụ đơn giản hoặc thử nghiệm các ý tưởng ban đầu, các ứng dụng cần tốc độ, độ chính xác và tính linh hoạt thường được xử lý tốt hơn bằng thị giác máy tính.
Ngưỡng ảnh là một công cụ quan trọng trong xử lý ảnh vì nó nhanh chóng và dễ sử dụng để tách vật thể khỏi nền. Công cụ này hoạt động tốt với tài liệu được quét, hình ảnh y tế và kiểm tra lỗi sản phẩm trong nhà máy.
Tuy nhiên, khi hình ảnh và video ngày càng phức tạp, các phương pháp xử lý hình ảnh cơ bản như ngưỡng hình ảnh có thể gặp khó khăn. Đó là lúc các mô hình thị giác máy tính tiên tiến có thể phát huy tác dụng. Các mô hình như YOLO11 có thể hiểu và thực hiện nhiều tác vụ hơn, phát hiện nhiều đối tượng cùng lúc và hoạt động theo thời gian thực, khiến chúng hữu ích cho nhiều trường hợp sử dụng.
Bạn muốn tìm hiểu thêm về AI? Hãy xem cộng đồng và kho lưu trữ GitHub của chúng tôi. Khám phá các trang giải pháp của chúng tôi để tìm hiểu về AI trong robot và thị giác máy tính trong nông nghiệp . Khám phá các tùy chọn cấp phép của chúng tôi và bắt đầu xây dựng với thị giác máy tính ngay hôm nay!