Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Hướng dẫn

Điện toán hình ảnh là gì? Giới thiệu nhanh

Tìm hiểu điện toán hình ảnh là gì, cách thức hoạt động và cách nó được áp dụng trong chăm sóc sức khỏe, lái xe tự động và các hệ thống thông minh hiện đại khác.

ABAbirami Vina
7 min read
Máy móc diễn giải dữ liệu thị giác thông qua điện toán hình ảnh

Khi bạn đi dạo qua một trung tâm thương mại hoặc một con phố đông đúc, các camera gắn phía trên lối vào và lối đi bộ sẽ ghi lại mọi hoạt động. Chúng tạo ra dữ liệu hình ảnh mỗi giây, và hầu hết thời gian, chúng ta thậm chí không để ý đến điều đó.

Luồng dữ liệu liên tục này cung cấp cho các hệ thống hỗ trợ AI hiện đại, từ hệ thống an ninh thông minh đến xe tự lái. Những đổi mới này được thúc đẩy bởi điện toán hình ảnh, một lĩnh vực linh hoạt kết hợp giữa khoa học máy tính, toán học và vật lý.

Điện toán hình ảnh giúp máy móc hiểu được những gì chúng thấy trong một hình ảnh. Nó cho phép các hệ thống nhận diện những gì đang xảy ra trong một khung cảnh và quyết định cách vận hành hoặc phản hồi, chẳng hạn như dừng xe tự lái khi xuất hiện vật cản.

Trong bài viết này, chúng ta sẽ khám phá điện toán hình ảnh là gì và cách nó được sử dụng trong các hệ thống trí tuệ nhân tạo (AI) tiên tiến. Hãy cùng bắt đầu!

Link to this sectionTìm hiểu về điện toán hình ảnh#

Điện toán hình ảnh là quá trình thu thập, xử lý và phân tích hình ảnh bằng các thuật toán tiên tiến. Nó coi hình ảnh là dữ liệu mà máy móc có thể hiểu và làm việc cùng.

Nói cách khác, mỗi hình ảnh được xử lý dưới dạng một lưới các con số. Điều này được thực hiện bằng cách chuyển đổi các pixel, đơn vị nhỏ nhất của hình ảnh, thành một ma trận gồm các hàng và cột. Mỗi pixel có một giá trị số cho máy biết độ sáng hoặc độ tối của một vùng cụ thể trong hình ảnh.

Cách tổ chức các giá trị này phụ thuộc vào việc hình ảnh là ảnh xám hay ảnh màu. Trong ảnh xám, các giá trị pixel thường nằm trong khoảng từ 0 (đen) đến 255 (trắng). Trong ảnh màu, nhiều ma trận được sử dụng để đại diện cho các kênh màu khác nhau, chẳng hạn như Đỏ, Xanh lục và Xanh lam (RGB) hoặc Sắc độ, Độ bão hòa và Giá trị (HSV).

Biểu diễn ma trận của hình ảnh kỹ thuật số

Hình 1. Biểu diễn ma trận của hình ảnh (Nguồn)

Ngoài các ma trận pixel, một hình ảnh thường chứa thông tin ngữ cảnh ẩn, được gọi là metadata. Metadata cung cấp các thông tin chi tiết quan trọng như độ phân giải hình ảnh, độ sâu bit, cài đặt máy ảnh hoặc cảm biến và thời gian chính xác mà hình ảnh được chụp. Hình ảnh được lưu trữ ở các định dạng tệp cụ thể để bảo toàn cả dữ liệu hình ảnh và metadata.

Ví dụ, trong điện toán hình ảnh y sinh, hình ảnh thường được lưu trữ bằng định dạng Digital Imaging and Communications in Medicine (DICOM). DICOM kết hợp dữ liệu hình ảnh trực quan với thông tin bệnh nhân, chẳng hạn như chi tiết nhận dạng và cài đặt thiết bị, đảm bảo rằng phân tích hình ảnh y tế chính xác, nhất quán và an toàn.

Link to this sectionCách thức hoạt động của điện toán hình ảnh#

Bây giờ chúng ta đã hiểu rõ hơn về điện toán hình ảnh là gì, hãy cùng tìm hiểu các bước được sử dụng để chuyển đổi nguồn cấp dữ liệu camera thành những thông tin chi tiết hữu ích.

Mặc dù quy trình thực tế có thể khác nhau tùy theo ứng dụng, hầu hết các hệ thống điện toán hình ảnh đều tuân theo các giai đoạn chính sau:

  • Thu thập hình ảnh: Đầu tiên, dữ liệu trực quan được thu thập bằng camera và cảm biến hoặc thu thập từ các tập dữ liệu hình ảnh nguồn mở.
  • Tiền xử lý hình ảnh: Sau đó, các hình ảnh đã thu thập được thay đổi kích thước, khử nhiễu, tăng cường và chuyển đổi sang một không gian màu cụ thể để tiêu chuẩn hóa đầu vào.
  • Trích xuất đặc trưng: Các thuật toán học sâu (deep learning) được sử dụng để học các mẫu quan trọng trong hình ảnh, chẳng hạn như cạnh, hình dạng và kết cấu.
  • Diễn giải: Các đặc trưng đã trích xuất được phân tích để thực hiện các tác vụ như phát hiện đối tượng, phân đoạn hình ảnh và theo dõi đối tượng.
  • Đầu ra: Cuối cùng, hệ thống tạo ra các đầu ra có cấu trúc, chẳng hạn như nhãn lớp hoặc khung bao (bounding box), và trình bày chúng theo cách dễ hiểu đối với con người hoặc các hệ thống khác để trực quan hóa.

Link to this sectionĐiện toán hình ảnh vs thị giác máy tính vs xử lý hình ảnh#

Khi bạn bắt gặp thuật ngữ điện toán hình ảnh, bạn cũng có thể thấy các thuật ngữ như xử lý hình ảnh và thị giác máy tính. Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau, chúng mô tả các cách tương tác khác nhau của hệ thống AI với dữ liệu trực quan.

Ví dụ, xử lý hình ảnh tập trung vào việc tăng cường hình ảnh hoặc cải thiện chất lượng của hình ảnh đầu vào bằng các thao tác cơ bản như loại bỏ nhiễu, thay đổi kích thước và điều chỉnh độ tương phản. Trong khi đó, thị giác máy tính, một nhánh của AI, được xây dựng dựa trên xử lý hình ảnh bằng cách cho phép máy móc nhận diện đối tượng, diễn giải khung cảnh và hiểu những gì đang xảy ra trong hình ảnh hoặc video.

Điện toán hình ảnh kết hợp xử lý hình ảnh và thị giác máy tính để chuyển đổi dữ liệu trực quan thành các đầu ra có ý nghĩa và có thể sử dụng được cho các hệ thống thông minh.

So sánh giữa xử lý ảnh, thị giác máy tính và điện toán hình ảnh

Hình 2. Xử lý hình ảnh vs thị giác máy tính vs điện toán hình ảnh. Hình ảnh do tác giả thực hiện.

Link to this sectionĐiện toán hình ảnh được triển khai như thế nào ngày nay#

Tiếp theo, hãy cùng xem xét cách điện toán hình ảnh được triển khai ngày nay.

Trong những giai đoạn đầu của điện toán hình ảnh, các đặc trưng như cạnh, góc và kết cấu được xác định thủ công bằng cách sử dụng các thuật toán dựa trên quy tắc và được tạo bởi con người. Mặc dù các phương pháp này hoạt động khá tốt trong môi trường kiểm soát, nhưng chúng gặp khó khăn trong việc mở rộng và thích ứng với các điều kiện phức tạp trong thế giới thực.

Các hệ thống điện toán hình ảnh hiện đại giải quyết những hạn chế này bằng cách sử dụng các phương pháp dựa trên học sâu. Các model như mạng thần kinh tích chập (CNN) và vision transformer tự động học các đặc trưng liên quan từ các tập dữ liệu hình ảnh lớn. Điều này cho phép chúng thực hiện các tác vụ như phát hiện đối tượng, phân đoạn cá thể và theo dõi đối tượng với độ chính xác và độ bền cao hơn.

Ngày nay, các quy trình điện toán hình ảnh thường dựa trên các vision model thời gian thực được thiết kế để triển khai trong các hệ thống AI tiên tiến. Ví dụ, các vision AI model như Ultralytics YOLO26 mang đến khả năng thị giác máy tính nhanh chóng và hiệu quả như phát hiện đối tượng và phân đoạn cá thể trên cả thiết bị biên (edge device) và môi trường đám mây.

YOLO26 phát hiện và phân đoạn các đối tượng trong hình ảnh

Hình 3. Ví dụ về việc sử dụng YOLO26 để phát hiện và phân đoạn đối tượng trong hình ảnh

Link to this sectionCác ứng dụng thực tế của điện toán hình ảnh#

Điện toán hình ảnh đang được sử dụng rộng rãi trong các ứng dụng thực tế để hiểu và hành động dựa trên dữ liệu trực quan. Hãy cùng khám phá cách điện toán hình ảnh được áp dụng trên các lĩnh vực khác nhau.

Link to this sectionĐiện toán hình ảnh y tế để phát hiện bệnh sớm#

Điện toán hình ảnh có thể giúp các bác sĩ và bác sĩ lâm sàng phát hiện bệnh sớm hơn và phân tích các bản quét y tế hiệu quả hơn. Các hệ thống chăm sóc sức khỏe tiên tiến này có thể nhanh chóng xử lý dữ liệu hình ảnh y tế như X-quang và chụp cộng hưởng từ (MRI) và thường mang lại kết quả nhất quán hơn so với việc xem xét thủ công.

Ví dụ, các model như Ultralytics YOLO26 có thể được huấn luyện trên các tập dữ liệu hình ảnh X-quang ngực lớn để học các mẫu liên quan đến nhiễm trùng và bất thường. Sau khi được huấn luyện, các model này có thể giúp xác định xem bản quét có vẻ bình thường hay cho thấy dấu hiệu của các tình trạng như viêm phổi hoặc COVID-19.

Link to this sectionĐiện toán hình ảnh cho xe tự lái#

Xe tự lái sử dụng điện toán hình ảnh để hiểu những gì đang xảy ra xung quanh chúng và đưa ra quyết định lái xe. Công nghệ này chuyển đổi cảnh quay thô từ camera thành thông tin thời gian thực giúp phương tiện di chuyển an toàn và mượt mà.

Điện toán hình ảnh thường được sử dụng trong các hệ thống hỗ trợ lái xe tiên tiến (ADAS). Thay vì chỉ ghi lại video, các module này phân tích từng khung hình để phát hiện vạch kẻ đường, các phương tiện khác, người đi bộ và vật cản. Điều này giúp xe có thể phản ứng với các điều kiện đường xá thay đổi với rất ít sự can thiệp của con người.

Một trường hợp sử dụng phổ biến khác là kết hợp hình ảnh từ nhiều camera để tạo ra cái nhìn 360 độ xung quanh xe. Điện toán hình ảnh giúp sửa lỗi méo ống kính, cải thiện độ rõ nét của hình ảnh và cân bằng độ sáng và màu sắc trên tất cả các nguồn cấp dữ liệu camera. Kết quả là một cái nhìn rõ ràng, liền mạch cho phép phương tiện điều hướng an toàn, ngay cả trong điều kiện thời tiết xấu hoặc ánh sáng yếu.

Ghép ảnh sử dụng deep learning

Hình 4. Ghép ảnh sử dụng học sâu (Nguồn)

Link to this sectionƯu điểm và nhược điểm của điện toán hình ảnh#

Dưới đây là một số ưu điểm của điện toán hình ảnh:

  • Khả năng mở rộng: Sau khi được huấn luyện, các hệ thống điện toán hình ảnh có thể phân tích khối lượng lớn dữ liệu trực quan liên tục và ở quy mô lớn.
  • Ra quyết định: Nó hỗ trợ các ứng dụng nhạy cảm với thời gian như lái xe tự động, sàng lọc y tế và giám sát công nghiệp.
  • Hiệu quả chi phí theo thời gian: Mặc dù thiết lập ban đầu có thể đắt đỏ, nhưng phân tích trực quan tự động có thể giảm chi phí vận hành lâu dài.

Mặc dù có nhiều lợi ích liên quan đến điện toán hình ảnh, nhưng cũng có một số hạn chế. Dưới đây là một số yếu tố cần xem xét:

  • Chất lượng dữ liệu: Các phương pháp điện toán hình ảnh phụ thuộc rất nhiều vào việc dán nhãn chính xác và các tập dữ liệu chất lượng cao, vốn có thể tốn kém và mất thời gian để tạo ra.
  • Độ nhạy với điều kiện môi trường: Những thay đổi về ánh sáng, vật cản, nhòe do chuyển động, thời tiết hoặc góc máy ảnh có thể tác động tiêu cực đến hiệu suất của model.
  • Khả năng giải thích hạn chế: Các model hình ảnh dựa trên học sâu có thể hoạt động như những hộp đen, khiến việc giải thích cách đưa ra quyết định trở nên khó khăn.

Link to this sectionCác điểm chính cần lưu ý#

Điện toán hình ảnh đã phát triển từ xử lý hình ảnh cơ bản thành một công nghệ cho phép các hệ thống AI nhận thức và hiểu thế giới thực trong thời gian thực. Khi học sâu tiếp tục phát triển, điện toán hình ảnh đang trở thành một phần thiết yếu trong việc xây dựng các bộ công cụ và ứng dụng thông minh, thực tế hơn.

Tham gia cộng đồng của chúng tôi và xem kho lưu trữ GitHub để tìm hiểu về AI. Khám phá các trang giải pháp của chúng tôi để đọc về các ứng dụng của AI trong nông nghiệpthị giác máy tính trong logistics. Khám phá các tùy chọn cấp phép của chúng tôi và bắt đầu xây dựng các vision AI model.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning