Trực Quan Hóa Dữ Liệu
Chuyển đổi dữ liệu AI/ML phức tạp thành thông tin chi tiết hữu ích bằng các kỹ thuật và công cụ trực quan hóa mạnh mẽ. Tìm hiểu thêm tại Ultralytics!
Trực quan hóa dữ liệu là thực hành biểu diễn dữ liệu và thông tin bằng đồ họa. Trong bối cảnh trí tuệ nhân tạo (AI) và học máy (ML), nó là một công cụ không thể thiếu để làm cho dữ liệu phức tạp, kiến trúc mô hình và các số liệu hiệu suất dễ hiểu đối với con người. Bằng cách chuyển đổi các con số thô và các khái niệm trừu tượng thành biểu đồ, đồ thị và bản đồ, các nhà phát triển và nhà nghiên cứu có thể xác định các mẫu, phát hiện các điểm bất thường và truyền đạt thông tin chi tiết hiệu quả hơn nhiều. Trực quan hóa đóng một vai trò quan trọng trong toàn bộ quy trình làm việc ML, từ khám phá dữ liệu và tiền xử lý ban đầu đến đánh giá mô hình và diễn giải kết quả. Nó giúp chuyển đổi các đầu ra phức tạp từ các mô hình thành thông tin chi tiết rõ ràng, có thể hành động, một khái niệm được khám phá thêm trong blog của chúng tôi về nâng cao các ứng dụng thị giác máy tính bằng hình ảnh trực quan.
Tầm quan trọng trong vòng đời AI/ML
Trực quan hóa dữ liệu không chỉ là tạo ra đồ họa đẹp mắt; nó là một thành phần cơ bản của quy trình học sâu. Trong giai đoạn đầu của một dự án, trực quan hóa được sử dụng cho Phân tích Dữ liệu Khám phá (EDA) để hiểu sự phân phối của tập dữ liệu và xác định các vấn đề tiềm ẩn như độ lệch tập dữ liệu hoặc nhu cầu tăng cường dữ liệu. Trong suốt quá trình huấn luyện mô hình, các công cụ như TensorBoard giúp trực quan hóa các số liệu như đường cong hàm mất mát và độ chính xác theo thời gian. Sau khi huấn luyện, các hình ảnh trực quan như ma trận nhầm lẫn hoặc Đường cong Đặc tính Hoạt động của Máy thu (ROC) là rất cần thiết để đánh giá hiệu suất của mô hình. Các nền tảng như Ultralytics HUB tích hợp các hình ảnh trực quan này để cung cấp trải nghiệm MLOps liền mạch.
Các ứng dụng AI/ML thực tế
- Phân tích hình ảnh y tế: Trong AI chăm sóc sức khỏe, trực quan hóa giúp giải thích các ảnh chụp y tế phức tạp. Một mô hình object detection được huấn luyện trên một tập dữ liệu như tập dữ liệu Brain Tumor có thể xuất ra các hộp giới hạn xác định các bất thường tiềm ẩn. Trực quan hóa các hộp này được phủ trực tiếp lên ảnh chụp MRI hoặc CT cho phép các bác sĩ радиолог nhanh chóng đánh giá các phát hiện của mô hình, hỗ trợ chẩn đoán. Hơn nữa, trực quan hóa các cụm kết quả bệnh nhân dựa trên các đặc điểm hình ảnh có thể giúp xác định các loại bệnh phụ. AI trong Chăm sóc sức khỏe phụ thuộc nhiều vào các công cụ hỗ trợ trực quan như vậy. Bạn có thể khám phá thêm các ứng dụng tại Viện Quốc gia về Hình ảnh Y sinh và Kỹ thuật Sinh học (NIBIB).
- Phát triển xe tự hành: Hệ thống xe tự lái xử lý lượng lớn dữ liệu cảm biến. Trực quan hóa được sử dụng rộng rãi trong quá trình phát triển và thử nghiệm. Các kỹ sư trực quan hóa đám mây điểm LiDAR, chữ ký radar và nguồn cấp dữ liệu camera trong mô phỏng 3D của môi trường. Các đối tượng được phát hiện (ô tô, người đi bộ, người đi xe đạp) được xác định bởi các mô hình như YOLO thường được hiển thị bằng các hộp giới hạn, đường dẫn theo dõi và điểm tin cậy, cho phép các nhà phát triển xác minh độ chính xác và an toàn của hệ thống nhận thức trong các tình huống khác nhau. Xem các ví dụ trong các giải pháp AI trong ngành ô tô và tìm hiểu về các phương pháp tiếp cận của ngành từ các công ty như Mobileye.
Phân biệt với các thuật ngữ liên quan
- Phân tích dữ liệu (Data Analytics): Đây là một lĩnh vực rộng hơn bao gồm toàn bộ quá trình kiểm tra, làm sạch, chuyển đổi và mô hình hóa dữ liệu để khám phá thông tin hữu ích và hỗ trợ việc ra quyết định. Trực quan hóa dữ liệu là một thành phần hoặc công cụ được sử dụng trong phân tích dữ liệu để trình bày các phát hiện hoặc khám phá dữ liệu, nhưng phân tích cũng bao gồm mô hình thống kê, kiểm định giả thuyết và các phương pháp phi trực quan khác. Tìm hiểu thêm về các nguyên tắc cơ bản của phân tích dữ liệu (data analytics fundamentals).
- Xử lý ảnh: Lĩnh vực này tập trung vào việc thao tác hình ảnh kỹ thuật số để nâng cao chúng hoặc trích xuất thông tin trực tiếp từ dữ liệu pixel (ví dụ: lọc, phát hiện cạnh, điều chỉnh độ tương phản). Mặc dù trực quan hóa có thể liên quan đến việc hiển thị hình ảnh, nhưng trực quan hóa dữ liệu trong AI/ML thường liên quan đến việc biểu diễn dữ liệu trừu tượng (như số liệu hiệu suất mô hình hoặc mối quan hệ đặc trưng) hoặc phủ các diễn giải mô hình (như phát hiện) lên hình ảnh, thay vì biến đổi chính hình ảnh. Đọc về sự khác biệt trong bài đăng trên blog về Computer Vision so với Xử lý ảnh này.
- Phân tích dữ liệu thăm dò (EDA): EDA là quá trình phân tích bộ dữ liệu để hiểu các đặc điểm chính của chúng, thường sử dụng các phương pháp trực quan. Các kỹ thuật trực quan hóa dữ liệu là các công cụ chính được sử dụng trong EDA để khám phá các mẫu, phát hiện các điểm bất thường, kiểm tra các giả thuyết và kiểm tra các giả định. Hướng dẫn về tiền xử lý dữ liệu được chú thích đề cập đến các khái niệm EDA liên quan đến bộ dữ liệu thị giác máy tính.