데이터 시각화
강력한 시각화 기술과 도구를 사용하여 복잡한 AI/ML 데이터를 실행 가능한 인사이트로 전환하세요. Ultralytics 자세히 알아보세요!
데이터 시각화는 정보와 데이터를 그래픽으로 표현하는 것입니다. 인공 지능과 머신 러닝의 영역에서
및 머신 러닝 영역에서는 복잡한 수치 결과와 인간의 이해 사이에 중요한 가교 역할을 합니다. 다음을 통해
원시 데이터 세트, 모델 아키텍처, 성능 메트릭을 차트, 그래프와 같은 시각적 형식으로 변환합니다,
히트맵, 오버레이 이미지와 같은 시각적 형식으로 변환함으로써 개발자는 숨겨진 패턴을 발견하고, 상관관계를 파악하고, 인사이트를 효과적으로
인사이트를 효과적으로 전달할 수 있습니다. 이러한 관행은 최종 결과를 제시할 때뿐만 아니라 머신 러닝 파이프라인의 모든 단계에서
엔지니어는 모델을 디버깅하고 이해관계자는 자동화된 결정을 신뢰할 수 있습니다.
ML 수명 주기에서 시각화의 역할
효과적인 시각화는 머신러닝(ML) 워크플로우 전체에서 필수 불가결하며
머신 러닝(ML) 워크플로우 전반에 걸쳐 필수적입니다.
모델 상태와 데이터 품질을 진단하는 도구 역할을 합니다.
-
탐색적 데이터 분석(EDA): 훈련을 시작하기 전에 시각화 기법을 사용하여 다음을 수행합니다.
데이터 세트의 기본 구조를 이해합니다. 히스토그램과 분산형 차트는 데이터 세트 편향과 클래스 불균형을
데이터 세트 편향과 클래스 불균형을 식별하는 데 도움이 됩니다.
모델 성능을 왜곡할 수 있습니다. 다음과 같은 도구 Matplotlib 및 Seaborn과 같은 도구는 이러한 초기 조사를 위한
이러한 초기 조사를 위한 Python 에코시스템의 표준입니다.
-
모델 트레이닝 및 모니터링: 훈련 단계에서 엔지니어는 다음과 같은 메트릭을 track .
손실 함수 값 및 학습률과 같은 메트릭을 추적합니다.
다음과 같은 플랫폼을 사용하여 이러한 곡선을 실시간으로 시각화합니다.
Weights & Biases 와 같은 플랫폼을 사용하여 이러한 곡선을 실시간으로 시각화하면
과적합 또는 폭발과 같은 문제를 조기에 감지하고
그래디언트 등의 문제를 조기에 발견하여 계산 리소스를 절약할 수 있습니다.
-
모델 평가: 훈련 후 분석은 종종 혼동 행렬과
혼동 행렬과
수신기 작동 특성(ROC) 곡선
를 사용하여 분류 정확도를 평가합니다. 고차원 데이터의 경우 다음과 같은 기법이 사용됩니다.
t-SNE(분산 확률적 이웃 임베딩)
와 같은 기법은 차원을 줄여 모델이 특징 공간에서 유사한 데이터 포인트를 어떻게 클러스터링하는지 시각화합니다.
-
추론 및 해석 가능성: 마지막으로 모델의 예측을 시각화하면(예: 감지된 객체 주위에 경계 상자 그리기)
바운딩 박스 그리기 등 모델의 예측을 시각화하면
시스템의 기능을 즉각적으로 확인할 수 있습니다. 이는 다음과 같은 핵심 구성 요소입니다.
설명 가능한 AI(XAI)의 핵심 구성 요소입니다.
의사결정을 투명하게 만드는 것을 목표로 합니다.
실제 애플리케이션
데이터 시각화는 추상적인 AI 예측을 다양한 산업 분야에서 가시적인 애플리케이션으로 전환합니다.
-
의료 분야의 AI: 의료 분야에서는
진단에서는 시각화가 가장 중요합니다. 딥러닝 모델은
의료 이미지 분석 데이터(예: MRI
또는 CT 스캔과 같은 의료 이미지 분석 데이터를 분석하여 이상 징후를 식별합니다. 색상으로 구분된
세분화 마스크를 의료 이미지에 직접
AI 시스템은 종양이나 골절의 정확한 위치와 모양을 강조 표시합니다. 이 시각적 보조 기능은
방사선 전문의가 더 빠르고 정확한 진단을 내릴 수 있도록 도와줍니다.
국립 생의학 영상 및 생명공학 연구소.
-
자율주행 내비게이션: 자율 주행 차량과
자동차의 AI는 센서 데이터 시각화에 의존합니다.
데이터 시각화에 의존합니다. 엔지니어는 3D 시각화 도구를 사용하여 LiDAR의 포인트 클라우드와 카메라의 입력을 렌더링합니다. 투영하여
예측된 경로와 객체 추적 ID를 투영하여
도로의 가상 표현에 투영함으로써 개발자는 자동차가 보행자, 다른 차량, 교통 표지판을
차량 및 교통 표지판을 올바르게 인식하는지 확인할 수 있습니다. NVIDIA 드라이브와 같은 회사는
이러한 복잡한 자율주행 시나리오를 시각화하기 위한 시뮬레이션 환경을 제공합니다.
Ultralytics 예측 시각화하기
그리고 ultralytics 패키지는 컴퓨터 비전 작업의 시각화를 간소화합니다. 다음 예제
는 YOLO11 모델을 사용하여 이미지에 대한 추론을 실행하고
이미지에서 추론을 실행하고 경계 상자와 레이블을 사용하여 시각적 결과를 표시합니다.
import cv2
from ultralytics import YOLO
# Load the YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results by plotting detections on the image
for result in results:
# plot() returns a BGR numpy array of the image with drawn boxes
im_array = result.plot()
# Display the image (requires a GUI environment)
cv2.imshow("YOLO11 Visualization", im_array)
cv2.waitKey(0)
cv2.destroyAllWindows()
관련 용어 구분하기
-
데이터 분석: 이것은 유용한 정보를 발견하기 위한
유용한 정보를 발견하기 위해 데이터를 검사, 정리 및 모델링하는 광범위한 분야입니다. 데이터 시각화는
분석에서 결과를 표시하기 위해 사용되는 특정 도구 또는 방법입니다. IBM의
차이점을 자세히 살펴볼 수 있습니다.
데이터 분석과 데이터 시각화 비교.
-
컴퓨터 비전(CV): CV
는 기계에 의한 이미지의 자동화된 처리와 이해에 중점을 둡니다. CV의 시각화는 출력
레이어(예: 상자, 키포인트)를 표시하는 반면, CV 자체는 픽셀의
픽셀의 알고리즘 처리를 포함합니다.
-
대시보드: 대시보드: 대시보드는
와 관련이 있지만, 대시보드는 실시간 모니터링을 위해 여러 시각화를 단일 인터페이스로 집계하는 것을 포함합니다.
대시보드를 만드는 데는 Tableau 또는 Microsoft Power BI와 같은 도구가 자주 사용됩니다.
고객 유동인구 수 또는 제조 결함률과 같이 AI 모델에서 파생된 높은 수준의 KPI를 track 대시보드(
비율 등
데이터 시각화를 마스터하면 실무자는 원시 수치를 넘어
데이터 중심 AI 전략을 활용하여 보다 강력하고
해석 가능하고 영향력 있는 머신러닝 시스템을 구축할 수 있습니다.