용어집

데이터 분석

데이터 분석이 데이터 품질을 최적화하고, 인사이트를 발견하고, 현명한 의사 결정을 지원함으로써 어떻게 AI와 ML의 성공을 이끄는지 알아보세요.

데이터 분석은 원시 데이터를 분석하여 해당 정보에 대한 결론을 내리는 과학입니다. 여기에는 데이터를 검사, 정리, 변환, 모델링하여 유용한 정보를 발견하고, 결론을 도출하며, 의사 결정을 지원하는 작업이 포함됩니다. 인공지능(AI)머신러닝(ML) 분야에서 데이터 분석은 고성능 모델을 구축, 학습 및 평가할 수 있게 해주는 기초 단계입니다. 분석가는 데이터 세트에서 패턴, 상관관계, 이상 징후를 발견함으로써 모델의 개발을 안내하고 그 효과를 보장하는 데 필요한 중요한 인사이트를 제공합니다.

이 프로세스는 일반적으로 원시 데이터를 실행 가능한 인사이트로 변환하는 라이프사이클을 따릅니다. 여기에는 누락된 값과 불일치를 처리하기 위한 데이터 전처리, 주요 특성을 이해하기 위한 탐색적 데이터 분석, 가설을 테스트하기 위한 통계 기법 적용이 포함됩니다. 분석을 통해 도출된 인사이트는 기능 엔지니어링, 적절한 모델 아키텍처 선택, 하이퍼파라미터 튜닝 수행과 같은 작업에 매우 중요합니다. 데이터 분석에는 일반적으로 네 가지 유형이 있으며, 각 유형은 과거부터 미래까지 서로 다른 수준의 인사이트를 제공합니다. 여기에는 설명적 분석, 진단적 분석, 예측적 분석, 처방적 분석이 포함되며, 하버드 비즈니스 스쿨 온라인과 같은 리소스에서 설명합니다.

실제 AI/ML 애플리케이션

데이터 분석은 수많은 AI 애플리케이션의 발전을 촉진하는 데 중요한 역할을 합니다:

  1. 의료 이미지 분석: AI 모델이 의료 스캔에서 이상 징후를 감지하기 전에 데이터 분석이 광범위하게 사용됩니다. 원시 이미지는 사전 처리(정규화, 크기 조정)되고 정리됩니다. 탐색적 분석은 뇌종양 데이터 세트와 같은 데이터 세트 내에서 이미지 품질이나 환자 인구 통계의 변화를 이해하는 데 도움이 됩니다. 분석은 관련 기능을 식별하고 전문가 주석과 비교하여 진단 모델의 성능(정확도, 민감도, 특이도)을 평가하여 임상 사용을 위한 개선 사항을 안내하는 데 도움이 됩니다. NIH 생물의학 데이터 과학 이니셔티브와 같은 리소스에서 그 중요성을 강조합니다. 의료 영상에서 종양 탐지에 YOLO 모델을 어떻게 사용할 수 있는지 알아보세요.
  2. AI 기반 리테일 재고 관리: 소매업체는 데이터 분석을 통해 재고 수준을 최적화하고 낭비를 줄입니다. 여기에는 과거 판매 데이터 분석, 계절별 트렌드 파악, 예측 모델링을 위한 고객 구매 패턴 이해 등이 포함됩니다. 또한, 분석된 시각적 데이터를 사용하여 학습된 모델을 기반으로 하는 컴퓨터 비전(CV) 시스템을 통해 실시간으로 선반 재고를 모니터링할 수 있습니다. 데이터 분석은 감지 정확도를 분석하고 재고 데이터를 판매 실적과 연결하여 이러한 시스템의 효율성을 평가함으로써 보다 스마트한 재고 보충 전략을 가능하게 합니다. 리테일용 Google Cloud AI의 업계 솔루션을 살펴보세요. Ultralytics는 AI로 소매업 효율성을 달성하기 위한 인사이트를 제공합니다.

관련 용어와 구별하기

  • 데이터 시각화: 데이터 시각화는 정보와 데이터를 그래픽으로 표현하는 것입니다. 차트, 그래프, 지도를 통해 결과를 전달하거나 데이터를 탐색하는 데 사용되는 데이터 분석의 구성 요소입니다. 분석이 데이터 검토의 전체 프로세스를 포괄하는 반면, 시각화는 결과를 이해하기 쉽게 만드는 데 사용되는 특정 도구입니다. Tableau와 같은 도구는 매력적인 비주얼리제이션을 만드는 데 널리 사용됩니다.
  • 데이터 마이닝: 데이터 마이닝은 광범위한 데이터 분석 분야에서 사용되는 특정 기술입니다. 데이터 마이닝은 정교한 알고리즘을 사용하여 대규모 데이터 집합에서 이전에 알려지지 않은 패턴과 추세를 발견하는 데 중점을 둡니다. 오라클의 설명에 따르면, 분석은 이렇게 발견된 패턴을 사용하여 정보에 입각한 의사 결정을 내리고 가설을 테스트합니다.
  • 머신 러닝: ML은 데이터로부터 학습하는 시스템을 구축하는 데 중점을 둔 AI의 하위 집합입니다. 데이터 분석은 데이터를 준비하고, 특징을 식별하고, 평균 정밀도(mAP)와 같은 메트릭으로 모델 결과를 평가함으로써 ML 라이프사이클에 투입되는 경우가 많습니다. 분석은 사람이 해석할 수 있는 인사이트를 제공하는 반면, ML은 이러한 인사이트를 사용하여 모델이 자율적으로 예측할 수 있도록 합니다.

데이터 분석은 의료부터 농업, 제조에 이르기까지 다양한 영역에서 효과적인 AI 및 ML 시스템을 구축, 개선 및 검증하는 데 필요한 중요한 인사이트를 제공합니다. 데이터 분석에서 모델 배포에 이르는 프로세스를 간소화할 수 있는 플랫폼이 바로 Ultralytics HUB입니다.

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨