Yolo 비전 선전
선전
지금 참여하기
용어집

데이터 분석

데이터 분석이 데이터 품질을 최적화하고, 통찰력을 발견하며, 스마트 의사 결정을 가능하게 함으로써 AI 및 ML 성공을 어떻게 이끄는지 알아보세요.

데이터 분석은 데이터를 검사, 정리, 변환, 모델링하여 유용한 정보를 발견하고, 결론을 내리고, 의사 결정을 지원하기 위해 유용한 정보를 발견하고, 결론을 도출하며, 의사 결정을 지원하는 체계적인 프로세스입니다. 데이터 분석은 인공 지능(AI)머신 러닝(ML) 영역에서 데이터 분석은 원시 정보를 고성능 모델로 변환할 수 있는 중요한 기반 역할을 합니다. 개발자는 학습 데이터를 엄격하게 개발자는 학습 데이터를 엄격하게 검토하여 숨겨진 패턴을 발견하고, 데이터 세트의 편향을 파악하고, 학습에 가장 효과적인 기능을 학습에 가장 효과적인 기능을 결정할 수 있습니다.

AI의 분석 수명 주기

원시 데이터에서 실행 가능한 인사이트로의 여정에는 일반적으로 몇 가지 주요 단계가 포함됩니다. 그 시작은 다음과 같습니다. 데이터 전처리: 원시 데이터 집합이 누락된 값과 불일치를 처리하기 위해 누락된 값과 불일치를 처리하기 위해 정리되며, 종종 다음과 같은 라이브러리를 사용합니다. Pandas 와 같은 라이브러리를 사용하는 경우가 많습니다. 그 다음에는 피처 엔지니어링이 이어지며, 원시 속성을 모델을 위한 의미 있는 입력으로 변환하는 피처 엔지니어링이 이어집니다.

이러한 맥락에서 분석은 다음과 같은 기관에서 설명하는 네 가지 유형으로 분류되는 경우가 많습니다. 하버드 비즈니스 스쿨:

  • 설명적 분석: 과거 데이터를 살펴보고 무슨 일이 일어났는지 이해합니다(예: 과거 분석 모델 정확도 분석 등).
  • 진단 분석: 발생 원인을 조사합니다(예: 진단을 통해 과적합).
  • 예측 분석: 통계 모델을 사용하여 미래 결과를 예측합니다(예, 판매 예측 모델링 ).
  • 규범적 분석: 예측에 따라 취해야 할 조치를 제안합니다(예: 자동 재고 보충).

For 컴퓨터 비전(CV) 특히 분석 는 엔지니어가 클래스 분포와 객체 속성을 이해하는 데 도움이 됩니다. 분석은 ultralytics 라이브러리 를 사용하여 데이터 집합 통계를 빠르게 탐색할 수 있습니다.

from ultralytics.data.explorer import Explorer

# Initialize Explorer with a standard dataset like COCO8
exp = Explorer(data="coco8.yaml")

# Generate and print statistics to understand class distribution
stats = exp.stats()
print(stats["class_distribution"])

실제 애플리케이션

데이터 분석은 지능형 시스템 개발에 정보를 제공함으로써 수많은 산업 분야에서 혁신을 주도합니다:

  1. 의료 이미지 분석:의료 분야에서 분석은 다음과 같은 복잡한 이미징 데이터 세트를 처리하는 데 필수적입니다. 뇌종양 데이터 세트. 연구자들은 분석을 통해 이미지 특징과 환자 결과의 상관관계를 파악하여 진단 도구를 개선합니다. 미국 미국 국립보건원(NIH) 은 정밀 의학 발전에서 데이터 과학의 역할을 강조합니다. 정밀 의학을 발전시키는 데 있어 데이터 과학의 역할을 강조합니다. 이러한 데이터 세트를 분석함으로써 YOLO11 모델을 학습시켜 다음과 같은 작업을 수행할 수 있습니다. 종양 탐지 같은 작업을 높은 감도로 수행할 수 있습니다.

  2. 리테일 분야의 AI:리테일러는 분석을 활용하여 공급망을 최적화하고 고객 경험을 개인화합니다. 비디오 피드에 비디오 피드에 객체 감지 기능을 적용함으로써 실시간으로 재고 수준을 track 수 있습니다. 다음과 같은 플랫폼 리테일용Google Cloud는 이러한 분석을 통합하여 수요를 예측하고 낭비를 줄입니다. 이러한 데이터 기반 접근 방식을 통해 더 스마트한 재고 관리와 향상된 운영 효율성을 개선할 수 있습니다.

관련 개념 구분하기

  • 데이터 시각화: 데이터 시각화 분석은 인사이트를 찾는 광범위한 프로세스인 반면, 시각화는 이러한 인사이트를 그래픽으로 표현하는 그래픽으로 표현하는 구체적인 방법입니다. Tableau와 같은 도구는 종종 분석 프로세스 내에서 분석 프로세스 내에서 데이터를 차트 또는 대시보드에 표시하여 복잡한 복잡한 메트릭을 평균 평균 정밀도(mAP)와 같은 복잡한 메트릭을 이해하기 쉽습니다.
  • 데이터 마이닝: 이것은 대규모 데이터 세트에서 이전에 알려지지 않은 패턴을 발견하는 데 초점을 맞춘 분석의 하위 집합으로, 대규모 데이터 세트에서 이전에 알려지지 않은 패턴을 발견하는 데 중점을 둡니다. 다음에서 정의한 대로 Oracle에서 정의한 대로, 데이터 마이닝은 종종 자동화된 방법을 사용하여 을 사용하여 '빅 데이터'를 선별하는 반면, 일반적인 분석은 더 작은 집합에 대한 수동 가설 테스트를 포함할 수도 있습니다.
  • 머신 러닝(ML): ML 모델은 데이터로부터 학습하는 엔진입니다. 분석은 고품질 데이터를 준비하고 문제 공간을 정의하여 문제 공간을 정의합니다. 분석이 인사이트를 얻기 위해 데이터를 해석하는 데 중점을 둔다면, ML은 데이터를 사용하여 데이터를 사용하여 자율적으로 예측하거나 의사 결정을 내리는 데 중점을 둡니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기