Yolo 비전 선전
선전
지금 참여하기
용어집

데이터 마이닝

데이터 마이닝이 원시 데이터를 실행 가능한 통찰력으로 변환하여 의료, 소매 등에서 AI, ML 및 실제 응용 프로그램을 강화하는 방법을 알아보세요!

데이터 마이닝은 대규모 데이터 세트를 탐색하고 분석하여 의미 있는 패턴을 발견하는 계산 프로세스입니다, 추세 및 관계를 발견하는 컴퓨팅 프로세스입니다. 원시 정보를 실행 가능한 지식으로 변환함으로써 지식으로 변환함으로써 이 분야는 통계 분석과 인공 지능(AI). 조직은 데이터 마이닝을 활용하여 미래의 행동을 예측하고, 이상 징후를 파악하며, 전략적 의사 결정을 지원합니다. 구조화된 데이터베이스 관리와 연관되는 경우가 많지만, 최신 데이터 마이닝은 다음을 많이 활용합니다. 머신 러닝(ML) 알고리즘을 활용하여 텍스트, 비디오, 센서 로그와 같은 비정형 입력을 처리하여 빅 데이터를 귀중한 조직 자산으로 전환합니다.

프로세스의 핵심 구성 요소

데이터 마이닝의 워크플로는 일반적으로 다음과 같은 표준을 따릅니다. 데이터 마이닝을 위한 업계 간 표준 프로세스(CRISP-DM)를 따르는데, 이는 실무자가 비즈니스 목표를 이해하는 것부터 모델을 배포하는 것까지 안내합니다.

  • 데이터 수집 및 어노테이션: 이 프로세스는 트랜잭션 데이터베이스, IoT 센서, 이미지 저장소 등 다양한 소스에서 원시 정보를 수집하는 것으로 시작됩니다, 또는 이미지 저장소와 같은 다양한 소스에서 원시 정보를 수집하는 것으로 시작됩니다.
  • 데이터 전처리: 원시 데이터 은 분석할 준비가 거의 되어 있지 않습니다. 이 단계에는 다음이 포함됩니다. 노이즈를 제거하고 누락된 값을 처리하기 위한 데이터 정리 값을 처리하기 위한 데이터 정리가 포함되며, 종종 다음과 같은 라이브러리를 Pandas 와 같은 라이브러리를 활용하는 경우가 많습니다.
  • 패턴 발견: 숨겨진 구조를 추출하기 위해 알고리즘을 적용합니다. 여기에는 다음이 포함될 수 있습니다. 특징 추출을 통해 분석에 가장 분석에 가장 관련성이 높은 변수를 분리하기 위한 특징 추출이 포함될 수 있습니다.
  • 해석: 채굴된 패턴은 무작위적인 상관관계가 아닌 유용한 지식을 나타내는지 확인하기 위해 검증됩니다. 유용한 지식을 나타내는지 검증합니다. 데이터 시각화 도구의 도움을 받습니다.

주요 기술 및 방법

데이터 마이닝은 특정 문제를 해결하기 위해 다양한 통계 및 머신러닝 기법을 사용합니다.

  • 분류: 이 기술 은 데이터 항목을 미리 정의된 클래스로 분류합니다. 예를 들어, 이메일 제공업체는 분류를 사용하여 메시지를 '스팸' 또는 받은 편지함 를 "스팸" 또는 "받은 편지함"으로 필터링합니다.
  • 클러스터 분석: 분류와 달리 분류와 달리 클러스터링은 미리 정의된 레이블 없이 유사한 데이터 포인트를 그룹화합니다. 이는 비지도 학습의 핵심 방법이며 비지도 학습의 핵심 방법이며 시장 세분화.
  • 연관 규칙 학습: 이 방법은 데이터 세트에서 변수 간의 관계를 식별합니다. 소매 시장 바구니 분석에 사용되는 것으로 유명합니다. 분석에서 빵을 구매하는 고객이 버터도 구매할 가능성이 높다는 사실을 발견하는 데 사용됩니다.
  • 이상 징후 탐지: 이 은 정상에서 크게 벗어난 이상값을 식별하는 데 중점을 두며, 이는 사기 탐지 및 네트워크 보안에 매우 중요합니다. 네트워크 보안에 중요합니다.

실제 애플리케이션

데이터 마이닝은 주요 산업 전반에서 효율성을 높이는 지능형 시스템의 원동력입니다.

  • 소매업의 AI: 소매업체는 방대한 거래 내역을 마이닝하여 공급망을 최적화하고 쇼핑 경험을 개인화합니다. 구매 패턴을 분석하여 구매 패턴을 분석하여 추천 시스템을 구축하여 사용자가 구매할 가능성이 가장 높은 제품을 제안하는 추천 시스템을 구축하여 매출을 크게 늘릴 수 있습니다. 다음과 같은 플랫폼 Google Cloud Retail과 같은 플랫폼은 이러한 기능을 통합하여 수요를 예측합니다.
  • 의료 이미지 분석: 의료 분야에서는 환자 기록과 진단 영상에 데이터 마이닝을 적용합니다. 다음과 같은 고급 모델 YOLO11 와 같은 고급 모델은 시각적 데이터를 '마이닝'하여 이상 징후를 찾아내고 이상 징후를 classify 수 있습니다. 뇌종양 식별과 같은 이상 징후를 찾아낼 수 있습니다. 이를 통해 방사선과 전문의가 면밀한 검사가 필요한 잠재적 문제를 강조하여 국립보건원(NIH).

코드 예제: 시각적 데이터 마이닝

컴퓨터 비전에서 '마이닝'은 종종 구조화된 정보(클래스 레이블 및 개수)를 추출하는 것을 의미하기도 합니다. 를 추출하는 것을 말합니다. 다음 예는 ultralytics 라이브러리를 사용하여 객체를 detect 클래스 이름과 신뢰도 점수를 추출합니다.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model to mine object data from images
model = YOLO("yolo11n.pt")

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract and display mined insights: detected classes and confidence
for result in results:
    for box in result.boxes:
        cls_id = int(box.cls[0])
        print(f"Detected: {model.names[cls_id]} | Confidence: {box.conf.item():.2f}")

관련 개념 구분하기

데이터 마이닝을 데이터 과학 환경에서 유사한 용어와 구별하는 것이 중요합니다.

  • 데이터 분석: 데이터 마이닝 은 패턴의 자동화된 발견에 초점을 맞추는 반면, 분석은 비즈니스 의사 결정을 지원하는 해석과 비즈니스 의사 결정을 지원하기 위해 이러한 패턴의 해석, 커뮤니케이션 및 적용을 포괄하는 광범위한 용어입니다.
  • 딥 러닝(DL): DL은 신경망에서 영감을 받은 머신 러닝의 특수한 하위 집합입니다. 데이터 마이닝은 종종 DL 알고리즘을 특히 다음과 같은 복잡한 작업을 처리할 때 검색 프로세스를 수행하는 도구로서 개체 감지 또는 자연어 처리와 같은 복잡한 작업을 처리할 때 특히 그렇습니다.
  • 예측 모델링: 이것은 데이터 마이닝에서 종종 도출되는 특정 결과입니다. 마이닝은 데이터를 탐색하여 패턴을 찾는 반면, 예측 모델링은 그 패턴을 사용하여 미래의 이벤트를 예측합니다. 모델링은 그 패턴을 사용하여 미래의 이벤트를 예측하는 것으로, 다음과 같은 차이점이 있습니다. SAS 분석.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기