Yolo 비전 선전
선전
지금 참여하기
용어집

로지스틱 회귀

이진 분류를 위한 로지스틱 회귀의 강력한 기능을 알아보세요. 애플리케이션, 주요 개념 및 머신러닝과의 관련성을 알아봅니다.

로지스틱 회귀는 주로 이진법 분야에서 사용되는 머신 러닝(ML) 분야의 기본 알고리즘입니다. 분류 작업에 주로 사용됩니다. 이름에 '회귀'라는 "회귀"라는 용어가 있어 초보자를 혼란스럽게 하는 경우가 많지만, 이 알고리즘은 다음과 같은 연속적인 값을 예측하는 데 사용되지 않습니다. 연속적인 값을 예측하는 데는 사용되지 않습니다. 대신, 주어진 입력이 특정 범주에 속할 확률을 예측합니다, "스팸" 또는 "스팸 아님"과 같은 특정 범주에 속할 확률을 예측합니다. 이는 지도 학습의 필수 진입점 역할을 하며 지도 학습의 필수적인 진입점 역할을 하며 단순성과 해석 가능성의 균형을 제공하여 많은 예측 모델링 프로젝트에서 신뢰할 수 있는 기준이 됩니다.

로지스틱 회귀의 역학

로지스틱 회귀의 핵심은 시그모이드 함수로 알려진 수학적 함수를 사용하여 입력을 0과 1 사이의 확률 점수로 변환합니다. 다음과 달리 직선을 데이터에 맞추는 선형 회귀와 달리 데이터에 직선을 맞추는 선형 회귀와 달리, 로지스틱 회귀는 "S" 모양의 곡선에 맞습니다. 이 곡선을 로지스틱 함수라고도 로지스틱 함수는 모든 실수 값을 확률 값으로 매핑합니다.

모델은 최적의 weights and biases 에 대한 입력 특징에 대한 최적의 가중치와 편향을 학습합니다. 이는 일반적으로 특정 손실 함수를 최소화함으로써 달성됩니다. 로그 손실 (또는 이진 교차 엔트로피)라는 특정 손실 함수를 최소화하고 최적화 알고리즘을 사용하여 경사 하강. 계산된 확률이 이 정의된 임계값(일반적으로 0.5)을 초과하면 모델은 인스턴스를 양수 클래스에 할당하고, 그렇지 않으면 음수 클래스에 할당합니다. 음수 클래스에 할당합니다.

주요 개념 및 용어

로지스틱 회귀를 이해하려면 다음에서 자주 등장하는 몇 가지 기본 개념을 숙지해야 합니다. 데이터 과학:

  • 결정 경계: 클래스를 구분하는 임계값입니다. 예를 들어 2D 피처 공간에서는 두 데이터 포인트 그룹을 구분하는 직선이 될 수 있습니다.
  • 정규화: L1 또는 L2 정규화와 같은 기술은 종종 과적합을 방지하기 위해 적용되며 과적합을 방지하여 모델이 보이지 않는 새로운 테스트 데이터에 대해 잘 일반화할 수 있도록 합니다.
  • 다항 로지스틱 회귀: 표준 버전은 2진법이지만, 이 변형은 세 가지 이상의 범주에 대해 세 가지 이상의 범주에 대한 문제를 처리합니다. 소프트맥스 함수가 작동하는 방식과 유사합니다.
  • 확률 비율: 이벤트가 발생할 확률을 발생하지 않을 확률로 나눈 값입니다. 로지스틱 회귀는 이러한 확률의 자연 로그(로그 확률)를 효과적으로 모델링합니다.

실제 애플리케이션

로지스틱 회귀는 효율성과 해석 가능성으로 인해 다양한 산업 분야에서 널리 사용되고 있습니다.

  • 의료 및 진단: 의료 분야에서는 의료 분야에서는 의사가 이 알고리즘을 사용하여 환자의 나이, BMI, 혈압과 같은 나이, BMI, 혈압과 같은 위험 요소를 기반으로 예측합니다. 의료 이미지 분석이 어떻게 의료 이미지 분석이 이러한 통계적 방법을 보완하는 방법을 알아보세요.
  • 재무 위험 평가: 은행과 핀테크 기업은 다음과 같은 목적으로 이 모델을 활용합니다. 신용 점수. 신청자의 금융 이력을 분석하여 금융 이력을 분석하여 대출 불이행 확률을 추정하여 안전한 대출 결정을 내리는 데 도움을 줍니다.
  • 마케팅 및 이탈 예측: 기업 적용 예측 모델링을 적용하여 고객이 구독을 취소할 가능성(이탈)을 계산합니다. 이러한 인사이트를 통해 기업은 고객 유지 노력을 효과적으로 타겟팅할 수 있습니다. 효과적으로 타겟팅할 수 있습니다.

구현 예시

고급 딥 러닝(DL) 프레임워크와 같은 Ultralytics YOLO11 와 같은 복잡한 작업에는 컴퓨터 비전로지스틱 회귀는 여전히 표 형식 데이터 분류의 표준으로 남아 있습니다. 다음 예제에서는 널리 사용되는 scikit-learn 라이브러리를 사용하여 간단한 분류기를 훈련합니다.

import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split

# Generate synthetic data: 100 samples, 5 features
X, y = np.random.rand(100, 5), np.random.randint(0, 2, 100)

# Split data and initialize the Logistic Regression model
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
model = LogisticRegression(solver="liblinear", random_state=42)

# Train the model and predict class labels
model.fit(X_train, y_train)
print(f"Predicted Class: {model.predict(X_test[0].reshape(1, -1))}")

로지스틱 회귀와 다른 알고리즘 비교

로지스틱 회귀를 관련 인공지능 개념과 구별하는 것이 중요합니다. 인공 지능(AI) 개념과 구별하는 것이 중요합니다:

  • 대 선형 회귀: 주요 차이점은 출력에 있습니다. 선형 회귀는 연속적인 숫자를 예측합니다. 값(예: 집값 예측)을 예측하는 반면, 로지스틱 회귀는 불연속형 범주(예: 집이 팔릴 것인가 집 판매: 예/아니요)를 예측합니다.
  • 서포트 벡터 머신(SVM)과 비교합니다: An SVM은 클래스 간 가장 넓은 마진을 찾으려 하며 가장 넓은 마진을 찾으려고 노력하며, 종종 커널을 통해 비선형 데이터를 더 잘 처리합니다. 로지스틱 회귀는 확률론적이며 관찰된 데이터의 가능성을 극대화하는 데 중점을 둡니다.
  • 딥 러닝(예: YOLO11)과 비교합니다: 이미지나 비디오와 같은 고차원 지각 데이터의 경우, 단순 선형 분류기는 복잡한 패턴을 포착하지 못합니다. 다음과 같은 고급 모델은 Ultralytics YOLO11 사용 컨볼루션 신경망(CNN) 을 사용하여 특징 추출 및 분류를 자동으로 수행하며 다음과 같은 작업에서 로지스틱 회귀보다 훨씬 뛰어난 성능을 발휘합니다. 개체 감지.

통계적 기초에 대한 더 자세한 내용은 로지스틱 회귀에 대한 위키피디아 항목은 수학에 대한 심층적인 수학에 대해 자세히 알아볼 수 있는 반면 Scikit-learn 문서 은 개발자를 위한 훌륭한 실용적인 리소스를 제공합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기