深圳Yolo 视觉
深圳
立即加入
词汇表

Logistic 回归

探索用于二元分类的 Logistic 回归的强大功能。了解其在机器学习中的应用、关键概念和相关性。

逻辑回归是机器学习(ML)领域的一种基本算法。 机器学习(ML)领域的基本算法,主要用于二元 分类任务。尽管其名称中的 "回归 "一词常常让初学者感到困惑,但它并不用于预测连续值,如 房价或温度等连续值。相反,它预测的是给定输入属于特定类别的概率、 例如 "垃圾邮件 "或 "非垃圾邮件"。它是进入 监督学习的重要切入点,在 简单性和可解释性的平衡,使其成为许多预测建模项目的可靠基线。

逻辑回归机制

逻辑回归的核心是使用一个称为 Sigmoid 函数的数学 函数转换成 0 和 1 之间的概率分数。与之不同的是 线性回归拟合一条直线来预测连续结果。 不同,逻辑回归拟合的是一条 "S "形曲线。这条曲线 也称为逻辑函数,可将任何实数值映射为概率值。

该模型可学习最佳 weights and biases的 输入特征的最佳权重和偏置。这通常是通过最小化一个特定的 损失函数(或二元 或二进制交叉熵)。 优化算法,如 梯度下降算法。如果计算出的概率 超过规定的阈值(通常为 0.5),模型就会将实例分配到正类;反之,则将其分配到负类。 为负类。

主要概念和术语

要理解 Logistic 回归,需要熟悉在数据科学中经常出现的几个基本概念。 数据科学

  • 判定边界:用于区分类别的阈值。例如,在二维特征空间中 空间中,这可能是分隔两组数据点的一条直线。
  • 正则化:通常采用 L1 或 L2 正则化等技术来防止 过拟合,确保模型能很好地泛化到新的、未见过的测试数据中。 新的、未见过的测试数据
  • 多项式逻辑回归:标准版本是二元回归,而这一变体可处理三个或更多类别的问题。 三个或更多类别的问题,类似于 softmax函数在深度神经网络中的工作原理。
  • 概率比:事件发生的概率除以未发生的概率。 逻辑回归有效地模拟了这些几率的自然对数(log-odds)。

实际应用

由于其高效性和可解释性,逻辑回归被广泛应用于各行各业。

  • 医疗保健与诊断:医疗保健领域中的 人工智能在医疗保健领域的应用 算法,根据年龄、体重指数和血压等风险因素,预测患者罹患糖尿病或心脏病等疾病的可能性。 年龄、体重指数和血压等风险因素来预测患者罹患糖尿病或心脏病等疾病的可能性。了解 医学图像分析如何补充这些 统计方法。
  • 金融风险评估:银行和金融科技公司利用这些模型进行 信用评分。通过分析申请人的 该模型通过分析申请人的财务历史,估算出贷款违约的概率,从而帮助做出安全的贷款决策。
  • 营销和流失预测:企业应用 预测模型来计算 客户取消订购(流失)的可能性。这种洞察力使企业能够有针对性地 有效。

实施实例

虽然先进的 深度学习 框架,如 Ultralytics YOLO11 对于复杂的任务,如 计算机视觉,逻辑回归仍然是 表格数据分类的标准。下面的示例使用流行的 scikit-learn 库来 训练一个简单的分类器。

import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split

# Generate synthetic data: 100 samples, 5 features
X, y = np.random.rand(100, 5), np.random.randint(0, 2, 100)

# Split data and initialize the Logistic Regression model
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
model = LogisticRegression(solver="liblinear", random_state=42)

# Train the model and predict class labels
model.fit(X_train, y_train)
print(f"Predicted Class: {model.predict(X_test[0].reshape(1, -1))}")

逻辑回归与其他算法的比较

重要的是要将逻辑回归与相关的 人工智能 (AI)概念:

  • 与线性回归:关键区别在于输出结果。 线性回归预测的是连续的数值(如预测房价 值(例如,预测房价),而逻辑回归预测的是离散类别(例如,房子是否会出售:是/否)。 是/否)。
  • 支持向量机(SVM):一个 SVM试图在类与类之间找到最宽的边缘。 通常通过内核更好地处理非线性数据。逻辑回归是概率性的,侧重于最大化观察到的数据的可能性。 侧重于最大化观测数据的可能性。
  • 与深度学习的对比(如YOLO11):对于图像或视频等高维感知数据,简单的 线性分类器无法捕捉复杂的模式。高级模型,如 Ultralytics YOLO11使用 卷积神经网络 (CNN) 来自动执行 特征提取和分类 在物体检测等任务上的性能远远超过逻辑回归 物体检测

如需进一步了解统计基础,维基百科上的 维基百科的 Logistic Regression 条目提供了对数学深 数学知识,而 Scikit-learn 文档 为开发人员提供了极好的实用资源。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入