返回 Ultralytics 词汇表
Small Language Models (SLMs)
了解小语言模型 (SLM) 如何在边缘设备上实现高效、私密且低成本的 AI。学习将 SLM 与 Ultralytics YOLO26 结合用于边缘 AI。
小型语言模型 (SLMs) 是一种精简的人工智能模型,旨在高效理解并生成人类语言。与大型同类模型不同,SLMs 的参数通常在几百万到约 150 亿之间,这使它们能够在边缘设备上本地运行,而无需依赖庞大的云计算基础设施。通过本地运行,这些模型提供了更快的处理速度、增强的用户隐私以及显著降低的部署成本。
Link to this section区分关键术语#
为了更好地理解人工智能领域,区分 SLMs 与相关技术非常有帮助:
- SLMs 与 大语言模型 (LLMs): 虽然 LLMs 包含数千亿个参数并需要大量的服务器资源,但 SLMs 经过了高度优化。这使得它们能够以极低的推理延迟运行,非常适合不需要大规模算力的专业领域应用。
- SLMs 与 视觉语言模型 (VLMs): SLMs 主要专注于自然语言处理任务。相比之下,VLMs 可以原生解读文本和图像。然而,许多开发者现在将 SLMs 与快速视觉模型相结合,以构建轻量级的多模态系统。
Link to this section实际应用#
小型语言模型正在通过将先进的智能直接带入消费电子产品和企业网络中,迅速改变各行各业。
- 端侧虚拟助手: 现代智能手机和 IoT 设备利用 SLMs 在本地处理语音指令。这确保了实时响应,并将敏感数据保留在硬件上。诸如 Microsoft's Phi-3 和 Apple's OpenELM 等顶尖模型正在引领这场端侧革命。
- 领域专用聊天机器人: 企业为自动化客户支持部署了经过高度微调的 SLMs。通过将这些紧凑的模型与检索增强生成 (RAG) 相结合,公司可以安全地查询其内部数据库并解决问题,而无需依赖昂贵的第三方 API。
- 制造业中的边缘计算: 在智能制造工厂中,SLMs 通过快速总结复杂的设备手册来辅助技术人员。当与实时目标检测模型结合使用时,这些系统可以在车间现场直接分析视觉缺陷并立即生成纯文本的诊断报告。
Link to this section在现代工作流中实施 SLMs#
2024 年和 2025 年的最新突破证明,高质量的训练数据可以产生媲美往年大型模型的性能。像 Google's Gemma 和 Meta's Llama 3 8B 等创新成果展示了更小的架构已经变得多么强大。
在构建全面的 AI 解决方案时,开发者通常使用 Python 将 SLMs 的语言推理能力与 Ultralytics Platform 上的视觉精度工具集成在一起。例如,端侧 SLM 可以处理口令来启动计算机视觉任务。以下简洁的代码片段展示了如何加载像 Ultralytics YOLO26 这样的轻量级模型进行目标跟踪,这是一项非常适合在运行 SLM 的同一边缘硬件上执行的操作:
from ultralytics import YOLO
# Load the highly efficient YOLO26 nano model, suitable for edge devices
model = YOLO("yolo26n.pt")
# Run real-time object tracking on a local video stream
results = model.track(source="video.mp4", show=True, tracker="botsort.yaml")通过优先考虑本地执行,工程师显著降低了带宽需求和运营成本。随着行业不断推进 Edge AI 技术,精简的计算机视觉与高效的小型语言模型的强大组合,将推动下一代智能自主系统的发展。






