词汇表

小型语言模型 (SLM)

探索小型语言模型 (SLM) 如何在边缘设备上实现高效、私密和低成本的AI。学习如何将SLM与Ultralytics YOLO26结合用于边缘AI。

小型语言模型 (SLM) 是精简的人工智能模型，旨在高效理解和生成人类语言。与大型模型不同，SLM通常拥有数百万到约150亿个参数，使它们能够在边缘设备上本地运行，而无需庞大的云计算基础设施。通过本地运行，这些模型提供更快的处理速度、增强的用户隐私，并显著降低部署成本。

区分关键术语

为了更好地理解人工智能领域，有必要将SLM与相关技术区分开来：

SLM与大型语言模型 (LLM)的对比：尽管LLM包含数千亿个参数并需要大量的服务器资源，但SLM经过高度优化。这使得它们能够以最小的推理延迟运行，非常适合不需要大规模部署的专业领域特定应用。
SLM与视觉语言模型 (VLM)的对比：SLM主要专注于自然语言处理任务。相比之下，VLM能够原生解释文本和图像。然而，许多开发者现在将SLM与快速视觉模型结合，以创建轻量级多模态系统。

实际应用

小型语言模型正通过将先进智能直接引入消费电子产品和企业网络，从而迅速改变各行各业。

设备端虚拟助手: 现代智能手机和物联网设备利用SLM在本地处理语音命令。这确保了实时响应并将敏感数据保留在硬件上。像Microsoft的Phi-3和Apple的OpenELM这样的最先进模型正在引领这场设备端革命。
领域专用聊天机器人: 企业部署高度微调的SLM以实现自动化客户支持。通过将这些紧凑模型与检索增强生成（RAG）相结合，公司可以安全地查询其内部数据库并解决问题，而无需依赖昂贵的第三方API。
制造业中的边缘计算: 在智能制造设施中，SLM通过快速总结复杂的设备手册来协助技术人员。当与实时object detection模型结合时，这些系统可以分析视觉缺陷并直接在工厂车间即时生成纯文本的诊断报告。

在现代工作流中实施SLM

2024年和2025年的最新突破证明，高质量的训练数据可以产生媲美往年大型模型的性能。诸如Google的Gemma和Meta的Llama 3 8B等创新，展示了小型架构如今的强大能力。

在构建综合性人工智能解决方案时，开发者常使用Python将SLM的语言推理能力与Ultralytics Platform上工具的视觉准确性相结合。例如，一个设备上的SLM可以处理语音命令以启动计算机视觉任务。以下简洁的代码片段演示了如何加载像Ultralytics YOLO26这样的轻量级模型进行目标track，这种操作非常适合运行SLM的相同边缘硬件：

from ultralytics import YOLO

# Load the highly efficient YOLO26 nano model, suitable for edge devices
model = YOLO("yolo26n.pt")

# Run real-time object tracking on a local video stream
results = model.track(source="video.mp4", show=True, tracker="botsort.yaml")

通过优先考虑本地执行，工程师显著降低了带宽需求和运营成本。随着行业不断推进边缘AI技术，精简的计算机视觉和高效的小型语言模型的强大结合将推动下一代智能自主系统。

小型语言模型 (SLM)

导出至17+种格式。部署至全球43个区域。

以每小时2.39美元的价格在H100 GPU上训练YOLO26。

灵活的企业级许可，为您的视觉AI项目赋能。

专为赋能您的下一个项目而设计的企业级许可

智能标注可将标注速度提升高达10倍

标注。训练。部署。一站式平台。

区分关键术语

实际应用

在现代工作流中实施SLM

阅读更多此类别的内容

Ultralytics YOLO 与 DEEPXYOLO ：为物理人工智能提供边缘 AI 推理

如何使用Ultralytics 导出Ultralytics YOLO

利用Ultralytics 检测不安全的托盘堆放

让我们一起共建AI的未来！