探索自然语言处理(NLP)中的命名实体识别(NER)。了解如何识别和classify文本实体(如名称和日期),以通过AI和Ultralytics YOLO26获取洞察。
命名实体识别(NER)是自然语言处理(NLP)的核心子任务,涉及识别和分类非结构化文本中的关键信息。在典型的工作流程中,NER模型会扫描文档以定位“实体”——即代表真实世界对象的特定词语或短语——并将其分配到预定义的类别中,例如人名、组织、地点、日期或医疗代码。此过程对于将电子邮件、客户评论和新闻文章等原始非结构化数据转换为机器可以处理和分析的结构化格式至关重要。通过回答文本中的“谁、什么、何地”,NER使人工智能(AI)系统能够自动从海量信息中提取有意义的洞察。
现代NER系统利用先进的统计模型和深度学习(DL)技术来理解词语的上下文。该过程始于分词(tokenization),即将句子分解成称为token的独立单元。然后,Transformer等复杂的架构会分析这些token之间的关系,根据用法确定其含义。
例如,单词“Apple”根据句子上下文可能指水果或一家科技公司。通过自注意力(self-attention)等机制,NER模型能够识别出“Apple发布了一款新手机”中的“Apple”指的是一个组织,而“我吃了一个苹果”中的“apple”指的是一个普通物体。这些模型的性能在很大程度上依赖于高质量的训练数据和精确的数据标注。在多模态应用中,NER通常与光学字符识别(OCR)结合使用,以便在处理图像之前从中提取文本。
NER是应用于各行各业的许多智能自动化工具的基础技术。
区分NER与其他解释任务有助于理解其在AI管道中的特定作用。
文本与视觉的融合是多模态学习中的一个新兴趋势。YOLO-World等模型通过使用文本提示来指导目标检测,从而弥合了这一差距。在此工作流程中,文本编码器类似于NER系统,解释用户提供的类别名称(实体)的语义,以找到相应的视觉对象。
下面的Python 示例演示了如何使用 ultralytics 基于自定义文本描述检测对象的库,有效地将自然语言实体与视觉数据关联起来。
from ultralytics import YOLOWorld
# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")
# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])
# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")
# Display the results with bounding boxes around detected entities
results[0].show()
开发者可以使用强大的NER实现工具生态系统。spaCy和NLTK等流行的开源库提供了预训练的管道,可立即使用。对于企业级应用,Google Cloud Natural Language等云服务提供了可随需求扩展的托管API。
管理这些AI模型(无论是文本还是视觉模型)的生命周期需要高效的运营。Ultralytics Platform简化了这些MLOps流程,提供统一的环境来管理数据集、训练模型和部署解决方案。这确保了AI项目保持可扩展性和生产就绪状态,支持YOLO26等模型的持续改进,以实现尖端性能。

开启您的机器学习未来之旅