チャットボット、感情分析、機械翻訳などの自然言語処理(NLP)の概念、技術、およびアプリケーションをご覧ください。
Natural Language Processing (NLP) is a dynamic branch of Artificial Intelligence (AI) that focuses on the interaction between computers and human language. Unlike traditional programming that relies on precise, structured inputs, NLP enables machines to understand, interpret, and generate human language in a way that is both valuable and meaningful. By combining computational linguistics with statistical, machine learning, and Deep Learning (DL) models, NLP allows systems to process text and voice data with an intent to extract meaning, sentiment, and context.
At its core, NLP involves transforming raw text into a numerical format that computers can process, a step often achieved through tokenization and the creation of embeddings. Modern systems utilize the Transformer architecture, which employs a self-attention mechanism to weigh the importance of different words in a sentence relative to one another. This allows models to handle long-range dependencies and nuances such as sarcasm or idioms, which were difficult for earlier Recurrent Neural Networks (RNN) to manage.
NLP technology is ubiquitous in modern software, powering tools that businesses and individuals use daily to streamline operations and enhance user experiences.
NLPの範囲を理解するには、データサイエンスの領域における密接に関連する概念との違いを明確にすることが有用である:
以下の例は、NLPの概念がコンピュータビジョンとどのように相互作用するかを示しています。私たちは
ultralytics テキストプロンプトを理解するモデルをロードするためのパッケージ。自然言語を用いたカスタムクラスを定義することで、モデルの内部語彙(埋め込み)を利用して画像内のdetect 。
from ultralytics import YOLOWorld
# Load a model with vision-language capabilities
model = YOLOWorld("yolov8s-world.pt")
# Define NLP-based search terms (classes) for the model to find
# The model uses internal text embeddings to understand these descriptions
model.set_classes(["blue bus", "pedestrian crossing", "traffic light"])
# Run inference to detect objects matching the text descriptions
results = model.predict("city_scene.jpg")
# Show the results
results[0].show()
自然言語処理(NLP)アプリケーションの開発には、堅牢なライブラリが必要となることが多い。研究者は頻繁にPyTorchを利用している。 PyTorch カスタムニューラルアーキテクチャ構築にPyTorchを多用する一方、 教育用前処理タスクではNatural Language Toolkit (NLTK)が定番です。 本番環境向けテキスト処理では、その効率性からspaCyが広く採用されています。
AIが進化するにつれ、モダリティの融合が重要なトレンドとなっています。プラットフォームは、視覚と言語を相互接続されたデータストリームとして扱う統合ワークフローへと移行しています。Ultralytics はこのライフサイクルを簡素化し、データセットの管理、画像の注釈付け、最先端モデルのトレーニングを行うツールを提供します。 NLPが言語処理を担う一方、YOLO26のような高性能視覚モデルは、 リアルタイムエッジアプリケーションに必要な速度と精度で視覚データを処理し、 マルチモーダルAIシステムにシームレスな体験をもたらします。