Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Natural Language Processing (NLP)

Исследуй обработку естественного языка (NLP) вместе с Ultralytics. Узнай, как NLP расширяет возможности чат-ботов, анализа тональности и детектирования по открытому словарю с помощью Ultralytics YOLO26.

Обработка естественного языка (NLP) — это динамичная область искусственного интеллекта (ИИ), которая фокусируется на взаимодействии между компьютерами и человеческим языком. В отличие от традиционного программирования, основанного на точных и структурированных входных данных, NLP позволяет машинам понимать, интерпретировать и генерировать человеческий язык значимым и полезным способом. Объединяя вычислительную лингвистику со статистическими методами, машинным обучением и моделями глубокого обучения (DL), NLP позволяет системам обрабатывать текстовые и голосовые данные с целью извлечения смысла, тональности и контекста.

Link to this sectionОсновные механизмы#

По своей сути NLP предполагает преобразование необработанного текста в числовой формат, который могут обрабатывать компьютеры — шаг, который часто достигается через токенизацию и создание эмбеддингов. Современные системы используют архитектуру Transformer, которая применяет механизм self-attention для взвешивания важности разных слов в предложении по отношению друг к другу. Это позволяет моделям обрабатывать долгосрочные зависимости и такие нюансы, как сарказм или идиомы, с которыми было сложно справляться ранним рекуррентным нейронным сетям (RNN).

Link to this sectionРеальные приложения#

Технология NLP повсеместно встречается в современном программном обеспечении, обеспечивая работу инструментов, которые компании и частные лица используют ежедневно для оптимизации операций и улучшения пользовательского опыта.

  • Автоматизация обслуживания клиентов: Многие компании используют чат-боты и автоматизированных агентов для обработки запросов клиентов. Эти системы используют анализ тональности для определения эмоционального окраса сообщения — выясняя, доволен ли клиент, разочарован или задает вопрос, — что позволяет приоритизировать ответы. Такие инструменты, как Google Cloud Natural Language API, предоставляют разработчикам предварительно обученные модели для быстрой реализации этих функций.
  • Интеграция зрения и языка: В области компьютерного зрения (CV) NLP позволяет выполнять обнаружение с "открытым словарем". Вместо обучения модели на фиксированном списке классов (например, 80 классов в датасете COCO), модели, такие как YOLO-World, используют текстовые энкодеры для идентификации объектов на основе описаний на естественном языке. Этот мост позволяет пользователям находить конкретные объекты, например "человек в красном шлеме", без переобучения модели.
  • Языковой перевод: Такие сервисы, как Google Translate, используют машинный перевод для мгновенного преобразования текста с одного языка на другой, устраняя глобальные коммуникационные барьеры.

Link to this sectionРазграничение связанных терминов#

Чтобы понять масштаб NLP, полезно отличить его от тесно связанных концепций в сфере data science:

  • Понимание естественного языка (NLU): Если NLP — это всеобъемлющая область, то NLU является специфическим подмножеством, сфокусированным на понимании прочитанного. NLU занимается определением намерения и смысла, стоящих за текстом, работая с неоднозначностью и контекстом.
  • Большие языковые модели (LLM): LLM, такие как серия GPT или Llama, — это массивные модели глубокого обучения, обученные на петабайтах данных. Это инструменты, используемые для выполнения продвинутых задач NLP, способные к сложной генерации текста и логическим рассуждениям.
  • Оптическое распознавание символов (OCR): OCR — это строго преобразование изображений текста (сканированных документов) в машиночитаемый текст. NLP вступает в дело после того, как OCR оцифровал контент, чтобы придать смысл написанному.

Link to this sectionПример кода: связывание текста и зрения#

Следующий пример демонстрирует, как концепции NLP взаимодействуют с компьютерным зрением. Мы используем пакет ultralytics для загрузки модели, которая понимает текстовые подсказки. Определяя пользовательские классы с помощью естественного языка, мы используем внутренний словарь (эмбеддинги) модели для обнаружения объектов на изображении.

from ultralytics import YOLOWorld

# Load a model with vision-language capabilities
model = YOLOWorld("yolov8s-world.pt")

# Define NLP-based search terms (classes) for the model to find
# The model uses internal text embeddings to understand these descriptions
model.set_classes(["blue bus", "pedestrian crossing", "traffic light"])

# Run inference to detect objects matching the text descriptions
results = model.predict("city_scene.jpg")

# Show the results
results[0].show()

Link to this sectionИнструменты и будущие направления#

Разработка приложений NLP часто требует надежных библиотек. Исследователи часто используют PyTorch для создания пользовательских нейронных архитектур, в то время как Natural Language Toolkit (NLTK) остается стандартом для образовательных задач предварительной обработки. Для промышленной обработки текста широко применяется spaCy благодаря своей эффективности.

По мере развития ИИ конвергенция модальностей становится ключевым трендом. Платформы переходят к унифицированным рабочим процессам, где зрение и язык рассматриваются как взаимосвязанные потоки данных. Платформа Ultralytics упрощает этот жизненный цикл, предлагая инструменты для управления датасетами, аннотирования изображений и обучения современных моделей. В то время как NLP занимается лингвистической стороной, высокопроизводительные модели зрения, такие как YOLO26, гарантируют, что визуальные данные обрабатываются со скоростью и точностью, необходимыми для real-time edge-приложений, создавая бесшовный опыт для систем мультимодального ИИ.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения