Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Понимание естественного языка (NLU)

Откройте для себя обработку естественного языка (NLU) — прорыв в области ИИ, позволяющий машинам понимать, интерпретировать и реагировать на человеческий язык.

Понимание естественного языка (Natural Language Understanding, NLU) - это специализированная область искусственного интеллекта (ИИ), ориентированная на машинного понимания прочитанного. В то время как при стандартной обработке текста можно подсчитать количество слов, NLU нацелено на расшифровку смысл, намерения и настроения, скрывающиеся за человеческим языком. Это "мозг", который позволяет программному обеспечению интерпретировать неструктурированный текст - электронные письма, журналы чатов или разговорные команды - и переводить его в структурированные данные, пригодные для практического применения. данные. Эта способность является основой для создания интуитивно понятных систем, таких как чат-боты и виртуальных помощников, которые могут взаимодействовать с пользователями естественным образом.

Основные компоненты NLU

Чтобы эффективно "понимать" язык, системы NLU разбивают вводимые данные на несколько значимых слоев. Этот Этот процесс преобразует необработанный текст в структурированный формат, с которым могут работать алгоритмы.

  • Распознавание намерений: Здесь указывается цель пользователя. Например, если пользователь набирает "Мне нужен перелет в Токио", то намерение BookFlight. Это очень важно для целеустремленных агентов ИИ.
  • Распознавание именованных сущностей (NER): При этом извлекаются конкретные фрагменты информации, такие как имена, даты, местоположение или коды продуктов. Во фразе "Встреча с Гленом в пятницу", NER идентифицирует "Глен" как PERSON и "Пятница" как DATE.
  • Анализ настроения: Этот оценивает эмоциональный тон текста - положительный, отрицательный или нейтральный. Он широко используется в службе поддержки клиентов для для автоматической оценки удовлетворенности пользователей.
  • Контекстные рассуждения: Продвинутый NLU, часто использующий Большие языковые модели (LLM) и Трансформаторы, выходят за рамки отдельных предложений, чтобы понимания отсылок и двусмысленности (например, понимания того, к чему относится "это" в разговоре).

Применение в реальном мире

NLU - это движущая сила многих технологий, которые мы используем ежедневно, преодолевая разрыв между человеческим общением и машинной логикой. логикой.

  1. Автоматизация обслуживания клиентов: Компании используют NLU для создания интеллектуальных агентов поддержки. Такие платформы, как IBM Watson Natural Language Understanding могут анализировать входящие заявки на поддержку, направлять их в нужный отдел в зависимости от намерений и даже предлагать и даже предлагать ответы на основе описания проблемы.
  2. Семантический поиск: В отличие от поиска по ключевым словам, при котором происходит точный подбор слов, поисковые системы на основе NLU понимают смысл запроса. Это позволяет пользователям задавать вопросы вроде "Кто является генеральным директором Ultralytics?" и получить прямой ответ, а не список ссылок, содержащих слово "CEO".
  3. Управление с помощью голоса: Устройства полагаются на NLU для анализа устных команд. Когда пользователь говорит: "Выключите выключить свет в гостиной", система использует NLU, чтобы определить действие ("выключить") и целевой объект объекта ("свет в гостиной").

NLU vs. NLP vs. Computer Vision

Полезно отличать NLU от смежных дисциплин, связанных с ИИ:

  • Обработка естественного языка (НЛП): НЛП - это всеобъемлющая область, которая охватывает все языковые задачи. NLU - это именно подмножество задач, связанных с пониманием (ввод $\to$ смысла). Другое подмножество, Natural Language Generation (NLG), занимается созданием текста (Meaning $\to$ Output).
  • Компьютерное зрение (КВ): В то время как NLU обрабатывает текст, CV интерпретирует визуальные данные. Однако современные мультимодальные модели объединяют и то, и другое. Например, модели типа YOLO используют NLU для интерпретации текстовых подсказок (например, "синий рюкзак"), а затем используют CV для поиска этих объектов на изображении.

NLU в зрительном ИИ: обнаружение открытых словарей

Интеграция NLU с компьютерным зрением позволяет обнаруживать объекты с открытым словарем. Вместо того чтобы ограничиваться фиксированным списком классов (как 80 классов в COCO), модель может detect объекты на основе описательного текста. Сайт Ultralytics YOLOWorld Модель демонстрирует это на примере использования встроенного кодировщика текста для "понимания" классы, которые вы хотите найти.

Следующий пример демонстрирует, как NLU позволяет модели зрения detect пользовательские объекты, заданные исключительно текстом:

from ultralytics import YOLOWorld

# Load a YOLO-World model (incorporates NLU for text-based class definition)
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using natural language
# The model's NLU component understands these terms without retraining
model.set_classes(["person reading a book", "red coffee mug"])

# Run inference on an image
results = model.predict("library.jpg")

# Display results
results[0].show()

Инструменты и будущие тенденции

Область NLU быстро развивается благодаря исследованиям таких групп, как Стэнфордская группа НЛП и Ассоциация вычислительной лингвистики (ACL). Технологии переходят от простого подбора ключевых слов к глубокому контекстуальному пониманию.

Для разработчиков грядущая платформаUltralytics Platform (запуск в 2026 году) упростит жизненный цикл моделей ИИ. ИИ-моделей, упрощая управление наборами данных и развертывание сложных мультимодальных систем, использующих как зрение, так и понимание языка. С современными задачами зрения справляются YOLO11в то время как продолжаются исследования и разработки следующего поколения YOLO26, нацеленного на еще более тесную интеграцию скорости и точности. Облачные сервисы, такие как Google Cloud Natural Language, также предоставляют надежные API для для добавления чистых функций NLU в приложения.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас