Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Понимание естественного языка (NLU)

Откройте для себя обработку естественного языка (NLU) — прорыв в области ИИ, позволяющий машинам понимать, интерпретировать и реагировать на человеческий язык.

Понимание естественного языка (NLU) — это подобласть искусственного интеллекта (ИИ) и обработки естественного языка (NLP), которая фокусируется на предоставлении машинам возможности понимать смысл человеческого языка. В отличие от простой обработки слов, NLU направлена на интерпретацию намерений, контекста и настроений из текста или речи. Это «понимание» в уравнении взаимодействия человека с компьютером, позволяющее программному обеспечению понимать, что пользователь действительно имеет в виду, даже если язык является неоднозначным, разговорным или неструктурированным. Эта возможность имеет основополагающее значение для создания более интуитивно понятных и мощных приложений ИИ, которые могут взаимодействовать с людьми на их собственных условиях.

Основные компоненты NLU

NLU разбивает сложную задачу понимания языка на несколько ключевых компонентов. Система NLU обычно выполняет комбинацию следующих задач для деконструкции и интерпретации вводимых пользователем данных:

  • Распознавание намерений: Это процесс определения цели или намерения пользователя. Например, во фразе «Забронируйте рейс в Нью-Йорк» намерение состоит в том, чтобы «забронировать рейс». Это критически важный первый шаг для любой системы, ориентированной на задачи, такой как чат-бот или виртуальный помощник. Вы можете узнать больше о том, как такие сервисы, как Microsoft Azure LUIS, обрабатывают намерения.
  • Распознавание именованных сущностей (Named Entity Recognition, NER): Включает в себя идентификацию и категоризацию ключевых фрагментов информации в тексте по предопределенным категориям, таким как имена, организации, местоположения, даты и количества. В примере бронирования авиабилетов "Нью-Йорк" является сущностью местоположения.
  • Анализ тональности: Эта задача определяет эмоциональный тон текста, классифицируя его как положительный, отрицательный или нейтральный. Он широко используется для оценки отзывов клиентов, репутации бренда и общественного мнения.
  • Извлечение отношений: Эта продвинутая задача определяет семантические отношения между различными сущностями в тексте. Например, определение того, что "Илон Маск" является "генеральным директором" "Tesla" из новостной статьи. Это помогает построить структурированные знания из неструктурированных данных.

Технологии, лежащие в основе NLU

Современное понимание естественного языка (NLU) в значительной степени опирается на достижения в области машинного обучения (ML), в частности глубокого обучения (DL). Архитектуры нейронных сетей, такие как Transformers, и предварительно обученные модели, такие как BERT, произвели революцию в возможностях NLU, эффективно улавливая сложные контекстуальные взаимосвязи в языке. Эти прорывы являются основополагающими для мощности современных больших языковых моделей (LLM). Видные исследовательские институты в области ИИ, такие как Stanford NLP Group, и библиотеки и платформы с открытым исходным кодом, такие как spaCy и Hugging Face, являются ключевыми участниками прогресса в этой области, а такие организации, как Ассоциация вычислительной лингвистики (ACL), продвигают исследования вперед.

NLU в сравнении со смежными понятиями

Важно отличать NLU от тесно связанных терминов:

  • Обработка естественного языка (NLP): NLU — это специализированная подобласть NLP. В то время как NLP — это широкая область, охватывающая все аспекты пересечения компьютеров и человеческого языка, NLU конкретно фокусируется на понимании и извлечении смысла (ввод). NLP также включает генерацию естественного языка (NLG), которая занимается созданием человекоподобного текста (вывод). Короче говоря, NLU — это «чтение», а NLP охватывает «чтение, письмо и манипулирование» языком.
  • Компьютерное зрение (CV): NLU имеет дело с языковыми данными, тогда как CV фокусируется на интерпретации информации из визуальных входных данных, таких как изображения и видео. Модели CV, такие как Ultralytics YOLO, используются для таких задач, как обнаружение объектов. Однако эти области все чаще пересекаются в мультимодальных моделях, которые обрабатывают как текст, так и изображения, обеспечивая приложения, которые соединяют NLP и CV. В то время как такие платформы, как Ultralytics HUB, в основном ориентированы на vision AI, основные принципы глубокого обучения часто пересекаются. Для получения дополнительной информации о приложениях AI вы можете изучить документацию Ultralytics.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена