Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Language Modeling

Изучи основы языкового моделирования и его роль в NLP. Узнай, как Ultralytics YOLO26 и мультимодальный ИИ преодолевают разрыв между текстом и зрением.

Языковое моделирование — это основной статистический метод, используемый для обучения компьютеров пониманию, генерации и прогнозированию человеческого языка. На самом базовом уровне языковая модель определяет вероятность появления определенной последовательности слов в предложении. Эта способность служит фундаментом для всей области обработки естественного языка (NLP), позволяя машинам выйти за рамки простого сопоставления ключевых слов и перейти к пониманию контекста, грамматики и намерений. Анализируя огромные объемы обучающих данных, эти системы изучают статистическую вероятность того, какие слова обычно следуют за другими, что позволяет им составлять связные предложения или расшифровывать неоднозначный звук в задачах распознавания речи.

Link to this sectionМеханизмы и эволюция#

История языкового моделирования прослеживает эволюцию самого искусственного интеллекта (ИИ). Ранние итерации опирались на «n-граммы», которые просто вычисляли статистическую вероятность слова на основе $n$ слов, непосредственно предшествующих ему. Однако современные подходы используют глубокое обучение (DL) для захвата гораздо более сложных взаимосвязей.

Современные модели используют эмбеддинги, которые преобразуют слова в многомерные векторы, позволяя системе понимать, что «король» и «королева» семантически связаны. Эта эволюция завершилась архитектурой Transformer, которая использует механизмы self-attention для параллельной обработки целых последовательностей текста. Это позволяет модели оценивать важность слов независимо от их расстояния друг от друга в абзаце, что является решающей характеристикой для поддержания контекста при генерации текста большого объема.

Link to this sectionРеальные приложения#

Языковое моделирование перешло от академических исследований к утилите, обеспечивающей ежедневное цифровое взаимодействие в различных отраслях:

  • Машинный перевод: Такие сервисы, как Google Translate, используют передовые модели типа «последовательность в последовательность» для преобразования текста с одного языка на другой. Модель предсказывает вероятность последовательности целевого языка при заданной последовательности исходного языка, обеспечивая грамматическую точность.
  • Интеллектуальные помощники по программированию: Такие инструменты, как GitHub Copilot, функционируют как специализированные языковые модели, обученные на репозиториях кода. Они предсказывают синтаксис и логику для автозаполнения блоков кода, значительно ускоряя разработку программного обеспечения.
  • Предиктивный ввод текста и автокоррекция: На мобильных устройствах легкие модели выполняют инференс локально, предлагая следующее слово в сообщении и со временем адаптируясь к конкретному стилю набора текста пользователем.
  • Интеграция зрения и языка: В области компьютерного зрения (CV) языковые модели сочетаются с визуальными энкодерами. Это позволяет осуществлять «открытый поиск» (open-vocabulary detection), где ты можешь искать объекты, используя описания на естественном языке, а не заранее определенные категории.

Link to this sectionСоединяя текст и визуальное восприятие#

Хотя языковое моделирование в основном имеет дело с текстом, его принципы все чаще применяются в мультимодальном ИИ. Такие модели, как YOLO-World, интегрируют лингвистические возможности, позволяя пользователям динамически определять классы обнаружения с помощью текстовых подсказок. Это устраняет необходимость в переобучении при поиске новых объектов.

Следующий фрагмент Python демонстрирует, как использовать пакет ultralytics для использования текстовых описаний при обнаружении объектов:

from ultralytics import YOLOWorld

# Load a model capable of understanding natural language prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using text descriptions via the language model encoder
# The model uses internal embeddings to map 'text' to 'visual features'
model.set_classes(["person in red shirt", "blue car"])

# Run inference to detect these specific text-defined objects
results = model.predict("street_scene.jpg")

# Display the results
results[0].show()

Link to this sectionРазграничение похожих концепций#

Полезно отличать языковое моделирование от связанных терминов, которые часто используются как взаимозаменяемые:

  • Языковое моделирование против больших языковых моделей (LLM): Языковое моделирование — это фундаментальная задача или математический метод. LLM, например серия GPT, — это конкретный, массивный экземпляр модели, разработанный для выполнения этой задачи, обученный на петабайтах данных с миллиардами параметров.
  • Языковое моделирование против генеративного ИИ: Генеративный ИИ — это широкая категория, охватывающая любой ИИ, создающий новый контент (изображения, аудио, код). Языковое моделирование — это конкретный механизм, который обеспечивает текстовую подмножество генеративного ИИ.
  • Языковое моделирование против обнаружения объектов: Традиционные модели обнаружения, такие как YOLO26, обучаются на фиксированных визуальных метках. Языковые модели работают с вероятностью последовательности в тексте. Однако технологии, такие как CLIP, преодолевают этот разрыв, обучаясь ассоциировать визуальные концепции с лингвистическими описаниями.

Link to this sectionПроблемы и перспективы на будущее#

Несмотря на свою полезность, языковые модели сталкиваются с проблемами, связанными с предвзятостью в ИИ, поскольку они могут непреднамеренно воспроизводить предубеждения, содержащиеся в их обучающих наборах данных. Кроме того, обучение этих моделей требует огромных вычислительных ресурсов. Такие решения, как Ultralytics Platform, помогают оптимизировать управление наборами данных и рабочими процессами обучения, упрощая донастройку моделей для конкретных приложений. Будущие исследования направлены на повышение эффективности этих моделей за счет квантования моделей, что позволит мощным средствам понимания языка работать непосредственно на устройствах Edge AI без необходимости подключения к облаку.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения