Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Large Language Model (LLM)

Изучи основы больших языковых моделей (LLM). Узнай об архитектуре трансформеров, токенизации и о том, как объединить LLM с Ultralytics YOLO26.

Большая языковая модель (LLM) — это сложный тип искусственного интеллекта (AI), обученный на огромных наборах данных для понимания, генерации и обработки человеческого языка. Эти модели представляют собой значительную эволюцию в глубинном обучении (DL), используя нейронные сети с миллиардами параметров для улавливания сложных лингвистических закономерностей, грамматики и семантических взаимосвязей. В основе большинства современных LLM лежит архитектура Transformer, которая позволяет им обрабатывать последовательности данных параллельно, а не последовательно. Эта архитектура использует механизм self-attention, позволяющий модели взвешивать важность разных слов в предложении по отношению друг к другу, независимо от их расстояния в тексте.

Link to this sectionОсновные механизмы LLM#

Функционирование LLM начинается с токенизации — процесса, при котором необработанный текст разбивается на более мелкие единицы, называемые токенами (слова или части слов). Во время фазы обучения модели система анализирует петабайты текста из интернета, книг и статей. Она использует обучение без учителя для прогнозирования следующего токена в последовательности, эффективно изучая статистическую структуру языка.

После этого начального обучения разработчики часто применяют тонкую настройку (fine-tuning), чтобы специализировать модель для конкретных задач, таких как медицинский анализ или помощь в программировании. Именно из-за такой адаптивности организации, такие как Стэнфордский центр исследований фундаментальных моделей, классифицируют их как «фундаментальные модели» — широкие базы, на которых строятся конкретные приложения.

Link to this sectionРеальные приложения#

LLM вышли за рамки теоретических исследований и теперь применяются в практических задачах с высокой отдачей в различных отраслях:

  • Интеллектуальные виртуальные помощники: Современное обслуживание клиентов в значительной степени опирается на чат-ботов на базе LLM. В отличие от старых систем, основанных на правилах, эти агенты могут обрабатывать сложные запросы. Чтобы повысить точность и уменьшить галлюцинации, разработчики интегрируют Retrieval Augmented Generation (RAG), что позволяет модели обращаться к внешним актуальным документам компании перед тем, как дать ответ.
  • Мультимодальные системы «зрение-язык»: Передовой край AI соединяет текст с визуальными данными. Vision-Language Models (VLM) позволяют пользователям делать запросы к изображениям с помощью естественного языка. Например, объединение лингвистического интерфейса с надежным детектором, таким как YOLO26, позволяет системам идентифицировать и описывать объекты в потоках видео в реальном времени на основе голосовых команд.

Link to this sectionОбъединение текста и зрения с помощью кода#

В то время как стандартные LLM обрабатывают текст, индустрия переходит к мультимодальному AI. Следующий пример демонстрирует, как лингвистические подсказки могут управлять задачами компьютерного зрения с помощью YOLO-World — модели, которая понимает текстовые дескрипторы для детекции с открытым словарем.

from ultralytics import YOLOWorld

# Load a model capable of understanding natural language prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using text descriptions rather than fixed labels
model.set_classes(["person wearing a red helmet", "blue industrial machine"])

# Run inference to detect these specific text-defined objects
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Show results
results[0].show()

Link to this sectionРазграничение похожих концепций#

Важно отличать LLM от более широких или параллельных терминов:

  • LLM против Natural Language Processing (NLP): NLP — это общая академическая дисциплина, занимающаяся взаимодействием между компьютерами и человеческим языком. LLM — это конкретный инструмент или технология, используемые в рамках этой области для достижения передовых результатов.
  • LLM против Generative AI: Generative AI — это категория, охватывающая любой AI, способный создавать новый контент. LLM являются текстовым подмножеством этой категории, тогда как модели, такие как Stable Diffusion, представляют подмножество генерации изображений.

Link to this sectionПроблемы и перспективы на будущее#

Несмотря на свои возможности, LLM сталкиваются с проблемами, связанными с предвзятостью в AI, так как они могут непреднамеренно воспроизводить предубеждения, содержащиеся в их обучающих данных. Кроме того, огромная вычислительная мощность, необходимая для обучения таких моделей, как GPT-4 или Google Gemini, вызывает опасения по поводу энергопотребления. В настоящее время исследования сосредоточены на квантовании моделей, чтобы сделать эти системы достаточно эффективными для работы на пограничном оборудовании (edge hardware).

Для более глубокого технического понимания оригинальная статья Attention Is All You Need предоставляет фундаментальную теорию для Transformers. Ты также можешь изучить, как NVIDIA оптимизирует оборудование для этих массивных рабочих нагрузок.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения