Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Фундаментальная модель

Изучите возможности базовых моделей в области искусственного интеллекта. Узнайте, как адаптировать крупномасштабные модели, такие как Ultralytics , для выполнения пользовательских задач с помощью Ultralytics .

Фундаментальная модель представляет собой значительный сдвиг парадигмы в области искусственного интеллекта (ИИ). Это крупномасштабная модель машинного обучения, обученная на огромном количестве данных — часто включающих миллиарды параметров — которая может быть адаптирована к широкому спектру последующих задач. В отличие от традиционных моделей машинного обучения (МО), которые обычно создаются для конкретной, единичной цели, такой как классификация определенного вида цветов, базовая модель изучает общие закономерности, структуры и взаимосвязи на этапе предварительного обучения, требующем значительных ресурсов. Эта обширная база знаний позволяет разработчикам применять модель к новым задачам посредством переноса обучения, что значительно сокращает время и объем данных, необходимых для достижения передовых результатов.

Основные механизмы: предварительная подготовка и адаптация

Сила базовой модели заключается в двухэтапном процессе ее разработки: предварительной подготовке и тонкой настройке. Во время предварительной подготовки модель подвергается воздействию огромных наборов данных, таких как большие части Интернета, разнообразные библиотеки изображений или обширные репозитории кода. На этом этапе часто используется самоконтролируемое обучение — техника, при которой модель генерирует собственные метки из самой структуры данных, устраняя узкое место ручной анотации данных. Например, языковая модель может научиться предсказывать следующее слово в предложении, а модель зрения — понимать края, текстуры и постоянство объектов.

После предварительного обучения модель служит универсальной отправной точкой. С помощью процесса, называемого точной настройкой, разработчики могут корректировать веса модели на меньшем наборе данных, специфичном для конкретной области. Эта возможность имеет ключевое значение для демократизации ИИ, поскольку позволяет организациям с ограниченными вычислительными ресурсами использовать мощные архитектуры. Современные рабочие процессы часто используют такие инструменты, как Ultralytics , для оптимизации этого процесса адаптации, что позволяет эффективно обучать модель на пользовательских наборах данных без необходимости создавать нейронную сеть с нуля.

Применение в реальном мире

Фундаментальные модели служат основой для инноваций в различных отраслях. Их способность к обобщению позволяет применять их для решения задач от обработки естественного языка до сложного компьютерного зрения.

  • Компьютерное зрение в здравоохранении: Специализированные базовые модели зрительного восприятия могут быть точно настроены для помощи в анализе медицинских изображений. Модель, первоначально обученная на общих изображениях, может быть адаптирована для detect на МРТ-сканах или выявления переломов на рентгеновских снимках. Это приложение демонстрирует, как общее визуальное понимание превращается в спасающие жизнь диагностические инструменты.
  • Промышленная автоматизация: В производстве модели машинного зрения, такие как Ultralytics , функционируют в качестве базовых архитектур для обнаружения объектов. Заводы используют эти модели для автоматизации контроля качества, обнаруживая дефекты на сборочных линиях с высокой скоростью и точностью. Существующие в модели знания о границах объектов ускоряют внедрение этих интеллектуальных производственных решений.

Пример технической реализации

Разработчики могут использовать базовые модели для выполнения сложных задач с минимальным количеством кода. В следующем примере показано, как загрузить предварительно обученную модель YOLO26— базовую модель визуального восприятия, оптимизированную для приложений реального времени, — и выполнить обнаружение объектов на изображении.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")

# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Дифференциация ключевых терминов

Полезно отличать «базовую модель» от связанных с ней концепций в сфере искусственного интеллекта, чтобы понять их конкретные роли:

  • Большая языковая модель (LLM): LLM — это тип базовой модели, специально разработанной для обработки и генерации текста. Хотя все LLM являются базовыми моделями, не все базовые модели являются LLM; в эту категорию также входят модели зрения, такие как SAM Segment Anything Model), и мультимодальные системы.
  • Перенос обучения: это метод, используемый для применения базовой модели к новой задаче. Базовая модель — это артефакт (сохраненная нейронная сеть), а перенос обучения — это процесс обновления знаний этого артефакта для конкретного случая использования , например для борьбы с вредителями в сельском хозяйстве.
  • Генеративный ИИ: это системы, способные создавать новый контент (текст, изображения, код). Многие базовые модели лежат в основе генеративных ИИ-приложений, но они также могут использоваться для дискриминативных задач, таких как классификация или отслеживание объектов, которые не являются строго «генеративными».

Будущие направления и влияние

Эволюция базовых моделей движется в направлении мультимодального ИИ, когда одна система может одновременно обрабатывать и связывать информацию из текста, изображений, аудио и данных датчиков. Исследования таких учреждений, как Стэнфордский институт человекоцентрированного ИИ (HAI), подчеркивают потенциал этих систем в плане способности рассуждать о мире так же, как это делают люди. По мере того, как эти модели становятся более эффективными, их внедрение на периферийных вычислительных устройствах становится все более осуществимым, что позволяет напрямую использовать мощные возможности ИИ в смартфонах, дронах и датчиках IoT.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас