Узнайте, как векторные базы данных управляют высокоразмерными вложениями для семантического поиска. Научитесь использовать Ultralytics и поиск по схожести для работы приложений искусственного интеллекта.
Векторная база данных — это специализированная система хранения, предназначенная для управления, индексирования и запроса высокоразмерных векторных данных, часто называемых вложениями. В отличие от традиционной реляционной базы данных, которая организует структурированные данные в строки и столбцы для точного сопоставления ключевых слов, векторная база данных оптимизирована для семантического поиска. Она позволяет интеллектуальным системам находить точки данных, которые концептуально схожи, а не идентичны. Эта способность имеет основополагающее значение для современной инфраструктуры искусственного интеллекта (ИИ) , позволяя приложениям обрабатывать и понимать неструктурированные данные, такие как изображения, аудио, видео и текст, путем анализа математических отношений между ними. Эти базы данных служат долгосрочной памятью для интеллектуальных агентов, облегчая такие задачи, как визуальный поиск и персонализированные рекомендации.
Функция векторной базы данных основана на концепции векторного пространства, в котором элементы данных отображаются в виде точек в многомерной системе координат. Процесс начинается с извлечения признаков, когда модель глубокого обучения (DL) преобразует исходные данные в числовые векторы.
Следующий Python демонстрирует, как генерировать вложения с помощью стандартного ultralytics модель,
которая является обязательным шагом перед заполнением векторной базы данных.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image file
# The 'embed' method creates the vector representation needed for the database
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
Векторные базы данных являются движущей силой многих передовых приложений компьютерного зрения (CV) и обработки естественного языка (NLP), используемых сегодня в корпоративных средах.
Для эффективной реализации этих систем полезно отличать векторную базу данных от связанных технологий в сфере операций машинного обучения (MLOps) .
Внедрение векторной базы данных часто предполагает использование конвейера, в котором такие модели, как эффективная YOLO26, выступают в качестве механизма встраивания. Эти модели обрабатывают визуальные данные на периферии или в облаке, а полученные векторы передаются в такие решения, как Pinecone, Milvus или Qdrant.
Для команд, стремящихся оптимизировать весь этот жизненный цикл — от курирования данных и автоматической аннотации до обучения моделей и их развертывания — Ultralytics предлагает комплексную среду. Благодаря интеграции обучения моделей с эффективными стратегиями развертывания разработчики могут обеспечить точность встраиваний, питающих их векторные базы данных, что приводит к более качественным результатам поиска и более умным ИИ- агентам.
Начните свой путь в будущее машинного обучения