Узнайте, что такое embeddings и как они поддерживают AI, фиксируя семантические связи в данных для NLP, рекомендаций и компьютерного зрения.
Вложения — это плотные, низкоразмерные, непрерывные векторные представления дискретных переменных, служащие основой для преобразования данных человека в логику машины. В сфере искусственного интеллекта (ИИ) компьютеры не могут интуитивно понимать беспорядочные, неструктурированные данные, такие как текст, изображения или аудио. Внедрения решают эту проблему, преобразуя эти входные данные в списки действительных чисел, известных как векторы, которые существуют в высокоразмерном математическом пространстве. В отличие от традиционных кодировок, которые могут просто присваивать объекту случайный идентификатор, внедрения обучаются посредством тренировки, обеспечивая, чтобы семантически схожие элементы — такие как слова «король» и «королева» или изображения двух разных кошек — располагались близко друг к другу в векторном пространстве.
Создание встраивания включает в себя подачу необработанных данных в нейронную сеть, предназначенную для извлечения признаков. Во время обучения модель учится сжимать основные характеристики ввода в компактную числовую форму. Например, модель компьютерного зрения (CV), анализирующая фотографию, не просто видит пиксели; она отображает формы, текстуры и цвета в виде определенных координат на многомерном графике. При измерении схожести системы вычисляют расстояние между этими координатами, используя такие метрики, как косинусная схожесть или евклидово расстояние. Эта математическая близость позволяет алгоритмам с высокой эффективностью выполнять сложные задачи, такие как классификация и кластеризация.
Встраиваемые модули служат двигателем для многих интеллектуальных функций, используемых в современных программных продуктах.
Современные модели, такие как YOLO26 может использоваться для эффективного создания
надежных встраиваний изображений. Следующий пример демонстрирует, как извлечь вектор признаков из изображения
с помощью ultralytics Пакет Python .
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")
Для эффективного внедрения решений на основе искусственного интеллекта полезно различать вложения и близкие по значению технические термины.
Разработчики, которые хотят управлять жизненным циклом своих наборов данных, включая аннотирование и обучение моделей для генерации пользовательских встраиваний, могут использовать Ultralytics . Этот комплексный инструмент упрощает рабочий процесс от управления данными до развертывания, гарантируя, что встраивания, питающие ваши приложения, получены из высококачественных, тщательно отобранных данных. Независимо от того, используете ли вы такие фреймворки, как PyTorch или TensorFlow, освоение встраиваний является важным шагом в создании сложных систем распознавания образов.