Cosine Similarity

Tìm hiểu cách cosine similarity đo lường độ tương đồng vector trong AI. Tính toán các embedding thị giác với Ultralytics YOLO26 và mở rộng quy mô với Ultralytics Platform.

Độ tương đồng Cosine là một chỉ số toán học cơ bản được sử dụng trong machine learning (ML) và artificial intelligence (AI) để đo lường mức độ tương đồng giữa hai multi-dimensional arrays hoặc vectơ, bất kể kích thước hay độ lớn của chúng. Bằng cách tính góc giữa hai điểm trong một vector space, nó xác định xem các điểm đó có đang hướng về cùng một phía hay không. Cách tiếp cận dựa trên góc này rất quan trọng để xử lý dữ liệu nơi hướng quan trọng hơn độ dài tổng thể, làm cho nó trở nên hiệu quả cao trong việc so sánh các biểu diễn dữ liệu trừu tượng như embeddings.

Link to this sectionHiểu về toán học đằng sau chỉ số này#

Để tính chỉ số này, bạn tính dot product của hai vectơ và chia nó cho tích các magnitudes (độ dài) riêng lẻ của chúng. Điểm số thu được luôn nằm trong phạm vi cố định từ -1 đến 1:

Điểm số 1 có nghĩa là các vectơ cùng hướng chính xác, biểu thị sự tương đồng tối đa.
Điểm số 0 có nghĩa là các vectơ hoàn toàn orthogonal (ở góc 90 độ), nghĩa là không có sự tương đồng về hướng.
Điểm số -1 có nghĩa là chúng hướng theo các hướng hoàn toàn đối lập.

Trong nhiều framework deep learning hiện đại được thiết kế cho computer vision (CV), bạn có thể dễ dàng truy cập các hàm tối ưu hóa cho phép toán này, chẳng hạn như PyTorch's functional module hoặc TensorFlow metrics.

Link to this sectionPhân biệt các khái niệm liên quan#

Việc phân biệt độ tương đồng cosine với các phép đo data analytics thường dùng khác là rất hữu ích để hiểu khi nào nên sử dụng nó:

Cosine Distance: Mặc dù có liên quan chặt chẽ, các thuật ngữ này tỷ lệ nghịch với nhau. Cosine distance được tính đơn giản bằng 1 trừ đi độ tương đồng cosine. Do đó, khoảng cách nhỏ hơn biểu thị độ tương đồng giữa các vectơ cao hơn.
Euclidean Distance: Chỉ số này đo khoảng cách vật lý theo đường thẳng giữa hai điểm, khiến nó rất nhạy cảm với kích thước hoặc độ lớn tổng thể của các vectơ. Ngược lại, độ tương đồng cosine chỉ quan tâm đến góc. Ví dụ, trong phân tích văn bản, một tài liệu dài và một câu ngắn có thể có Euclidean distance lớn, nhưng nếu chúng chia sẻ cùng một chủ đề, độ tương đồng cosine của chúng sẽ vẫn cao.

Link to this sectionCác ứng dụng thực tế trong AI#

Độ tương đồng cosine đóng vai trò là động cơ cốt lõi cho nhiều sản phẩm phần mềm hiện đại, thu hẹp khoảng cách giữa dữ liệu thô và ý định của con người.

Vector Search and RAG: Trong các ứng dụng Natural Language Processing (NLP) như chatbot, các truy vấn người dùng và tài liệu nội bộ được chuyển đổi thành các dense embeddings. Hệ thống tính toán nhanh chóng độ tương đồng cosine để truy xuất các tài liệu có liên quan nhất về mặt ngữ cảnh từ một vector database, một bước quan trọng trong Retrieval-Augmented Generation (RAG).
Recommendation Systems: Các dịch vụ thương mại điện tử và phát trực tuyến sử dụng các công cụ như Scikit-learn and SciPy để biểu diễn sở thích người dùng và các mặt hàng trong danh mục dưới dạng vectơ. Bằng cách đo điểm tương đồng giữa hồ sơ người mua hàng và các sản phẩm khác nhau, các hệ thống có thể đề xuất chính xác các mục có liên quan về mặt hình ảnh hoặc chủ đề.

Link to this sectionĐo lường độ tương đồng hình ảnh với Ultralytics#

Bạn có thể trích xuất các vectơ đặc trưng chiều cao trực tiếp từ dữ liệu hình ảnh bằng cách sử dụng các mô hình thị giác hiện đại nhất. Mã Python sau đây minh họa cách tải mô hình Ultralytics YOLO26 cho image classification, tạo embeddings cho hai hình ảnh và thực hiện tính toán độ tương đồng cosine để đo lường mức độ giống nhau về mặt hình ảnh của chúng.

import torch
import torch.nn.functional as F
from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embedding vectors for two separate images
results = model.embed(["bus.jpg", "car.jpg"])

# Calculate the cosine similarity between the two visual embeddings
similarity = F.cosine_similarity(torch.tensor(results[0]), torch.tensor(results[1]), dim=0)
print(f"Visual Similarity Score: {similarity.item():.4f}")

Đối với các nhà phát triển muốn mở rộng quy mô các khả năng semantic search này, việc huấn luyện các mô hình cơ sở chính xác cao là điều tối quan trọng. Ultralytics Platform hợp lý hóa quy trình này bằng cách cung cấp các công cụ mạnh mẽ cho data annotation, huấn luyện trên đám mây có thể mở rộng và model deployment liền mạch, đảm bảo các embeddings cơ bản của bạn chính xác và có ý nghĩa nhất có thể.

Cosine Similarity

Link to this sectionHiểu về toán học đằng sau chỉ số này#

Link to this sectionPhân biệt các khái niệm liên quan#

Link to this sectionCác ứng dụng thực tế trong AI#

Link to this sectionĐo lường độ tương đồng hình ảnh với Ultralytics#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!