Thuật ngữ

Nhúng

Tìm hiểu nhúng là gì và cách chúng hỗ trợ AI bằng cách nắm bắt các mối quan hệ ngữ nghĩa trong dữ liệu cho NLP, đề xuất và thị giác máy tính.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trong lĩnh vực học máy (ML)trí tuệ nhân tạo (AI) , nhúng là một kỹ thuật cơ bản để biểu diễn dữ liệu phức tạp—chẳng hạn như từ, câu, hình ảnh hoặc các mục khác—dưới dạng các vectơ số dày đặc trong không gian đa chiều. Sự biến đổi này được học từ dữ liệu, cho phép các thuật toán nắm bắt ý nghĩa ngữ nghĩa, bối cảnh hoặc các đặc điểm thiết yếu của đầu vào. Ưu điểm chính là các mục được coi là tương tự dựa trên dữ liệu đào tạo được ánh xạ tới các điểm gần đó trong "không gian nhúng" này, cho phép máy hiểu các mối quan hệ và mẫu phức tạp hiệu quả hơn nhiều so với các biểu diễn thưa thớt truyền thống như mã hóa one-hot.

Nhúng là gì?

Nhúng là các biểu diễn vectơ có chiều tương đối thấp đã học của các biến rời rạc (như từ) hoặc các đối tượng phức tạp (như hình ảnh hoặc hồ sơ người dùng). Không giống như các phương pháp như mã hóa one-hot tạo ra các vectơ thưa thớt, có chiều rất cao, trong đó mỗi chiều tương ứng với một mục duy nhất và thiếu thông tin mối quan hệ vốn có, nhúng là các vectơ dày đặc (thường có hàng chục đến hàng nghìn chiều) trong đó mỗi chiều góp phần biểu diễn các đặc điểm của mục. Quan trọng là, vị trí của các vectơ này trong không gian nhúng nắm bắt các mối quan hệ ngữ nghĩa. Ví dụ, trong nhúng từ, các từ có nghĩa tương tự hoặc được sử dụng trong các ngữ cảnh tương tự, như "vua" và "nữ hoàng" hoặc "đi bộ" và "chạy", sẽ có các vectơ gần nhau về mặt toán học (ví dụ: sử dụng Cosine Similarity ). Sự gần gũi này phản ánh sự giống nhau về mặt ngữ nghĩa đã học được từ dữ liệu.

Cách thức hoạt động của nhúng

Nhúng thường được tạo bằng cách sử dụng các mô hình mạng nơ-ron (NN) được đào tạo trên các tập dữ liệu lớn thông qua các kỹ thuật như học tự giám sát . Ví dụ, một kỹ thuật phổ biến cho nhúng từ, được minh họa bằng Word2Vec , liên quan đến việc đào tạo một mô hình để dự đoán một từ dựa trên các từ xung quanh (ngữ cảnh của nó) trong một ngữ liệu văn bản lớn. Trong quá trình đào tạo này, mạng điều chỉnh các tham số nội bộ của nó, bao gồm các vectơ nhúng cho mỗi từ, để giảm thiểu lỗi dự đoán thông qua các phương pháp như truyền ngược . Các vectơ kết quả mã hóa ngầm thông tin cú pháp và ngữ nghĩa. Số chiều trong không gian nhúng là một siêu tham số quan trọng, ảnh hưởng đến khả năng nắm bắt chi tiết của mô hình so với chi phí tính toán và rủi ro quá khớp . Việc trực quan hóa các không gian dữ liệu nhiều chiều này thường yêu cầu các kỹ thuật giảm chiều như t-SNE hoặc PCA , có thể được khám phá bằng các công cụ như Máy chiếu TensorFlow .

Ứng dụng của nhúng

Nhúng là thành phần quan trọng trong nhiều hệ thống AI hiện đại trên nhiều lĩnh vực khác nhau:

  • Xử lý ngôn ngữ tự nhiên (NLP) : Nhúng biểu diễn các từ, câu hoặc toàn bộ tài liệu. Các mô hình như kiến trúc BERTTransformer phụ thuộc rất nhiều vào nhúng để hiểu các sắc thái ngôn ngữ cho các tác vụ như dịch máy , phân tích tình cảm , trả lời câu hỏi và cung cấp năng lượng cho tìm kiếm ngữ nghĩa hiệu quả. Ví dụ: Một chatbot hỗ trợ khách hàng sử dụng nhúng câu để tìm câu trả lời phù hợp nhất trong cơ sở kiến thức của mình ngay cả khi truy vấn của người dùng không sử dụng chính xác các từ khóa.
  • Hệ thống đề xuất : Nhúng có thể biểu diễn người dùng và mục (như phim, sản phẩm hoặc bài viết). Bằng cách học nhúng sao cho người dùng và mục họ thích gần nhau trong không gian nhúng, hệ thống có thể đề xuất mục mới tương tự như mục mà người dùng đã tương tác trước đó hoặc thích bởi những người dùng tương tự ( lọc cộng tác ). Các công ty như NetflixAmazon sử dụng rộng rãi điều này.
  • Computer Vision (CV) : Hình ảnh hoặc các bản vá hình ảnh có thể được chuyển đổi thành các phần nhúng để nắm bắt các đặc điểm trực quan. Đây là điều cơ bản đối với các tác vụ như truy xuất hình ảnh (tìm các hình ảnh tương tự về mặt thị giác), phân loại hình ảnh và đóng vai trò là cơ sở cho các tác vụ phức tạp hơn như phát hiện đối tượngphân đoạn hình ảnh được thực hiện bởi các mô hình như Ultralytics YOLO . Ví dụ: Một nền tảng thương mại điện tử sử dụng các phần nhúng hình ảnh để cho phép người dùng tải lên ảnh của một mặt hàng quần áo và tìm các sản phẩm tương tự trong danh mục của họ. Các nền tảng như Ultralytics HUB tạo điều kiện thuận lợi cho việc đào tạo và triển khai các mô hình như vậy.
  • Phân tích đồ thị : Nhúng có thể biểu diễn các nút và cạnh trong đồ thị, nắm bắt cấu trúc mạng và mối quan hệ giữa các nút cho các tác vụ như dự đoán liên kết hoặc phát hiện cộng đồng, thường sử dụng Mạng nơ-ron đồ thị (GNN) .

Nhúng so với các khái niệm liên quan

Sẽ rất hữu ích khi phân biệt nhúng với các thuật ngữ liên quan:

  • Nhúng so với Trích xuất tính năng : Nhúng là một dạng trích xuất tính năng phức tạp, thường tự động đạt được thông qua học sâu . Trong khi kỹ thuật tính năng truyền thống có thể liên quan đến việc xác định tính năng theo cách thủ công (ví dụ: biểu đồ màu cho hình ảnh), nhúng học các tính năng có liên quan trực tiếp từ dữ liệu trong quá trình đào tạo.
  • Nhúng so với Tìm kiếm vectơ / Cơ sở dữ liệu vectơ : Nhúng là biểu diễn vectơ của các mục dữ liệu. Tìm kiếm vectơ là quá trình truy vấn một tập hợp các nhúng để tìm ra những nhúng giống nhất (gần nhất) với vectơ truy vấn, thường sử dụng thuật toán Xấp xỉ lân cận gần nhất (ANN) để đạt hiệu quả. Cơ sở dữ liệu vectơ (như Pinecone hoặc Milvus ) là cơ sở dữ liệu chuyên biệt được tối ưu hóa để lưu trữ, lập chỉ mục và thực hiện tìm kiếm vectơ nhanh trên khối lượng nhúng lớn.

Nhúng cung cấp một cách mạnh mẽ để biểu diễn dữ liệu cho các mô hình học máy, cho phép chúng hiểu được những điểm tương đồng về mặt ngữ nghĩa và các mẫu phức tạp trong nhiều loại dữ liệu khác nhau, từ văn bản đến hình ảnh. Chúng là công nghệ nền tảng thúc đẩy những tiến bộ trên nhiều ứng dụng AI và là một phần không thể thiếu trong khả năng của các khuôn khổ ML hiện đại như PyTorchTensorFlow .

Đọc tất cả