Yolo Vision Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Nhúng (Embeddings)

Tìm hiểu về nhúng (embeddings) và cách chúng hỗ trợ AI bằng cách nắm bắt các mối quan hệ ngữ nghĩa trong dữ liệu cho NLP, hệ thống đề xuất và thị giác máy tính.

Embeddings là nền tảng của máy học (ML) hiện đại, đại diện cho một phương pháp mạnh mẽ để chuyển đổi dữ liệu chiều cao, chẳng hạn như từ ngữ, hình ảnh hoặc thậm chí người dùng, thành các vector số có ý nghĩa, dày đặc và chiều thấp. Mục tiêu chính của embedding là nắm bắt các mối quan hệ ngữ nghĩa và ngữ cảnh cơ bản của dữ liệu gốc. Trong không gian vector này, các mục có ý nghĩa hoặc đặc điểm tương tự được định vị gần nhau hơn. Điều này cho phép các mô hình AI thực hiện các tác vụ suy luận và tương đồng phức tạp mà không thể thực hiện được với dữ liệu thô, phi cấu trúc.

Cách tạo Embeddings

Embeddings thường được học tự động bởi một mô hình học sâu trong quá trình huấn luyện. Một mạng nơ-ron, thường được xây dựng bằng các framework như PyTorch hoặc TensorFlow, được huấn luyện trên một tác vụ liên quan, chẳng hạn như dự đoán từ tiếp theo trong một câu hoặc phân loại một hình ảnh. Một trong các lớp ẩn trong mạng này sau đó được sử dụng làm lớp embedding. Khi mô hình học cách thực hiện tác vụ của mình, nó sẽ điều chỉnh trọng số trong lớp này, học cách ánh xạ từng mục đầu vào thành một vector bao gồm các đặc trưng quan trọng nhất của nó. Quá trình này là một hình thức giảm chiều dữ liệu, nén một lượng lớn thông tin thành một định dạng nhỏ gọn và hữu ích.

Các ứng dụng và ví dụ

Embeddings là nền tảng cho một loạt các ứng dụng AI, từ xử lý ngôn ngữ tự nhiên (NLP) đến thị giác máy tính.

  • E-commerce Recommendation Engines (Công cụ đề xuất thương mại điện tử): Hệ thống đề xuất sử dụng các embedding để biểu diễn cả người dùng và sản phẩm. Nếu người dùng thường xuyên mua hoặc xem các mặt hàng có embedding tương tự (ví dụ: các loại thiết bị chạy khác nhau), hệ thống có thể xác định các sản phẩm khác trong vùng lân cận vectơ đó (như gel năng lượng hoặc bộ hydrat hóa) và đề xuất chúng. Điều này hiệu quả hơn nhiều so với việc chỉ khớp từ khóa đơn giản.
  • Tìm kiếm Ngữ nghĩa và Truy xuất Hình ảnh: Thay vì dựa vào thẻ hoặc siêu dữ liệu, các hệ thống tìm kiếm ngữ nghĩa sử dụng các embedding để tìm kết quả dựa trên ý nghĩa khái niệm. Người dùng có thể tìm kiếm "ảnh kỳ nghỉ hè" và hệ thống sẽ truy xuất hình ảnh về bãi biển, núi và cảnh du lịch, ngay cả khi những từ chính xác đó không có trong mô tả của hình ảnh. Điều này được hỗ trợ bởi các mô hình như CLIP, tạo ra các embedding được căn chỉnh cho cả văn bản và hình ảnh, cho phép các khả năng mô hình đa phương thức mạnh mẽ. Nguyên tắc tương tự này cho phép tìm kiếm trực quan mạnh mẽ, một tính năng quan trọng trong nhiều ứng dụng hiện đại. Bạn thậm chí có thể tự xây dựng với hướng dẫn tìm kiếm tương đồng của chúng tôi.

Các ứng dụng khác bao gồm khám phá thuốc, nơi các phân tử được nhúng để dự đoán tương tác và các dịch vụ phát nhạc trực tuyến đề xuất các bài hát có các tính năng âm thanh tương tự.

Nhúng (Embeddings) so với Các Khái Niệm Liên Quan

Sẽ hữu ích khi phân biệt nhúng (embeddings) với các thuật ngữ liên quan:

  • Nhúng (Embeddings) so với Trích xuất đặc trưng (Feature Extraction): Nhúng (Embeddings) là một hình thức trích xuất đặc trưng (feature extraction) phức tạp, thường tự động, đạt được thông qua học sâu (deep learning). Trong khi kỹ thuật đặc trưng (feature engineering) truyền thống có thể liên quan đến việc xác định thủ công các đặc trưng (ví dụ: biểu đồ màu cho hình ảnh), thì nhúng (embeddings) học các đặc trưng có liên quan trực tiếp từ dữ liệu trong quá trình huấn luyện.
  • Embeddings so với Tìm kiếm Vector / Cơ sở dữ liệu Vector: Embeddings là các biểu diễn vector của các mục dữ liệu. Tìm kiếm vector là quá trình truy vấn một tập hợp các embeddings để tìm những embeddings tương tự nhất (gần nhất) với một vector truy vấn, thường sử dụng các thuật toán Tìm kiếm lân cận gần đúng (Approximate Nearest Neighbor - ANN) để đạt hiệu quả. Cơ sở dữ liệu vector (như Pinecone hoặc Milvus) là các cơ sở dữ liệu chuyên dụng được tối ưu hóa để lưu trữ, lập chỉ mục và thực hiện tìm kiếm vector nhanh chóng trên khối lượng lớn embeddings.
  • Embeddings so với Tokenization: Tokenization là quá trình chia nhỏ văn bản thành các đơn vị nhỏ hơn (tokens). Sau đó, các tokens này được ánh xạ tới embeddings. Vì vậy, tokenization là một bước sơ bộ trước khi biểu diễn embedding được tạo hoặc truy xuất. Các mô hình NLP nổi tiếng như BERTGPT-4 dựa trên quy trình hai bước này.

Embeddings cung cấp một cách mạnh mẽ để biểu diễn dữ liệu cho các mô hình máy học, cho phép chúng hiểu được sự tương đồng về ngữ nghĩa và các mẫu phức tạp trong các loại dữ liệu khác nhau. Chúng là một phần không thể thiếu trong khả năng của các nền tảng ML hiện đại như Ultralytics HUB, giúp đơn giản hóa việc tạo các mô hình AI tiên tiến cho các tác vụ như phát hiện đối tượngphân loại hình ảnh.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard