Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

t-distributed Stochastic Neighbor Embedding (t-SNE)

Khám phá cách t-SNE trực quan hóa dữ liệu đa chiều. Tìm hiểu cách tiết lộ các cụm trong các đặc trưng thị giác máy tính cho Ultralytics YOLO26 và tối ưu hóa các mô hình machine learning.

t-distributed Stochastic Neighbor Embedding (t-SNE) là một phương pháp thống kê để trực quan hóa dữ liệu đa chiều bằng cách gán cho mỗi điểm dữ liệu một vị trí trên bản đồ hai hoặc ba chiều. Kỹ thuật này, một dạng giảm chiều dữ liệu phi tuyến tính, được sử dụng rộng rãi trong học máy để khám phá các tập dữ liệu chứa hàng trăm hoặc hàng nghìn đặc trưng. Không giống như các phương pháp tuyến tính tập trung vào việc bảo toàn các cấu trúc toàn cục, t-SNE vượt trội trong việc giữ các trường hợp tương tự gần nhau, từ đó làm lộ ra các cụm cục bộ và các đa tạp (manifolds) mà nếu không thì có thể vẫn bị ẩn giấu. Điều này biến nó thành một công cụ vô giá cho mọi thứ, từ nghiên cứu gen đến việc thấu hiểu logic nội tại của các mạng thần kinh sâu.

Link to this sectionCách thức hoạt động của t-SNE#

Ý tưởng cốt lõi đằng sau t-SNE liên quan đến việc chuyển đổi các điểm tương đồng giữa các điểm dữ liệu thành xác suất kết hợp. Trong không gian đa chiều ban đầu, thuật toán đo lường sự tương đồng giữa các điểm bằng cách sử dụng phân phối Gaussian. Nếu hai điểm gần nhau, chúng có xác suất cao là "hàng xóm" của nhau. Sau đó, thuật toán cố gắng ánh xạ các điểm này vào không gian có chiều thấp hơn (thường là 2D hoặc 3D) trong khi vẫn duy trì các xác suất này.

Để đạt được điều này, thuật toán xác định một phân phối xác suất tương tự trong bản đồ có chiều thấp hơn bằng cách sử dụng phân phối t của Student. Phân phối cụ thể này có phần đuôi dày hơn phân phối Gaussian chuẩn, giúp giải quyết "vấn đề chen lấn" (crowding problem)—một hiện tượng mà tại đó các điểm trong không gian đa chiều có xu hướng chồng chất lên nhau khi được chiếu xuống. Bằng cách đẩy các điểm không tương đồng ra xa hơn trong quá trình trực quan hóa, t-SNE tạo ra các cụm riêng biệt, dễ đọc, giúp tiết lộ cấu trúc cơ bản của dữ liệu huấn luyện. Thuật toán học cách biểu diễn bản đồ tốt nhất một cách hiệu quả thông qua học không giám sát bằng cách giảm thiểu sự khác biệt (divergence) giữa các phân phối xác suất đa chiều và chiều thấp.

Link to this sectionCác ứng dụng thực tế trong AI#

t-SNE là một công cụ tiêu chuẩn cho phân tích dữ liệu khám phá (EDA) và chẩn đoán mô hình. Nó cho phép các kỹ sư "nhìn thấy" những gì một mô hình đang học.

  • Xác minh các đặc trưng thị giác máy tính: Trong các quy trình phát hiện đối tượng sử dụng các mô hình như YOLO26, các nhà phát triển thường cần kiểm tra xem mạng có thể phân biệt giữa các lớp có đặc điểm thị giác tương tự nhau hay không. Bằng cách trích xuất các bản đồ đặc trưng từ các lớp cuối cùng của mạng và chiếu chúng bằng t-SNE, các kỹ sư có thể trực quan hóa xem liệu các hình ảnh "mèo" có phân cụm tách biệt khỏi "chó" hay không. Nếu các cụm bị trộn lẫn, điều đó gợi ý rằng khả năng trích xuất đặc trưng của mô hình cần được cải thiện.
  • Xử lý ngôn ngữ tự nhiên (NLP): t-SNE được sử dụng rất nhiều để trực quan hóa các nhúng từ. Khi các vector từ đa chiều (thường từ 300 chiều trở lên) được chiếu vào không gian 2D, các từ có ý nghĩa ngữ nghĩa tương tự sẽ tự nhiên nhóm lại với nhau. Ví dụ, một biểu đồ t-SNE có thể hiển thị một cụm chứa "vua", "nữ hoàng", "hoàng tử" và "quân chủ", chứng minh rằng mô hình Xử lý ngôn ngữ tự nhiên (NLP) đã nắm bắt được khái niệm về hoàng gia.
  • Di truyền học và Tin sinh học: Các nhà nghiên cứu sử dụng t-SNE để trực quan hóa dữ liệu giải trình tự RNA đơn bào. Bằng cách giảm hàng nghìn giá trị biểu hiện gen thành một biểu đồ 2D, các nhà khoa học có thể xác định các loại tế bào riêng biệt và theo dõi các quỹ đạo phát triển, hỗ trợ khám phá các hiểu biết sinh học mới và các dấu hiệu bệnh tật.

Link to this sectionSo sánh với PCA#

Điều quan trọng là phải phân biệt t-SNE với Phân tích thành phần chính (PCA), một kỹ thuật giảm chiều phổ biến khác.

  • PCA là một kỹ thuật tuyến tính tập trung vào việc bảo toàn phương sai toàn cục của dữ liệu. Nó mang tính quyết định và hiệu quả về mặt tính toán, khiến nó trở nên tuyệt vời cho việc nén dữ liệu ban đầu hoặc giảm nhiễu.
  • t-SNE là một kỹ thuật phi tuyến tính tập trung vào việc bảo toàn các vùng lân cận cục bộ. Nó mang tính xác suất (ngẫu nhiên) và đòi hỏi tài nguyên tính toán cao hơn, nhưng nó tạo ra các bản trực quan hóa tốt hơn nhiều cho các đa tạp phi tuyến tính phức tạp.

Một phương pháp thực hành tốt nhất phổ biến trong tiền xử lý dữ liệu là sử dụng PCA trước để giảm dữ liệu xuống kích thước có thể quản lý được (ví dụ: 50 chiều) và sau đó áp dụng t-SNE cho việc trực quan hóa cuối cùng. Cách tiếp cận kết hợp này giúp giảm tải tính toán và lọc bỏ nhiễu có thể làm giảm chất lượng kết quả t-SNE.

Link to this sectionVí dụ Python: Trực quan hóa đặc trưng#

Ví dụ sau đây minh họa cách sử dụng scikit-learn để áp dụng t-SNE vào một tập dữ liệu tổng hợp. Quy trình này phản ánh cách người ta có thể trực quan hóa các đặc trưng được trích xuất từ một mô hình học sâu.

import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.manifold import TSNE

# Generate synthetic high-dimensional data (100 samples, 50 features, 3 centers)
X, y = make_blobs(n_samples=100, n_features=50, centers=3, random_state=42)

# Apply t-SNE to reduce dimensions from 50 to 2
# 'perplexity' balances local vs global aspects of the data
tsne = TSNE(n_components=2, perplexity=30, random_state=42)
X_embedded = tsne.fit_transform(X)

# Plot the result to visualize the 3 distinct clusters
plt.scatter(X_embedded[:, 0], X_embedded[:, 1], c=y)
plt.title("t-SNE Projection of High-Dimensional Data")
plt.show()

Link to this sectionCác cân nhắc chính#

Mặc dù mạnh mẽ, t-SNE đòi hỏi sự tinh chỉnh siêu tham số cẩn thận. Tham số "perplexity" là cực kỳ quan trọng; nó về cơ bản dự đoán xem mỗi điểm có bao nhiêu hàng xóm gần nhất. Việc đặt tham số này quá thấp hoặc quá cao có thể dẫn đến các trực quan hóa gây hiểu lầm. Hơn nữa, t-SNE không bảo toàn tốt khoảng cách toàn cục—nghĩa là khoảng cách giữa hai cụm riêng biệt trên biểu đồ không nhất thiết phản ánh khoảng cách vật lý của chúng trong không gian ban đầu. Mặc dù có những sắc thái này, nó vẫn là một kỹ thuật nền tảng để xác thực các kiến trúc thị giác máy tính (CV) và thấu hiểu các tập dữ liệu phức tạp. Những người dùng quản lý các tập dữ liệu quy mô lớn thường tận dụng Nền tảng Ultralytics để tổ chức dữ liệu của họ trước khi thực hiện các phân tích chuyên sâu như vậy.

Explore solutions

Real-time defect detection with Ultralytics YOLO

Defect Detection

YOLO-based vision AI detects defects in steel, PCBs, fabric, solar panels, and welds, with peer-reviewed accuracy up to 99.4% and up to 94.5% lower inspection cost.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time defect detection with Ultralytics YOLO

Defect Detection

YOLO-based vision AI detects defects in steel, PCBs, fabric, solar panels, and welds, with peer-reviewed accuracy up to 99.4% and up to 94.5% lower inspection cost.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time defect detection with Ultralytics YOLO

Defect Detection

YOLO-based vision AI detects defects in steel, PCBs, fabric, solar panels, and welds, with peer-reviewed accuracy up to 99.4% and up to 94.5% lower inspection cost.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning