Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

t-distributed Stochastic Neighbor Embedding (t-SNE)

Explora cómo t-SNE visualiza datos de alta dimensión. Aprende a revelar clústeres en las características de visión artificial para Ultralytics YOLO26 y optimiza los modelos de aprendizaje automático.

t-distributed Stochastic Neighbor Embedding (t-SNE) es un método estadístico para visualizar datos de alta dimensionalidad asignando a cada punto de datos una ubicación en un mapa bidimensional o tridimensional. Esta técnica, una forma de reducción de dimensionalidad no lineal, se utiliza ampliamente en el aprendizaje automático para explorar conjuntos de datos que contienen cientos o miles de características. A diferencia de los métodos lineales que se centran en preservar las estructuras globales, t-SNE destaca por mantener juntas las instancias similares, revelando clústeres locales y variedades que, de otro modo, podrían permanecer ocultos. Esto lo convierte en una herramienta inestimable para todo, desde la investigación genómica hasta la comprensión de la lógica interna de las redes neuronales profundas.

Link to this sectionCómo funciona t-SNE#

La idea central detrás de t-SNE consiste en convertir las similitudes entre los puntos de datos en probabilidades conjuntas. En el espacio original de alta dimensionalidad, el algoritmo mide la similitud entre puntos utilizando una distribución gaussiana. Si dos puntos están muy cerca, tienen una alta probabilidad de ser "vecinos". El algoritmo intenta entonces mapear estos puntos a un espacio de menor dimensión (normalmente 2D o 3D) manteniendo estas probabilidades.

Para lograrlo, define una distribución de probabilidad similar en el mapa de menor dimensión utilizando una distribución t de Student. Esta distribución específica tiene colas más pesadas que una distribución gaussiana normal, lo que ayuda a abordar el "problema de hacinamiento", un fenómeno en el que los puntos en un espacio de alta dimensionalidad tienden a colapsar unos sobre otros cuando se proyectan. Al alejar los puntos disimilares en la visualización, t-SNE crea clústeres distintos y legibles que revelan la estructura subyacente de los datos de entrenamiento. El algoritmo aprende eficazmente la mejor representación cartográfica mediante aprendizaje no supervisado al minimizar la divergencia entre las distribuciones de probabilidad de alta y baja dimensionalidad.

Link to this sectionAplicaciones en el mundo real en IA#

t-SNE es una herramienta estándar para el análisis exploratorio de datos (EDA) y el diagnóstico de modelos. Permite a los ingenieros "ver" lo que un modelo está aprendiendo.

  • Verificación de características de visión artificial: En flujos de trabajo de detección de objetos que utilizan modelos como YOLO26, los desarrolladores a menudo necesitan comprobar si la red puede distinguir entre clases visualmente similares. Al extraer los mapas de características de las capas finales de la red y proyectarlos con t-SNE, los ingenieros pueden visualizar si las imágenes de "gatos" se agrupan por separado de las de "perros". Si los clústeres están mezclados, sugiere que las capacidades de extracción de características del modelo necesitan mejoras.
  • Procesamiento de lenguaje natural (NLP): t-SNE se utiliza intensamente para visualizar embeddings de palabras. Cuando los vectores de palabras de alta dimensión (a menudo de más de 300 dimensiones) se proyectan en 2D, las palabras con significados semánticos similares se agrupan de forma natural. Por ejemplo, un gráfico de t-SNE podría mostrar un clúster que contenga "rey", "reina", "príncipe" y "monarca", lo que demuestra que el modelo de Procesamiento de lenguaje natural (NLP) comprende el concepto de realeza.
  • Genómica y bioinformática: Los investigadores utilizan t-SNE para visualizar datos de secuenciación de ARN de células individuales. Al reducir miles de valores de expresión génica en un gráfico 2D, los científicos pueden identificar tipos de células distintos y trazar trayectorias de desarrollo, ayudando al descubrimiento de nuevos conocimientos biológicos y marcadores de enfermedades.

Link to this sectionComparación con PCA#

Es importante distinguir t-SNE del Análisis de componentes principales (PCA), otra técnica de reducción común.

  • PCA es una técnica lineal que se centra en preservar la varianza global de los datos. Es determinista y computacionalmente eficiente, por lo que es excelente para la compresión inicial de datos o la reducción de ruido.
  • t-SNE es una técnica no lineal centrada en preservar los vecindarios locales. Es probabilística (estocástica) y computacionalmente más pesada, pero produce visualizaciones mucho mejores para variedades complejas y no lineales.

Una mejor práctica común en el preprocesamiento de datos consiste en utilizar primero PCA para reducir los datos a un tamaño manejable (por ejemplo, 50 dimensiones) y luego aplicar t-SNE para la visualización final. Este enfoque híbrido reduce la carga computacional y filtra el ruido que podría degradar el resultado de t-SNE.

Link to this sectionEjemplo en Python: Visualización de características#

El siguiente ejemplo demuestra cómo utilizar scikit-learn para aplicar t-SNE a un conjunto de datos sintético. Este flujo de trabajo refleja cómo se podrían visualizar las características extraídas de un modelo de aprendizaje profundo.

import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.manifold import TSNE

# Generate synthetic high-dimensional data (100 samples, 50 features, 3 centers)
X, y = make_blobs(n_samples=100, n_features=50, centers=3, random_state=42)

# Apply t-SNE to reduce dimensions from 50 to 2
# 'perplexity' balances local vs global aspects of the data
tsne = TSNE(n_components=2, perplexity=30, random_state=42)
X_embedded = tsne.fit_transform(X)

# Plot the result to visualize the 3 distinct clusters
plt.scatter(X_embedded[:, 0], X_embedded[:, 1], c=y)
plt.title("t-SNE Projection of High-Dimensional Data")
plt.show()

Link to this sectionConsideraciones clave#

Aunque potente, t-SNE requiere un cuidadoso ajuste de hiperparámetros. El parámetro "perplejidad" es fundamental; esencialmente adivina cuántos vecinos cercanos tiene cada punto. Establecerlo demasiado bajo o demasiado alto puede dar lugar a visualizaciones engañosas. Además, t-SNE no preserva bien las distancias globales, lo que significa que la distancia entre dos clústeres distintos en el gráfico no refleja necesariamente su distancia física en el espacio original. A pesar de estos matices, sigue siendo una técnica fundamental para validar arquitecturas de visión artificial (CV) y comprender conjuntos de datos complejos. Los usuarios que gestionan conjuntos de datos a gran escala suelen aprovechar la Plataforma Ultralytics para organizar sus datos antes de realizar un análisis tan exhaustivo.

Explore solutions

Real-time defect detection with Ultralytics YOLO

Defect Detection

YOLO-based vision AI detects defects in steel, PCBs, fabric, solar panels, and welds, with peer-reviewed accuracy up to 99.4% and up to 94.5% lower inspection cost.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time defect detection with Ultralytics YOLO

Defect Detection

YOLO-based vision AI detects defects in steel, PCBs, fabric, solar panels, and welds, with peer-reviewed accuracy up to 99.4% and up to 94.5% lower inspection cost.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time defect detection with Ultralytics YOLO

Defect Detection

YOLO-based vision AI detects defects in steel, PCBs, fabric, solar panels, and welds, with peer-reviewed accuracy up to 99.4% and up to 94.5% lower inspection cost.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático