Glosario

TPU (Unidad de Procesamiento Tensorial)

Descubra cómo las Unidades de Procesamiento Tensorial (TPU) aceleran las tareas de aprendizaje automático como el entrenamiento, la inferencia y la detección de objetos con una eficiencia inigualable.

Una Unidad de Procesamiento de Tensores, o TPU, es un tipo de acelerador de hardware personalizado desarrollado por Google específicamente para el aprendizaje automático (ML) y las cargas de trabajo de aprendizaje profundo. Estos circuitos integrados de aplicación específica (ASIC) están diseñados para acelerar drásticamente los cálculos de tensores y matrices que son fundamentales para el entrenamiento y la ejecución de redes neuronales. Las TPU están diseñadas para proporcionar un alto rendimiento y eficiencia energética para tareas de aprendizaje automático a gran escala, lo que las convierte en un componente crucial en la infraestructura de IA moderna.

Cómo funcionan las TPU

Las TPU están diseñadas para gestionar el enorme volumen de cálculos que requieren los modelos de IA. Su arquitectura está altamente optimizada para la operación matemática central en las redes neuronales: la multiplicación de matrices. A diferencia de los procesadores de propósito general, las TPU se centran en la aritmética de alto rendimiento y baja precisión, que se adapta bien a la naturaleza de los modelos de aprendizaje profundo. Al procesar enormes lotes de datos en paralelo, pueden reducir significativamente el tiempo necesario tanto para el entrenamiento del modelo como para la inferencia en tiempo real. Se accede a ellas más comúnmente a través de Google Cloud Platform y están estrechamente integradas con frameworks de ML como TensorFlow y PyTorch.

Aplicaciones en el mundo real

Las TPU son fundamentales para impulsar algunas de las aplicaciones de IA más exigentes disponibles en la actualidad.

Entrenamiento de modelos de lenguaje grandes (LLM): Google utiliza grandes clústeres de TPUs, conocidos como TPU Pods, para entrenar sus modelos fundacionales más avanzados, incluyendo los modelos detrás de su motor de búsqueda e IA conversacional como Gemini. La enorme capacidad de computación paralela de los TPU Pods les permite entrenar modelos con billones de parámetros en una fracción del tiempo que tomaría en otro hardware.
Impulsando los servicios de Google: Las TPU se utilizan para la inferencia en numerosos productos de Google. Por ejemplo, en Google Fotos, permiten el reconocimiento rápido de imágenes para buscar personas, objetos y escenas. Del mismo modo, impulsan la traducción en tiempo real en Google Translate y se utilizan para el reconocimiento de voz en el Asistente de Google. DeepMind también utilizó las TPU para entrenar AlphaGo, la IA que derrotó al mejor jugador de Go del mundo.

TPU vs GPU vs CPU

Aunque las TPU, GPU y CPU son todos procesadores, están diseñados para propósitos muy diferentes.

CPU (Unidad Central de Procesamiento): El "cerebro" de un ordenador, diseñado para tareas de propósito general. Una CPU destaca en el manejo de una amplia variedad de instrucciones de forma secuencial, lo que la hace esencial para ejecutar sistemas operativos y software estándar, pero menos eficiente para los cálculos paralelos masivos en la IA.
GPU (Unidad de Procesamiento Gráfico): Creada originalmente para el renderizado de gráficos, la arquitectura de una GPU contiene miles de núcleos, lo que la hace muy eficaz en el procesamiento paralelo. Las GPU de empresas como NVIDIA y AMD ofrecen un gran equilibrio entre rendimiento y flexibilidad, lo que las hace populares para el entrenamiento de modelos como Ultralytics YOLO11.
TPU: Un acelerador altamente especializado creado por Google específicamente para cargas de trabajo de redes neuronales. Si bien es menos flexible que una GPU para la computación general, una TPU ofrece un rendimiento por vatio superior para las operaciones de tensores a gran escala. Esto la convierte en una excelente opción para la implementación de modelos y el entrenamiento masivos, especialmente cuando se utiliza el ecosistema de la nube de Google.

El papel de las TPU en el ecosistema de Ultralytics

Los usuarios de Ultralytics pueden aprovechar las TPU para acelerar sus proyectos de visión artificial. Los modelos se pueden exportar a formatos compatibles con TPU, como TensorFlow Lite para Edge TPU de Google. Esto permite una implementación altamente eficiente en dispositivos edge como la Coral Dev Board. Para trabajos de entrenamiento a gran escala, plataformas como Ultralytics HUB pueden orquestar el entrenamiento en varios recursos de computación en la nube, lo que permite a los usuarios aprovechar la potencia de las TPU para sus conjuntos de datos personalizados. Esta integración facilita todo el ciclo de vida de MLOps, desde el entrenamiento hasta la implementación y la monitorización.

TPU (Unidad de Procesamiento Tensorial)

Entrena modelos Ultralytics YOLO para optimizar los flujos de trabajo en todas las industrias

Solución de licencias empresariales flexible para impulsar su innovación

Entrena modelos de IA en segundos con Ultralytics YOLO

Cómo funcionan las TPU

Aplicaciones en el mundo real

TPU vs GPU vs CPU

El papel de las TPU en el ecosistema de Ultralytics

Leer más en esta categoría

Lo más destacado de Ultralytics en la Conferencia PyTorch 2025

Aprendizaje autosupervisado para eliminar el ruido de las imágenes

Vision AI impulsa los sistemas de control de la atención del conductor

Únete a la comunidad de Ultralytics