Glosario

BERT (Bidirectional Encoder Representations from Transformers)

Descubra BERT, el revolucionario modelo de PNL de Google. Aprenda cómo su comprensión bidireccional del contexto transforma las tareas de IA como la búsqueda y los chatbots.

BERT, que significa Bidirectional Encoder Representations from Transformers (Representaciones de codificador bidireccional de Transformers), es un modelo de lenguaje revolucionario desarrollado por Google. Introducido en un artículo de investigación de 2018, BERT transformó el campo del Procesamiento del Lenguaje Natural (PNL) al ser el primer modelo en comprender el contexto de una palabra basándose en su entorno tanto desde la izquierda como desde la derecha (bidireccionalmente). Esta capacidad para captar el contexto permite a BERT capturar los matices del lenguaje humano de forma mucho más eficaz que los modelos anteriores, que normalmente procesaban el texto en una sola dirección. Es un tipo de Modelo de Lenguaje Grande (LLM) y se considera una tecnología fundamental para muchas aplicaciones modernas de PNL.

Cómo funciona BERT

La principal innovación de BERT reside en su enfoque de entrenamiento bidireccional, que se basa en la arquitectura Transformer. A diferencia de los modelos anteriores que leían el texto secuencialmente, el mecanismo de atención de BERT le permite considerar toda la oración a la vez. Para lograr esta comprensión bidireccional durante el preentrenamiento, BERT utiliza dos estrategias principales:

Modelo de Lenguaje Enmascarado (MLM): En esta tarea, algunas palabras de una frase se ocultan aleatoriamente, o se "enmascaran", y el trabajo del modelo es predecir las palabras enmascaradas originales basándose en las palabras no enmascaradas circundantes. Esto obliga al modelo a aprender relaciones contextuales profundas desde ambas direcciones.
Predicción de la Siguiente Frase (NSP): Se le dan al modelo dos frases y debe predecir si la segunda frase es la que sigue lógicamente a la primera en el texto original. Esto ayuda a BERT a comprender las relaciones entre frases, lo cual es crucial para tareas como la respuesta a preguntas y el análisis de párrafos.

Después de este extenso pre-entrenamiento en un corpus masivo de texto, BERT se puede adaptar para tareas específicas a través de un proceso llamado ajuste fino. Esto implica entrenar aún más el modelo en un conjunto de datos más pequeño y específico para la tarea, lo que lo convierte en una herramienta muy versátil para desarrolladores e investigadores. Muchos modelos BERT pre-entrenados son accesibles a través de plataformas como Hugging Face.

Aplicaciones en el mundo real

La capacidad de BERT para comprender los matices del lenguaje ha conducido a mejoras significativas en varias aplicaciones del mundo real de Inteligencia Artificial (IA):

Motores de Búsqueda: Google Search incorporó famosamente BERT para comprender mejor las consultas de los usuarios, especialmente las conversacionales o complejas, lo que condujo a resultados de búsqueda más relevantes. Por ejemplo, BERT ayuda a comprender la intención detrás de búsquedas como "¿puedes conseguir medicina para alguien farmacia?" al comprender la importancia de preposiciones como "para".
Chatbots y asistentes virtuales: BERT mejora la capacidad de los chatbots y asistentes virtuales para comprender las solicitudes de los usuarios con mayor precisión, mantener el contexto en las conversaciones y proporcionar respuestas más útiles en el servicio de atención al cliente, los sistemas de reservas y la recuperación de información.
Análisis de Sentimientos: Las empresas utilizan modelos basados en BERT para analizar las reseñas de los clientes, los comentarios en las redes sociales y las respuestas a encuestas para medir la opinión pública y la retroalimentación de los productos con mayor precisión.
Resumen de Texto y Respuesta a Preguntas: BERT puede ajustarse para crear sistemas que resuman automáticamente documentos largos o respondan preguntas basadas en un pasaje de texto dado. Esto se compara con conjuntos de datos como el Stanford Question Answering Dataset (SQuAD).

Bert vs. Otros Modelos

Es importante distinguir BERT de otros modelos de IA:

vs. GPT: Si bien ambos son LLMs basados en Transformer, BERT es un modelo de solo codificador diseñado para comprender el contexto desde ambas direcciones. Esto hace que sobresalga en tareas analíticas como el análisis de sentimientos, el Reconocimiento de Entidades Nombradas (NER) y la clasificación de texto. En contraste, los modelos GPT están enfocados en el decodificador y leen el texto en una dirección (de izquierda a derecha), lo que los optimiza para generar texto nuevo y coherente.
vs. Modelos de Visión Artificial: BERT procesa y comprende texto, lo cual es fundamentalmente diferente de los modelos de Visión Artificial (CV) como Ultralytics YOLO. Los modelos de visión como YOLO11 analizan los píxeles en imágenes y vídeos para realizar tareas como la detección de objetos o la segmentación de instancias. Mientras que BERT interpreta el lenguaje, la arquitectura Transformer que popularizó ha inspirado avances en CV, lo que ha llevado a modelos como el Vision Transformer (ViT) utilizado en modelos como RT-DETR.

Plataformas como Ultralytics HUB facilitan el entrenamiento y el despliegue de varios modelos de IA, incluidos los construidos sobre principios de Transformer. El desarrollo de BERT y modelos similares a menudo involucra marcos estándar de aprendizaje automático como PyTorch y TensorFlow.

BERT (Bidirectional Encoder Representations from Transformers)

Entrena modelos Ultralytics YOLO para optimizar los flujos de trabajo en todas las industrias

Solución de licencias empresariales flexible para impulsar su innovación

Entrena modelos de IA en segundos con Ultralytics YOLO

Cómo funciona BERT

Aplicaciones en el mundo real

Bert vs. Otros Modelos

Leer más en esta categoría

Lo más destacado de Ultralytics en la Conferencia PyTorch 2025

Aprendizaje autosupervisado para eliminar el ruido de las imágenes

Vision AI impulsa los sistemas de control de la atención del conductor

Únete a la comunidad de Ultralytics