Episodic Memory
Khám phá cách bộ nhớ tình huống (episodic memory) giúp các hệ thống AI ghi nhớ những trải nghiệm trong quá khứ. Tìm hiểu vai trò của nó trong học tăng cường (reinforcement learning) và theo dõi (tracking) với Ultralytics YOLO26.
Bộ nhớ tình tiết đại diện cho khả năng của một hệ thống trong việc lưu trữ, truy xuất và tận dụng các trải nghiệm hoặc sự kiện cụ thể trong quá khứ. Bắt nguồn từ tâm lý học nhận thức, nơi nó mô tả việc hồi tưởng lại các trải nghiệm cá nhân tại một thời điểm và địa điểm cụ thể, khái niệm này trong trí tuệ nhân tạo (AI) đề cập đến các kiến trúc cho phép các model ghi nhớ các trạng thái quá khứ riêng biệt thay vì chỉ các quy tắc tổng quát. Trong học máy (ML) hiện đại, việc triển khai loại bộ nhớ này giúp các tác nhân và model hồi tưởng lại các tương tác cụ thể trước đó, cải thiện hiệu suất trong các môi trường năng động và các tác vụ ra quyết định phức tạp.
Link to this sectionBộ nhớ tình tiết so với Bộ nhớ ngữ nghĩa#
Để nắm bắt đầy đủ các loại bộ nhớ được sử dụng trong AI, việc so sánh bộ nhớ tình tiết với bộ nhớ ngữ nghĩa là rất quan trọng. Trong khi một hệ thống tình tiết nắm bắt "cái gì, ở đâu và khi nào" của một trường hợp cụ thể—chẳng hạn như một tác nhân tự hành ghi nhớ một chướng ngại vật cụ thể mà nó đã va phải trong một mô phỏng gần đây—thì bộ nhớ ngữ nghĩa lại lưu trữ kiến thức chung, mang tính thực tế về thế giới, như các quy tắc vật lý điều khiển mô phỏng đó. Trong học sâu (DL), trọng số của một mạng thần kinh thường bao hàm kiến thức ngữ nghĩa, trong khi một bộ đệm bên ngoài hoặc ngân hàng bộ nhớ thường được sử dụng để lưu giữ các dấu vết tình tiết.
Link to this sectionCác ứng dụng trong thực tế#
Việc tích hợp các khả năng tình tiết cho phép các hệ thống AI đưa ra các quyết định có tính bối cảnh cao dựa trên các sự kiện lịch sử riêng biệt. Hai ứng dụng thực tế chính bao gồm:
- Học tăng cường: Các thuật toán thường sử dụng một kỹ thuật gọi là "phát lại trải nghiệm" (experience replay), nơi các tình tiết quá khứ cụ thể được lưu trữ và lấy mẫu lặp đi lặp lại trong quá trình huấn luyện. Cơ chế này ngăn chặn quên thảm họa và giúp tác nhân học hỏi từ các sự kiện quá khứ hiếm gặp nhưng có tính thông tin cao. Các phòng thí nghiệm nghiên cứu AI hàng đầu, chẳng hạn như Google DeepMind, sử dụng nhiều biện pháp kiểm soát tình tiết để tăng tốc độ học tập của tác nhân trong các môi trường phức tạp và năng động.
- Theo dõi đối tượng: Trong thị giác máy tính (CV), bộ nhớ tình tiết là yếu tố quan trọng để duy trì danh tính của các đối tượng qua các chuỗi video dài. Nếu một đối tượng tạm thời bị che khuất, các model như Ultralytics YOLO26 có thể dựa vào các đặc trưng tình tiết—lưu trữ các chữ ký hình ảnh riêng biệt từ các khung hình trước đó—để nhận dạng lại chính xác đối tượng khi nó xuất hiện trở lại. Điều này giúp tăng cường đáng kể các ứng dụng như quản lý giao thông thành phố thông minh.
Link to this sectionPhân biệt các khái niệm bộ nhớ liên quan#
Việc hiểu cách các kiến trúc tình tiết phù hợp với bối cảnh AI rộng lớn hơn đòi hỏi phải phân biệt chúng với các loại bộ nhớ hoạt động tương tự:
- Cửa sổ ngữ cảnh: Cửa sổ ngữ cảnh giới hạn lượng dữ liệu tuần tự tức thời mà một model Transformer xử lý cùng một lúc. Tuy nhiên, bộ nhớ tình tiết hoạt động như một kho lưu trữ bên ngoài có thể truy xuất các sự kiện quá khứ cụ thể vượt xa cửa sổ hoạt động hiện tại.
- Bộ nhớ đệm KV: Bộ nhớ đệm KV là một tối ưu hóa tính toán được sử dụng để tăng tốc độ tạo token bằng cách lưu trữ các trạng thái attention gần đây. Các hệ thống tình tiết có tính bền vững hơn, chọn lọc hồi tưởng lại các trường hợp dựa trên mức độ liên quan thay vì chỉ dựa trên sự gần gũi về mặt tuần tự tức thời.
- Retrieval-Augmented Generation (RAG): Trong khi RAG truy xuất các tài liệu ngữ nghĩa bên ngoài từ cơ sở dữ liệu, thì truy xuất tình tiết tập trung vào bên trong lịch sử hoạt động quá khứ của chính một tác nhân AI và các tương tác người dùng cụ thể.
Link to this sectionVí dụ mã nguồn: Mô phỏng truy xuất tình tiết#
Đoạn mã Python sau đây sử dụng PyTorch functional API để minh họa cách một tác nhân AI có thể truy vấn một ngân hàng bộ nhớ tình tiết. Bằng cách so sánh trạng thái hiện tại với các trải nghiệm quá khứ đã lưu trữ bằng cách sử dụng độ tương đồng cosine, tác nhân sẽ truy xuất tình tiết lịch sử phù hợp nhất để thông báo cho hành động tiếp theo của nó.
import torch
import torch.nn.functional as F
# Simulate stored episodic memory: 5 past events, each with a 128-dimensional embedding
episodic_memory = torch.randn(5, 128)
# Current state embedding (e.g., what an AI agent sees right now)
current_state = torch.randn(1, 128)
# Compute cosine similarity to find the most relevant past episode
similarities = F.cosine_similarity(current_state, episodic_memory)
best_match_idx = torch.argmax(similarities).item()
print(f"Most relevant past episode retrieved: Index {best_match_idx}")Link to this sectionCác phương pháp thực hành tốt nhất hiện nay và tương lai#
Các kiến trúc AI hiện đại đang ngày càng kết hợp quy trình làm việc của tác nhân (agentic workflows) với các model đa phương thức (multi-modal models) để cho phép các hệ thống dựa trên các hành động của chúng trong các bối cảnh lịch sử cụ thể. Các tác nhân hội thoại tiên tiến từ các tổ chức như OpenAI và Anthropic đã và đang sử dụng các biến thể của hồi tưởng tình tiết để duy trì ngữ cảnh người dùng dài hạn trong các phiên kéo dài.
Khi xây dựng các hệ thống phức tạp như vậy, việc quản lý một lượng lớn dữ liệu huấn luyện và các embedding bộ nhớ riêng biệt trở nên rất quan trọng. Ultralytics Platform cung cấp một môi trường trực quan, toàn diện cho các nhóm để tổ chức các tập dữ liệu tùy chỉnh, huấn luyện các model thị giác hiện đại và quản lý quy trình triển khai model, kết nối liền mạch khoảng cách giữa nghiên cứu tình tiết tiên tiến và ứng dụng thực tế mạnh mẽ.






