Khám phá cách mạng Bộ nhớ dài hạn ngắn hạn (LSTM) xử lý dữ liệu tuần tự, khắc phục hạn chế của RNN và hỗ trợ các tác vụ AI như NLP và dự báo.
Bộ nhớ dài hạn ngắn hạn (LSTM) là một loại kiến trúc Mạng nơ-ron hồi quy (RNN) chuyên biệt được thiết kế để học và ghi nhớ các mẫu trên các chuỗi dữ liệu dài. Không giống như RNN tiêu chuẩn, vốn gặp khó khăn với các phụ thuộc dài hạn do vấn đề gradient biến mất , LSTM sử dụng một cơ chế cổng độc đáo để điều chỉnh luồng thông tin. Điều này cho phép mạng lưu giữ thông tin quan trọng một cách có chọn lọc trong thời gian dài đồng thời loại bỏ dữ liệu không liên quan, biến nó thành nền tảng của học sâu hiện đại, đặc biệt là trong Xử lý ngôn ngữ tự nhiên (NLP) . Bài báo LSTM nền tảng của Hochreiter và Schmidhuber đã đặt nền móng cho công nghệ mạnh mẽ này.
Chìa khóa cho khả năng của LSTM nằm ở cấu trúc bên trong, bao gồm một "trạng thái tế bào" và một số "cổng". Trạng thái tế bào hoạt động như một băng chuyền, mang thông tin liên quan qua chuỗi. Các cổng - đầu vào, quên và đầu ra - là các mạng nơ-ron điều khiển thông tin nào được thêm vào, loại bỏ hoặc đọc từ trạng thái tế bào.
Cấu trúc cổng này cho phép LSTM duy trì ngữ cảnh qua nhiều bước thời gian, một tính năng quan trọng để hiểu dữ liệu tuần tự như văn bản hoặc chuỗi thời gian . Bạn có thể tìm thấy hình ảnh minh họa chi tiết trong bài đăng trên blog Understanding LSTMs phổ biến này.
LSTM đã được áp dụng thành công trên nhiều lĩnh vực liên quan đến dữ liệu tuần tự.
LSTM là một phần của họ mô hình rộng hơn dành cho dữ liệu tuần tự.
LSTM có thể được triển khai dễ dàng bằng các khuôn khổ học sâu phổ biến như PyTorch (xem tài liệu về PyTorch LSTM ) và TensorFlow (xem tài liệu về TensorFlow LSTM ). Trong khi Ultralytics chủ yếu tập trung vào các mô hình Thị giác máy tính (CV) như Ultralytics YOLO cho các tác vụ như phát hiện đối tượng và phân đoạn thể hiện , thì việc hiểu các mô hình trình tự rất có giá trị, đặc biệt là khi nghiên cứu khám phá việc kết nối NLP và CV cho các tác vụ như hiểu video hoặc chú thích hình ảnh. Bạn có thể tìm hiểu thêm về các mô hình và khái niệm ML khác nhau trong tài liệu của Ultralytics . Việc quản lý đào tạo và triển khai các mô hình khác nhau có thể được hợp lý hóa bằng các nền tảng như Ultralytics HUB . Các nguồn như DeepLearning.AI cung cấp các khóa học về các mô hình trình tự, bao gồm LSTM.