Khám phá cách LoRA tinh chỉnh các mô hình AI lớn như YOLO một cách hiệu quả, giúp giảm chi phí và cho phép triển khai ở biên với nguồn lực tối thiểu.
LoRA, hay Low-Rank Adaptation (Thích ứng bậc thấp), là một kỹ thuật hiệu quả cao được sử dụng để điều chỉnh các mô hình học máy (ML) lớn đã được đào tạo trước cho các tác vụ cụ thể mà không cần phải đào tạo lại toàn bộ mô hình. Được mô tả chi tiết trong một bài báo của các nhà nghiên cứu Microsoft , LoRA đã trở thành nền tảng của Parameter-Efficient Fine-Tuning (PEFT) . Nó giảm đáng kể chi phí tính toán và yêu cầu lưu trữ liên quan đến việc tùy chỉnh các mô hình lớn, chẳng hạn như Mô hình Ngôn ngữ Lớn (LLM) và các mô hình nền tảng khác.
Thay vì cập nhật hàng tỷ trọng số mô hình trong một mô hình được đào tạo trước, LoRA đóng băng tất cả chúng. Sau đó, nó đưa một cặp ma trận nhỏ, có thể đào tạo được - được gọi là bộ điều hợp hạng thấp - vào các lớp cụ thể của mô hình, thường nằm trong cơ chế chú ý của kiến trúc Transformer . Trong quá trình đào tạo , chỉ các tham số của các ma trận mới, nhỏ hơn nhiều này được cập nhật. Ý tưởng cốt lõi là những thay đổi cần thiết để điều chỉnh mô hình cho một tác vụ mới có thể được biểu diễn bằng ít tham số hơn nhiều so với mô hình ban đầu chứa. Điều này tận dụng các nguyên tắc tương tự như giảm chiều để nắm bắt thông tin cần thiết cho việc điều chỉnh ở dạng nhỏ gọn. Sau khi đào tạo hoàn tất, bộ điều hợp nhỏ có thể được hợp nhất với các trọng số ban đầu hoặc được giữ riêng để chuyển đổi tác vụ theo mô-đun.
Hiệu quả của LoRA khiến nó trở nên lý tưởng cho nhiều ứng dụng khác nhau, đặc biệt là khi cần nhiều mô hình tùy chỉnh.
Sẽ rất hữu ích khi phân biệt LoRA với các kỹ thuật điều chỉnh mô hình khác:
Tóm lại, LoRA cung cấp một phương pháp mạnh mẽ và tiết kiệm tài nguyên để tùy chỉnh các mô hình nền tảng lớn được đào tạo sẵn cho nhiều tác vụ cụ thể trong cả Xử lý Ngôn ngữ Tự nhiên (NLP) và thị giác máy tính , giúp AI tiên tiến trở nên thiết thực và dễ tiếp cận hơn. Phương pháp này cho phép quản lý và triển khai dễ dàng nhiều mô hình chuyên biệt, một quy trình được các nền tảng như Ultralytics HUB đơn giản hóa để quản lý vòng đời mô hình.