Bảng chú giải thuật ngữ

LoRA (Điều chỉnh Hạng thấp)

Khám phá cách LoRA tinh chỉnh hiệu quả các mô hình AI lớn như YOLO, giảm chi phí và cho phép triển khai biên với nguồn lực tối thiểu.

LoRA, hay còn gọi là Low-Rank Adaptation (Thích ứng hạng thấp), là một kỹ thuật hiệu quả cao được sử dụng để điều chỉnh các mô hình học máy (ML) lớn, được huấn luyện trước cho các tác vụ cụ thể mà không cần phải huấn luyện lại toàn bộ mô hình. Được trình bày chi tiết trong một bài báo của các nhà nghiên cứu Microsoft, LoRA đã trở thành nền tảng của Tinh chỉnh hiệu quả tham số (PEFT). Nó làm giảm đáng kể chi phí tính toán và yêu cầu lưu trữ liên quan đến việc tùy chỉnh các mô hình lớn, chẳng hạn như Mô hình ngôn ngữ lớn (LLM) và các mô hình nền tảng khác.

Cách LoRA Hoạt động

Thay vì cập nhật hàng tỷ trọng số mô hình trong một mô hình đã được huấn luyện trước, LoRA đóng băng tất cả chúng. Sau đó, nó chèn một cặp ma trận nhỏ, có thể huấn luyện được—gọi là bộ điều hợp hạng thấp (low-rank adapters)—vào các lớp cụ thể của mô hình, thường là trong cơ chế attention (cơ chế chú ý) của kiến trúc Transformer. Trong quá trình huấn luyện, chỉ các tham số của các ma trận mới, nhỏ hơn nhiều này mới được cập nhật. Ý tưởng cốt lõi là những thay đổi cần thiết để điều chỉnh mô hình cho một nhiệm vụ mới có thể được biểu diễn bằng ít tham số hơn nhiều so với mô hình ban đầu. Điều này tận dụng các nguyên tắc tương tự như giảm chiều dữ liệu (dimensionality reduction) để nắm bắt thông tin cần thiết cho việc điều chỉnh ở dạng nhỏ gọn. Sau khi quá trình huấn luyện hoàn tất, bộ điều hợp nhỏ có thể được hợp nhất với trọng số ban đầu hoặc được giữ riêng để chuyển đổi nhiệm vụ theo mô-đun.

Các Ứng dụng Thực tế

Hiệu quả của LoRA làm cho nó trở nên lý tưởng cho một loạt các ứng dụng, đặc biệt là nơi cần nhiều mô hình tùy chỉnh.

Tùy chỉnh Chatbot: Một doanh nghiệp có thể lấy một LLM mục đích chung mạnh mẽ và sử dụng LoRA để huấn luyện nó trên cơ sở kiến thức nội bộ của mình. Điều này tạo ra một chatbot dịch vụ khách hàng chuyên biệt, hiểu các thuật ngữ dành riêng cho công ty mà không tốn chi phí lớn cho việc tinh chỉnh đầy đủ.
AI Art và Chuyển đổi phong cách (Style Transfer): Các nghệ sĩ và nhà thiết kế sử dụng LoRA để điều chỉnh các mô hình AI tạo sinh như Stable Diffusion theo một phong cách nghệ thuật cụ thể. Bằng cách huấn luyện một bộ điều hợp (adapter) trên một tập hợp nhỏ các hình ảnh của riêng họ, họ có thể tạo ra các tác phẩm nghệ thuật mới mô phỏng tính thẩm mỹ độc đáo của họ, một phương pháp phổ biến trên các nền tảng như Hugging Face.

LoRA so với các khái niệm liên quan

Sẽ rất hữu ích khi phân biệt LoRA với các kỹ thuật điều chỉnh mô hình khác:

Tinh chỉnh toàn bộ: Phương pháp này cập nhật tất cả các trọng số của một mô hình được huấn luyện trước trên một bộ dữ liệu mới. Mặc dù thường hiệu quả, nhưng nó đòi hỏi tài nguyên tính toán đáng kể (GPU) và dung lượng lưu trữ cho mỗi mô hình được điều chỉnh. Ngược lại, LoRA đóng băng các trọng số ban đầu và chỉ huấn luyện các ma trận bộ điều hợp nhỏ được chèn vào. Tìm thêm chi tiết trong mục từ vựng tinh chỉnh của chúng tôi và tổng quan về tinh chỉnh của NVIDIA.
Điều chỉnh Prompt: Kỹ thuật này giữ cho trọng số mô hình hoàn toàn đóng băng và thay vào đó tìm hiểu "prompt mềm" liên tục (các vectơ được thêm vào các embedding đầu vào) để điều khiển hành vi của mô hình cho các tác vụ cụ thể. Không giống như LoRA, nó không sửa đổi bất kỳ trọng số mô hình nào mà chỉ tập trung vào việc điều chỉnh biểu diễn đầu vào. Đọc thêm về điều chỉnh prompt và kỹ thuật prompt.
Các phương pháp PEFT khác: LoRA chỉ là một kỹ thuật trong lĩnh vực rộng lớn hơn về Tinh chỉnh hiệu quả tham số (Parameter-Efficient Fine-Tuning - PEFT). Các phương pháp khác bao gồm Adapter Tuning (tương tự nhưng với các cấu trúc adapter hơi khác nhau), Prefix Tuning và IA³, mỗi phương pháp cung cấp các sự đánh đổi khác nhau về hiệu quả tham số và hiệu suất. Các phương pháp này thường có sẵn trong các framework như thư viện Hugging Face PEFT.

Tóm lại, LoRA cung cấp một cách mạnh mẽ và hiệu quả về mặt tài nguyên để tùy chỉnh các mô hình nền tảng được huấn luyện trước quy mô lớn cho một loạt các tác vụ cụ thể trong cả Xử lý ngôn ngữ tự nhiên (NLP) và thị giác máy tính, giúp AI tiên tiến trở nên thiết thực và dễ tiếp cận hơn. Cách tiếp cận này cho phép quản lý và triển khai dễ dàng nhiều mô hình chuyên dụng, một quy trình được hợp lý hóa bởi các nền tảng như Ultralytics HUB để quản lý vòng đời mô hình.

LoRA (Điều chỉnh Hạng thấp)

Huấn luyện các mô hình Ultralytics YOLO để hợp lý hóa quy trình làm việc trong các ngành công nghiệp

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Huấn luyện các mô hình AI trong vài giây với Ultralytics YOLO

Cách LoRA Hoạt động

Các Ứng dụng Thực tế

LoRA so với các khái niệm liên quan

Đọc thêm trong danh mục này

Triển khai các mô hình YOLO của Ultralytics bằng cách sử dụng tích hợp ExecuTorch

Những điểm nổi bật chính từ Ultralytics tại Hội nghị PyTorch 2025

Sử dụng học tập tự giám sát để khử nhiễu hình ảnh

Tham gia cộng đồng Ultralytics