Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Rotary Position Embedding (RoPE)

Khám phá cách Rotary Position Embedding (RoPE) nâng cao các transformer bằng cách mã hóa các vị trí tương đối. Tìm hiểu vai trò của nó trong các LLM và các tác vụ thị giác Ultralytics YOLO26.

Rotary Position Embedding (RoPE) là một kỹ thuật hiệu quả cao được sử dụng trong các kiến trúc mạng thần kinh hiện đại để nhúng thông tin vị trí vào các token embedding. Trong các mô hình deep learning như transformers, các token đầu vào được xử lý đồng thời thay vì tuần tự. Vì các mô hình này thiếu cảm nhận tự nhiên về thứ tự, chúng cần các cơ chế bên ngoài để hiểu trình tự của dữ liệu. RoPE giải quyết vấn đề này bằng cách mã hóa vị trí tuyệt đối của một token sử dụng ma trận xoay và tích hợp liền mạch các phụ thuộc vị trí tương đối vào attention mechanism, cho phép các mô hình hiểu rõ hơn mối quan hệ giữa các token dựa trên khoảng cách của chúng với nhau.

Link to this sectionCơ chế hoạt động của Rotary Position Embedding#

Khác với các phương pháp truyền thống thêm một vector vị trí cố định vào biểu diễn token, RoPE áp dụng phép xoay hình học lên các đặc trưng của token trong không gian đa chiều. Góc xoay này tỷ lệ thuận trực tiếp với vị trí của token trong trình tự. Khi mô hình tính toán điểm attention giữa hai token, các tính chất toán học của các phép xoay này đảm bảo rằng điểm số kết quả phụ thuộc tự nhiên vào khoảng cách tương đối giữa chúng. Cách tiếp cận này cho phép các advanced AI systems duy trì nhận thức cấu trúc mạnh mẽ trên các context windows lớn hơn nhiều mà không cần tốn quá nhiều bộ nhớ.

Để hiểu cách thức hoạt động trong thực tế, các nhà phát triển thường triển khai RoPE bằng cách sử dụng thao tác tensor trong các frameworks like PyTorch. Dưới đây là đoạn mã ví dụ đơn giản, có thể chạy được, minh họa cách áp dụng logic xoay cốt lõi vào các đặc trưng đầu vào trong quá trình huấn luyện hoặc suy luận mô hình:

import torch


def apply_rotary_emb(x, cos, sin):
    # A simplified PyTorch demonstration of applying rotary embeddings
    # Splits the feature dimension and rotates the halves
    half_dim = x.shape[-1] // 2
    x1, x2 = x[..., :half_dim], x[..., half_dim:]

    # Rotate the components to encode relative positional information
    rotated_x = torch.cat((-x2, x1), dim=-1)

    # Combine original features with cosine and sine transformations
    return (x * cos) + (rotated_x * sin)


# Example usage with dummy token features and sinusoidal matrices
dummy_features = torch.randn(2, 10, 64)  # (batch_size, sequence_length, features)
cos, sin = torch.randn(2, 10, 64), torch.randn(2, 10, 64)
embedded_features = apply_rotary_emb(dummy_features, cos, sin)

Link to this sectionCác ứng dụng thực tế của RoPE#

Rotary embedding đã trở thành tiêu chuẩn công nghiệp cho mô hình hóa trình tự, đặc biệt là trong các tác vụ natural language processing (NLP) nâng cao và các hệ thống thị giác máy tính hiện đại.

  1. Large Language Models (LLMs): RoPE là cơ chế mã hóa vị trí nền tảng đằng sau một số hệ thống tạo văn bản mạnh mẽ nhất thế giới, bao gồm Meta's LLaMA architecture. Bằng cách tận dụng RoPE, các Large Language Models (LLMs) này có thể xử lý toàn bộ sách hoặc cơ sở mã trong một prompt duy nhất, mang lại khả năng sequence extrapolation capabilities vượt trội, khái quát hóa tốt hơn nhiều so với độ dài đã thấy trong quá trình huấn luyện.

  2. Vision Transformers và Object Detection: Trong lĩnh vực computer vision, các token thị giác trích xuất từ các bản vá ảnh (image patches) đòi hỏi cấu trúc không gian chính xác. Mặc dù các mô hình tích chập như Ultralytics YOLO26 nắm bắt được hệ thống phân cấp không gian một cách tự nhiên thông qua các trường tiếp nhận cục bộ (local receptive fields), các kiến trúc self-attention như Vision Transformers thường tích hợp các mở rộng 2D giống như RoPE. Điều này giúp các pipeline object detectioninstance segmentation dựa trên transformer hiểu rõ hơn vị trí tương đối của các thành phần thị giác, cải thiện độ chính xác trong các khung cảnh phức tạp.

Link to this sectionPhân biệt RoPE với Absolute Position Embeddings#

Việc phân biệt RoPE với các absolute position embeddings tiêu chuẩn là rất quan trọng. Absolute embedding gán một vector cố định, độc lập cho từng vị trí trong trình tự, nghĩa là mô hình phải tự học cách vị trí 5 liên quan đến vị trí 10. Ngược lại, RoPE đưa khái niệm khoảng cách trực tiếp vào các biến đổi token. Sự khác biệt cơ bản này làm cho RoPE vượt trội hơn hẳn trong việc hiểu tài liệu dài và các quy trình làm việc generative AI nơi trình tự có độ dài thay đổi đáng kể.

Khi phát triển và mở rộng các kiến trúc khổng lồ này, việc quản lý dữ liệu và cơ sở hạ tầng một cách hiệu quả là yếu tố then chốt. Để tối ưu hóa quá trình chú thích tập dữ liệu, huấn luyện trên đám mây và triển khai trên tất cả các môi trường biên, các nhà phát triển thường dựa vào các công cụ toàn diện được cung cấp bởi Ultralytics Platform, nơi xử lý các công việc nặng nhọc để đưa nghiên cứu thị giác máy tính tiên tiến vào sản xuất. Việc sử dụng RoPE kết hợp với các thực tiễn tốt nhất về fine-tuning đảm bảo các pipeline AI hiện đại vẫn đạt độ chính xác cao và bền vững về mặt tính toán.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning