Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

BERT (Bidirectional Encoder Representations from Transformers)

Khám phá BERT, mô hình transformer hai chiều mang tính đột phá cho NLP. Tìm hiểu cách nó hiểu ngữ cảnh, các ứng dụng thực tế và tích hợp với YOLO26.

BERT (Bidirectional Encoder Representations from Transformers) là một kiến trúc deep learning mang tính đột phá được các nhà nghiên cứu tại Google thiết kế nhằm giúp máy tính hiểu rõ hơn các sắc thái của ngôn ngữ con người. Được giới thiệu vào năm 2018, BERT đã tạo nên cuộc cách mạng trong lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP) bằng cách giới thiệu phương pháp huấn luyện hai chiều. Không giống như các model trước đây đọc văn bản tuần tự từ trái sang phải hoặc từ phải sang trái, BERT phân tích ngữ cảnh của một từ bằng cách xem xét cả những từ xuất hiện trước và sau nó cùng một lúc. Cách tiếp cận này cho phép model nắm bắt các ý nghĩa tinh tế, thành ngữ và từ đồng âm (từ có nhiều nghĩa) hiệu quả hơn nhiều so với các phiên bản tiền nhiệm.

Link to this sectionCách BERT hoạt động#

Về cốt lõi, BERT dựa trên kiến trúc Transformer, cụ thể là cơ chế encoder. Bản chất "hai chiều" đạt được thông qua một kỹ thuật huấn luyện gọi là Masked Language Modeling (MLM). Trong quá trình tiền huấn luyện, khoảng 15% số từ trong một câu được chọn ngẫu nhiên để che đi (ẩn), và model sẽ cố gắng dự đoán các từ bị thiếu dựa trên ngữ cảnh xung quanh. Điều này buộc model phải học các biểu diễn hai chiều sâu sắc.

Ngoài ra, BERT sử dụng Next Sentence Prediction (NSP) để hiểu mối quan hệ giữa các câu. Trong tác vụ này, model được cung cấp các cặp câu và phải xác định liệu câu thứ hai có logic khi nối tiếp câu đầu tiên hay không. Khả năng này rất quan trọng đối với các tác vụ yêu cầu hiểu về diễn ngôn, chẳng hạn như trả lời câu hỏi và tóm tắt văn bản.

Link to this sectionCác ứng dụng trong thực tế#

Tính linh hoạt của BERT đã biến nó trở thành một thành phần tiêu chuẩn trong nhiều hệ thống AI hiện đại. Dưới đây là hai ví dụ cụ thể về ứng dụng của nó:

  1. Tối ưu hóa công cụ tìm kiếm (SEO): Google đã tích hợp BERT vào các thuật toán tìm kiếm của mình để diễn giải tốt hơn các truy vấn phức tạp. Ví dụ, trong truy vấn "2019 brazil traveler to usa need a visa", từ "to" là rất quan trọng. Các model truyền thống thường coi "to" là một stop word (các từ phổ biến được lọc bỏ), dẫn đến bỏ lỡ mối quan hệ định hướng. BERT hiểu rằng người dùng là người Brazil đang đi du lịch đến Mỹ, chứ không phải ngược lại, từ đó cung cấp các kết quả tìm kiếm vô cùng phù hợp.

  2. Phân tích cảm xúc trong phản hồi của khách hàng: Các công ty sử dụng BERT để phân tích hàng nghìn đánh giá của khách hàng hoặc phiếu hỗ trợ một cách tự động. Vì BERT hiểu được ngữ cảnh, nó có thể phân biệt giữa "This vacuum sucks" (cảm xúc tiêu cực) và "This vacuum sucks up all the dirt" (cảm xúc tích cực). Phân tích cảm xúc chính xác này giúp doanh nghiệp phân loại các vấn đề hỗ trợ và theo dõi sức khỏe thương hiệu một cách chính xác.

Link to this sectionSo sánh với các khái niệm liên quan#

Việc phân biệt BERT với các kiến trúc nổi bật khác sẽ rất hữu ích để hiểu rõ vị trí cụ thể của nó.

  • BERT so với GPT (Generative Pre-trained Transformer): Mặc dù cả hai đều sử dụng kiến trúc Transformer, mục tiêu của chúng lại khác nhau. BERT sử dụng ngăn xếp Encoder và được tối ưu hóa cho các tác vụ hiểu và phân biệt (ví dụ: phân loại, trích xuất thực thể). Ngược lại, GPT sử dụng ngăn xếp Decoder và được thiết kế cho việc tạo văn bản, dự đoán từ tiếp theo trong một chuỗi để viết bài luận hoặc code.
  • BERT so với YOLO26: Các model này hoạt động trong các lĩnh vực khác nhau. BERT xử lý dữ liệu văn bản tuần tự cho các tác vụ ngôn ngữ. YOLO26 là một vision model hiện đại xử lý lưới pixel cho phát hiện đối tượng theo thời gian thực. Tuy nhiên, các hệ thống đa phương thức hiện đại thường kết hợp chúng; ví dụ, một model YOLO có thể phát hiện các đối tượng trong ảnh, sau đó một model dựa trên BERT có thể trả lời các câu hỏi về mối quan hệ giữa chúng.

Link to this sectionVí dụ về triển khai: Tokenization#

Để sử dụng BERT, văn bản thô phải được chuyển đổi thành các token số. Model sử dụng một từ vựng cụ thể (như WordPiece) để phân tách các từ. Mặc dù BERT là một model văn bản, các khái niệm tiền xử lý tương tự cũng áp dụng trong thị giác máy tính nơi hình ảnh được chia thành các patch.

Đoạn code Python sau đây minh họa cách sử dụng thư viện transformers để tokenize một câu cho quá trình xử lý của BERT. Lưu ý rằng trong khi Ultralytics tập trung vào thị giác, việc hiểu về tokenization là chìa khóa cho các quy trình làm việc AI đa phương thức.

from transformers import BertTokenizer

# Initialize the tokenizer with the pre-trained 'bert-base-uncased' vocabulary
tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")

# Tokenize a sample sentence relevant to AI
text = "Ultralytics simplifies computer vision."

# Convert text to input IDs (numerical representations)
encoded_input = tokenizer(text, return_tensors="pt")

# Display the resulting token IDs
print(f"Token IDs: {encoded_input['input_ids']}")

Link to this sectionÝ nghĩa trong bối cảnh AI#

Sự ra đời của BERT đánh dấu "khoảnh khắc ImageNet" cho NLP, chứng minh rằng học chuyển đổi (transfer learning)—tiền huấn luyện một model trên tập dữ liệu khổng lồ rồi tinh chỉnh cho một tác vụ cụ thể—là cực kỳ hiệu quả đối với văn bản. Điều này làm giảm nhu cầu về các kiến trúc chuyên biệt cho từng tác vụ và các tập dữ liệu lớn được gắn nhãn cho mỗi vấn đề mới.

Ngày nay, các biến thể của BERT, như RoBERTa và DistilBERT, tiếp tục thúc đẩy hiệu suất trong các ứng dụng AI biên (edge AI). Các lập trình viên muốn xây dựng các giải pháp AI toàn diện thường tích hợp các model ngôn ngữ này cùng với các công cụ thị giác có sẵn trên Ultralytics Platform để tạo ra các hệ thống có khả năng vừa nhìn vừa hiểu thế giới.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning