Thuật ngữ

Trợ lý ảo

Khám phá cách Trợ lý ảo hỗ trợ AI sử dụng NLP, ML và TTS để tự động hóa các tác vụ, nâng cao năng suất và chuyển đổi các ngành.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trợ lý ảo (VA) là một tác nhân phần mềm được hỗ trợ bởi Trí tuệ nhân tạo (AI) được thiết kế để hiểu các lệnh ngôn ngữ tự nhiên (giọng nói hoặc văn bản) và thực hiện các tác vụ cho người dùng. Các tác vụ này có thể bao gồm từ các hành động đơn giản như đặt lời nhắc hoặc phát nhạc đến các hoạt động phức tạp hơn như quản lý lịch trình, điều khiển các thiết bị nhà thông minh hoặc cung cấp thông tin được lấy từ nhiều nguồn khác nhau. VA phụ thuộc rất nhiều vào các công nghệ như Xử lý ngôn ngữ tự nhiên (NLP) , Nhận dạng giọng nóiHọc máy (ML) để diễn giải các yêu cầu của người dùng, tìm hiểu sở thích và cải thiện phản hồi của họ theo thời gian. Các ví dụ phổ biến bao gồm Amazon Alexa , Siri của AppleTrợ lý Google .

Công nghệ cốt lõi

Trợ lý ảo tích hợp một số công nghệ AI quan trọng để hoạt động:

  • Xử lý ngôn ngữ tự nhiên (NLP): Cho phép VA hiểu ý nghĩa đằng sau văn bản hoặc lời nói của người dùng, bao gồm ý định và thực thể. Điều này liên quan đến các kỹ thuật từ mã hóa cơ bản đến mô hình ngôn ngữ phức tạp.
  • Nhận dạng giọng nói: Chuyển đổi ngôn ngữ nói thành văn bản có thể đọc được bằng máy, tạo thành đầu vào cho các thành phần NLP. Những tiến bộ trong Học sâu (DL) đã cải thiện đáng kể độ chính xác của các hệ thống này.
  • Quản lý đối thoại: Quản lý luồng hội thoại, duy trì ngữ cảnh qua các lượt, đặt câu hỏi làm rõ và xác định hành động hoặc phản hồi phù hợp. Các hệ thống hiện đại thường tận dụng các mô hình trình tự-trình tự phức tạp.
  • Học máy (ML): Được sử dụng cho nhiều khía cạnh, bao gồm cải thiện độ chính xác của NLP, cá nhân hóa trải nghiệm người dùng dựa trên các tương tác trước đây ( Hệ thống đề xuất ) và học các kỹ năng mới hoặc chiến lược thực hiện nhiệm vụ.

Sự liên quan trong AI và ML

Trợ lý ảo là một lĩnh vực ứng dụng chính thúc đẩy nghiên cứu và phát triển trong AI đàm thoại, Mô hình ngôn ngữ lớn (LLM)tương tác giữa người và máy tính (HCI) . Chúng đòi hỏi sự tích hợp tinh vi của nhiều khả năng AI và lượng lớn Dữ liệu đào tạo để hoạt động hiệu quả. Sự thúc đẩy đối với các trợ lý tự nhiên hơn, nhận thức được ngữ cảnh và chủ động hơn thúc đẩy sự đổi mới trong các lĩnh vực như cá nhân hóa và hiểu ý định của người dùng với Độ chính xác cao hơn. Mặc dù chủ yếu dựa trên ngôn ngữ, các VA trong tương lai có thể tích hợp Thị giác máy tính (CV) , có khả năng sử dụng các mô hình như Ultralytics YOLO cho các tác vụ như Phát hiện đối tượng để hiểu ngữ cảnh trực quan, thu hẹp hơn nữa khoảng cách giữa trợ lý kỹ thuật số và thế giới vật lý, có thể hỗ trợ AI trong các thiết lập chăm sóc sức khỏe hoặc ứng dụng ô tô . Các nền tảng như Ultralytics HUB tạo điều kiện thuận lợi cho việc đào tạotriển khai các mô hình AI, bao gồm các tùy chọn đào tạo đám mây , có thể trở thành thành phần của các hệ thống tiên tiến như vậy. Việc giải quyết các mối quan tâm về Đạo đức AI , chẳng hạn như Quyền riêng tư dữ liệuĐịnh kiến thuật toán , cũng rất quan trọng trong quá trình phát triển của chúng, đòi hỏi nhiều Minh bạch hơn trong AI .

Ứng dụng trong thế giới thực

Trợ lý ảo được nhúng vào nhiều thiết bị và nền tảng:

  • Điện thoại thông minh và loa thông minh: Cung cấp khả năng điều khiển rảnh tay, trả lời câu hỏi, phát phương tiện (ví dụ: Siri trên iPhone, Alexa trên thiết bị Echo).
  • Tự động hóa dịch vụ khách hàng: Xử lý các yêu cầu ban đầu của khách hàng, chuyển cuộc gọi, cung cấp hỗ trợ qua trang web hoặc ứng dụng, đôi khi sử dụng các hệ thống tiên tiến như Google Duplex cho các nhiệm vụ như đặt lịch hẹn.
  • Nâng cao năng suất: Quản lý lịch, thiết lập lời nhắc, gửi email hoặc tin nhắn và tích hợp với phần mềm nơi làm việc. Các công cụ như Microsoft Copilot nhằm mục đích hỗ trợ nhiều tác vụ công việc khác nhau.
  • Khả năng tiếp cận: Hỗ trợ người dùng khuyết tật bằng cách cung cấp tương tác bằng giọng nói với công nghệ và thông tin.

Trợ lý ảo so với Chatbot

Mặc dù cả Trợ lý ảo và Chatbot đều tham gia vào cuộc trò chuyện, nhưng phạm vi và khả năng của chúng khác nhau:

  • Phạm vi: VA thường có phạm vi chức năng rộng hơn, thường được tích hợp vào hệ điều hành ( iOS , Android ) hoặc hệ sinh thái phần cứng, cho phép chúng thực hiện các hành động trên nhiều ứng dụng khác nhau và kiểm soát cài đặt thiết bị. Chatbot thường chuyên biệt hơn, được thiết kế cho các tác vụ đàm thoại cụ thể trong một bối cảnh cụ thể, như trang web hỗ trợ khách hàng hoặc ứng dụng nhắn tin.
  • Thực hiện tác vụ: VA thường được thiết kế để thực hiện các tác vụ ngoài cuộc trò chuyện, chẳng hạn như điều khiển thiết bị nhà thông minh, quản lý thông tin cá nhân hoặc tương tác với phần mềm khác. Chatbot chủ yếu tập trung vào các tương tác trò chuyện, cung cấp thông tin hoặc hướng dẫn người dùng thực hiện các quy trình công việc cụ thể (ví dụ: trả lời Câu hỏi thường gặp, khắc phục sự cố đơn giản).
  • Tích hợp: VA thường hoạt động như trung tâm tương tác với nhiều dịch vụ và thiết bị khác nhau, trong khi chatbot thường được nhúng trong một ứng dụng hoặc trang web duy nhất.

Các ranh giới có thể mờ đi, đặc biệt là khi chatbot trở nên tinh vi hơn khi sử dụng các công nghệ như LLM , nhưng sự khác biệt cốt lõi nằm ở phạm vi nhiệm vụ và khả năng tích hợp thường liên quan đến VA. Sự phát triển của cả hai đều dựa trên những tiến bộ được thảo luận trong hướng dẫn toàn diện Ultralytics .

Đọc tất cả