Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Khám phá các tính năng và ứng dụng của GPT-4o Mini. Mẫu mới nhất và tiết kiệm chi phí nhất của OpenAI cung cấp khả năng AI tiên tiến với giá rẻ hơn 60% so với GPT-3.5 Turbo.
Vào tháng 5 năm 2024, OpenAI đã phát hành GPT-4o và giờ đây, chỉ ba tháng sau, họ đã trở lại với một mô hình ấn tượng khác: GPT-4o Mini. Vào ngày 18 tháng 7 năm 2024, OpenAI đã giới thiệu GPT-4o Mini . Họ gọi đây là "mô hình tiết kiệm chi phí nhất" của họ! GPT-4o Mini là một mô hình nhỏ gọn được xây dựng dựa trên khả năng của các mô hình trước đó và hướng đến mục tiêu giúp AI tiên tiến dễ tiếp cận và giá cả phải chăng hơn.
GPT-4o Mini hiện hỗ trợ tương tác văn bản và thị giác , với các bản cập nhật trong tương lai dự kiến sẽ bổ sung khả năng xử lý hình ảnh, video và âm thanh. Trong bài viết này, chúng ta sẽ khám phá GPT-4o Mini là gì, các tính năng nổi bật của nó, cách sử dụng, sự khác biệt giữa GPT-4 và GPT-4o Mini, và cách sử dụng trong nhiều trường hợp sử dụng thị giác máy tính khác nhau. Hãy cùng tìm hiểu sâu hơn và xem GPT-4o Mini có gì!
GPT-4o Mini là gì?
GPT-4o Mini là sự bổ sung mới nhất vào dòng sản phẩm mô hình AI của OpenAI, được thiết kế để tiết kiệm chi phí và dễ tiếp cận hơn. Đây là mô hình ngôn ngữ lớn đa phương thức (LLM) , có nghĩa là nó có thể xử lý và tạo ra các loại dữ liệu khác nhau, chẳng hạn như văn bản, hình ảnh, video và âm thanh. Mô hình này dựa trên thế mạnh của các mô hình trước đó như GPT-4 và GPT-4o để cung cấp các khả năng mạnh mẽ trong một gói nhỏ gọn.
GPT-4o Mini rẻ hơn 60% so với GPT-3.5 Turbo, với chi phí là 15 xu cho một triệu token đầu vào (đơn vị văn bản hoặc dữ liệu mà mô hình xử lý) và 60 xu cho một triệu token đầu ra (đơn vị mà mô hình tạo ra để phản hồi). Để hiểu rõ hơn, một triệu token tương đương với việc xử lý 2.500 trang văn bản. Với cửa sổ ngữ cảnh là 128K token và khả năng xử lý tới 16K token đầu ra cho mỗi yêu cầu, GPT-4o Mini được thiết kế để vừa hiệu quả vừa phải chăng.
Hình 1. GPT-4o Mini rẻ hơn 60% so với GPT-3.5 Turbo.
Các tính năng chính của GPT-4o Mini
GPT-4o Mini hỗ trợ nhiều tác vụ khiến nó trở thành lựa chọn tuyệt vời cho nhiều ứng dụng khác nhau. Nó có thể được sử dụng khi chạy nhiều hoạt động cùng lúc, chẳng hạn như gọi nhiều API, xử lý lượng dữ liệu lớn như cơ sở mã đầy đủ hoặc lịch sử hội thoại và cung cấp phản hồi nhanh chóng, theo thời gian thực trong chatbot hỗ trợ khách hàng .
Sau đây là một số tính năng chính khác:
Cơ sở kiến thức được cập nhật: Mô hình chứa thông tin đến tháng 10 năm 2023.
Công cụ phân tích mã thông báo được cải tiến: GPT-4o Mini giúp xử lý văn bản không phải tiếng Anh tiết kiệm chi phí hơn.
Các biện pháp an toàn mạnh mẽ: Các biện pháp này bao gồm lọc nội dung có hại và bảo vệ chống lại các vấn đề bảo mật như tiêm mã độc nhanh chóng và thao túng hệ thống.
Bắt đầu với GPT-4o Mini
Bạn có thể thử sử dụng GPT-4o Mini thông qua giao diện ChatGPT. Người dùng Free, Plus và Team có thể truy cập, thay thế GPT-3.5 như hiển thị bên dưới. Người dùng doanh nghiệp cũng sẽ sớm có thể truy cập, phù hợp với mục tiêu của OpenAI là cung cấp lợi ích AI cho tất cả mọi người. GPT-4o Mini cũng khả dụng thông qua API dành cho các nhà phát triển muốn tích hợp các khả năng của nó vào ứng dụng của họ. Hiện tại, các khả năng về tầm nhìn chỉ có thể truy cập thông qua API.
GPT-4o Mini và GPT-4o đều có hiệu suất ấn tượng trên nhiều chuẩn mực khác nhau. Mặc dù GPT-4o thường vượt trội hơn GPT-4o Mini, GPT-4o Mini vẫn là giải pháp tiết kiệm chi phí cho các tác vụ hàng ngày. Các chuẩn mực bao gồm các tác vụ lý luận, khả năng toán học và lập trình, và lý luận đa phương thức. Như thể hiện trong hình ảnh bên dưới, GPT-4o Mini có điểm chuẩn khá cao khi so sánh với các mẫu máy phổ biến khác.
Hình 3. So sánh GPT-4o Mini với các mẫu phổ biến khác.
Thực hành với GPT-4o và GPT-4o Mini
Một lời nhắc thú vị đã được tranh luận trực tuyến liên quan đến các LLM phổ biến so sánh các số thập phân không chính xác. Khi chúng tôi đưa GPT-4o và GPT-4o Mini vào thử nghiệm, khả năng lý luận của chúng cho thấy sự khác biệt rõ ràng. Trong hình ảnh bên dưới, chúng tôi đã hỏi cả hai mô hình số nào lớn hơn: 9,11 hay 9,9, sau đó yêu cầu chúng giải thích lý luận của mình.
Hình 4. Kiểm tra GPT-4o và GPT-4o Mini.
Cả hai mô hình ban đầu đều trả lời sai và cho rằng 9,11 lớn hơn. Tuy nhiên, GPT-4o có thể lý giải theo cách của mình để đưa ra câu trả lời đúng và tuyên bố rằng 9,9 lớn hơn. Nó cung cấp lời giải thích chi tiết và so sánh các số thập phân một cách chính xác. Ngược lại, GPT-4o Mini vẫn ngoan cố duy trì câu trả lời sai ban đầu của mình mặc dù đã tìm ra lý do đằng sau việc 9,9 lớn hơn một cách chính xác.
Cả hai mô hình đều cho thấy khả năng suy luận mạnh mẽ. Khả năng tự sửa lỗi của GPT-4o khiến nó vượt trội và hữu ích cho các tác vụ phức tạp hơn. GPT-4o Mini, mặc dù ít thích ứng hơn, vẫn cung cấp khả năng suy luận rõ ràng và chính xác cho các tác vụ đơn giản hơn.
Sử dụng GPT-4o Mini cho nhiều trường hợp sử dụng tầm nhìn máy tính khác nhau
Nếu bạn muốn khám phá khả năng thị giác của GPT-4o Mini mà không cần đào sâu vào mã, bạn có thể dễ dàng kiểm tra API trên OpenAI Playground . Chúng tôi đã tự mình thử nghiệm để xem GPT-4o Mini có thể xử lý tốt như thế nào các trường hợp sử dụng liên quan đến thị giác máy tính.
Phân loại hình ảnh sử dụng GPT-4o Mini
Chúng tôi đã yêu cầu GPT-4o Mini phân loại hai hình ảnh : một hình ảnh về một con bướm và một hình ảnh về một bản đồ. Mô hình AI đã xác định thành công con bướm và bản đồ. Đây là một nhiệm vụ khá đơn giản vì các hình ảnh rất khác nhau.
Hình 5. Phân loại hình ảnh với sự trợ giúp của GPT-4o Mini.
Chúng tôi tiếp tục và chạy thêm hai hình ảnh nữa qua mô hình: một hình ảnh cho thấy một con bướm đang đậu trên cây và một hình ảnh khác cho thấy một con bướm đang đậu trên mặt đất. AI đã làm rất tốt một lần nữa, phát hiện chính xác con bướm trên cây và con bướm trên mặt đất. Vì vậy, chúng tôi lại tiến thêm một bước nữa.
Hình 6. Phân loại hình ảnh tương tự với sự trợ giúp của GPT-4o Mini.
Sau đó, chúng tôi yêu cầu GPT-4o Mini phân loại hai hình ảnh: một hình ảnh cho thấy một con bướm đang ăn hoa của cây Swamp Milkweed và hình ảnh còn lại cho thấy một con bướm đang ăn hoa Zinnia. Thật đáng kinh ngạc khi mô hình có thể phân loại một nhãn cụ thể như vậy mà không cần tinh chỉnh thêm. Những ví dụ nhanh này cho thấy GPT-4o Mini có thể được sử dụng cho các tác vụ phân loại hình ảnh mà không cần đào tạo tùy chỉnh.
Hình 7. Phân loại hình ảnh chi tiết với sự trợ giúp của GPT-4o Mini.
Hiểu các tư thế sử dụng GPT-4o Mini
Tính đến thời điểm hiện tại, các tác vụ thị giác máy tính như phát hiện đối tượng và phân đoạn trường hợp không thể được xử lý bằng GPT-4o Mini. GPT-4o gặp khó khăn về độ chính xác, nhưng có thể được sử dụng cho các tác vụ như vậy. Theo hướng này, liên quan đến việc hiểu các tư thế , chúng ta không thể phát hiện hoặc ước tính tư thế trong hình ảnh, nhưng chúng ta có thể phân loại và hiểu tư thế.
Hình 8. Sử dụng GPT-4o Mini để hiểu các tư thế trong hình ảnh.
Hình ảnh trên cho thấy cách GPT-4o Mini có thể phân loại và hiểu các tư thế, mặc dù không thể phát hiện hoặc ước tính tọa độ chính xác của tư thế. Điều này có thể hữu ích trong các ứng dụng khác nhau. Ví dụ, trong phân tích thể thao , nó có thể đánh giá rộng rãi các chuyển động của vận động viên và giúp ngăn ngừa chấn thương. Tương tự như vậy, trong vật lý trị liệu , nó có thể hỗ trợ theo dõi các bài tập để đảm bảo bệnh nhân thực hiện các chuyển động chính xác trong quá trình phục hồi chức năng. Ngoài ra, để giám sát , nó có thể giúp xác định các hoạt động đáng ngờ bằng cách phân tích ngôn ngữ cơ thể chung. Mặc dù GPT-4o Mini không thể phát hiện các điểm chính cụ thể, nhưng khả năng phân loại các tư thế chung của nó khiến nó hữu ích trong các lĩnh vực này và các lĩnh vực khác.
Ứng dụng GPT-4o Mini phù hợp cho
Chúng ta đã xem xét những gì GPT-4o Mini có thể làm. Bây giờ, hãy thảo luận về các ứng dụng mà GPT-4o Mini có thể sử dụng tối ưu nhất.
GPT-4o Mini rất phù hợp cho các ứng dụng đòi hỏi hiểu ngôn ngữ tự nhiên nâng cao và cần một dấu chân tính toán nhỏ. Nó giúp tích hợp AI vào các ứng dụng mà thông thường sẽ quá tốn kém. Trên thực tế, một phân tích chi tiết của Artificial Analysis cho thấy GPT-4o Mini cung cấp phản hồi chất lượng cao với tốc độ cực nhanh so với hầu hết các mô hình khác.
Hình 9. Chất lượng so với tốc độ đầu ra của GPT-4o Mini.
Sau đây là một số lĩnh vực chính mà công nghệ này có thể phát triển trong tương lai:
Trợ lý ảo và Chatbot: GPT-4o Mini có thể cung cấp phản hồi nhanh chóng và thông minh để cải thiện tương tác của người dùng.
Công cụ năng suất: Có thể cải thiện các tác vụ như tóm tắt tài liệu, soạn email và dịch ngôn ngữ để tăng hiệu quả.
Dịch ngôn ngữ: Phiên bản GPT mới nhất có thể được sử dụng để phát triển các trình biên dịch cung cấp bản dịch ngôn ngữ chính xác và thời gian thực để giao tiếp tốt hơn giữa các ngôn ngữ khác nhau.
GPT-4o Mini mở ra cánh cửa mới
GPT-4o Mini đang tạo ra những cơ hội mới cho tương lai của AI đa phương thức. Chi phí xử lý từng đoạn văn bản hoặc dữ liệu, được gọi là chi phí cho mỗi mã thông báo, đã giảm đáng kể - gần 99% - kể từ năm 2022, khi text-davinci-003, mô hình GPT-3, được phát hành. Việc giảm chi phí cho thấy xu hướng rõ ràng hướng tới việc làm cho AI tiên tiến trở nên hợp túi tiền hơn. Khi các mô hình AI tiếp tục được cải thiện, khả năng tích hợp AI vào mọi ứng dụng và trang web sẽ khả thi về mặt kinh tế ngày càng tăng!
Bạn muốn thực hành với AI? Truy cập kho lưu trữ GitHub của chúng tôi để xem những đổi mới của chúng tôi và trở thành một phần trong cộng đồng năng động của chúng tôi. Tìm hiểu thêm về các ứng dụng AI trong sản xuất và nông nghiệp trên các trang giải pháp của chúng tôi.