Thị giác AI

OpenAI o1: Một chuỗi model OpenAI mới cho suy luận AI

Tìm hiểu về các model OpenAI o1 mới ra mắt và điều gì làm cho chúng trở nên đặc biệt. Chúng tôi cũng sẽ xem xét cách chúng hoạt động và tác động của chúng đối với tương lai của AI.

ABAbirami Vina

5 min readSeptember 13, 2024

OpenAI o1, một chuỗi model OpenAI mới cho suy luận AI

Cộng đồng AI đang xôn xao với những suy đoán về bước tiếp theo của các model GPT của OpenAI, với nhiều người gọi đó là “Project Strawberry.” Lý do đằng sau việc này là nếu bạn nhắc GPT-4o bằng câu hỏi có bao nhiêu chữ R trong từ "strawberry," nó sẽ trả lời bạn rằng có hai chữ R trong từ "strawberry." Điều này có vẻ kỳ lạ, xét đến sức mạnh của GPT-4o. Tuy nhiên, model được xây dựng để xử lý ý nghĩa tiềm ẩn, không phải từ ngữ chính xác. Có tin đồn rằng model tiếp theo sẽ nhắm đến việc giải quyết vấn đề này. Sam Altman đã tiếp thêm dầu vào lửa cho những tin đồn này bằng cách đăng ảnh những quả dâu tây lên tài khoản X (trước đây gọi là Twitter) của mình.

Với thông báo mới nhất của OpenAI vào thứ Năm, ngày 12 tháng 9, chúng ta cuối cùng đã có câu trả lời cho những suy đoán! OpenAI o1, một loạt các model AI mới được thiết kế để chậm lại và suy nghĩ trước khi phản hồi, đã được phát hành. Thú vị là, OpenAI o1 có khả năng suy luận tốt hơn và trả lời đúng câu hỏi về quả dâu tây! Trong bài viết này, chúng ta sẽ thảo luận về OpenAI o1 là gì, cách nó hoạt động, nơi có thể sử dụng nó và ý nghĩa của nó đối với tương lai của AI. Hãy bắt đầu thôi!

Ví dụ về việc nhắc OpenAI o1 về dâu tây

Hình 1. Một ví dụ về việc nhắc OpenAI o1 về quả dâu tây.

Link to this sectionNhững tiến bộ mới trong AI của OpenAI#

Vào tháng 7 năm 2024, các giám đốc điều hành của OpenAI chia sẻ rằng nghiên cứu của OpenAI đang tiến gần đến mức độ giải quyết vấn đề của con người, được gọi là cấp độ 2 của AI. Rõ ràng là cấp độ này tập trung vào suy luận, khi OpenAI giới thiệu dòng model mới của mình, OpenAI o1, với khả năng suy nghĩ trước khi trả lời. OpenAI o1 là một LLM (mô hình ngôn ngữ lớn) mới, một model AI hiểu và tạo ra văn bản giống con người bằng cách học các mẫu từ lượng dữ liệu ngôn ngữ khổng lồ. Nó được thiết kế để xử lý các vấn đề phức tạp đòi hỏi suy luận chuyên sâu.

Quan điểm của OpenAI về các giai đoạn phát triển của AI

Hình 2. Quan điểm của OpenAI về các giai đoạn của AI.

Model này đã được huấn luyện bằng cách sử dụng học tăng cường, một kỹ thuật trong đó model học cách đưa ra các quyết định tốt hơn thông qua thử và sai bằng cách nhận phần thưởng hoặc hình phạt cho các hành động của mình. Thuật toán học tăng cường giúp model suy nghĩ hiệu quả hơn bằng cách tuân theo chuỗi suy nghĩ. OpenAI cũng chia sẻ rằng hiệu suất của o1 không ngừng cải thiện với nhiều lần học tăng cường hơn trong quá trình huấn luyện và với nhiều thời gian "suy nghĩ" hơn trong khi giải quyết vấn đề, cho thấy cả việc mở rộng huấn luyện và xử lý tư duy đều giúp nâng cao khả năng của model.

Mặc dù OpenAI o1 là một bước tiến đáng kể cho suy luận phức tạp, nó vẫn là một model sơ khai và thiếu một số tính năng làm cho ChatGPT trở nên hữu ích, chẳng hạn như duyệt web hoặc tải lên tệp và hình ảnh. Đối với nhiều tác vụ phổ biến, GPT-4o hiện tại vẫn có thể mạnh hơn. Tuy nhiên, OpenAI o1 đánh dấu một bước tiến lớn trong khả năng của AI trong việc xử lý suy luận phức tạp, đó là lý do tại sao OpenAI đang bắt đầu một dòng mới và gọi nó là OpenAI o1.

Link to this sectionCác model mới của OpenAI nâng cao khả năng suy luận AI như thế nào#

OpenAI o1 có thể được sử dụng cho các tác vụ như giải mã mật mã, giải các thử thách lập trình, trả lời các bài toán, giải ô chữ và thậm chí xử lý các chủ đề phức tạp trong khoa học, an toàn và chăm sóc sức khỏe. Trong một cái gật đầu hài hước với tên mã của dự án, OpenAI đã thể hiện kỹ năng suy luận của model bằng cách bẻ khóa một loại mật mã tiết lộ thông báo "THERE ARE THREE R’S IN STRAWBERRY."

Ngoài việc giải mã, OpenAI o1 cũng có kỹ năng viết code. Nó thực hiện tốt trong các thử thách lập trình cạnh tranh như trên Codeforces, một nền tảng nơi các lập trình viên giải quyết các vấn đề lập trình phức tạp dưới áp lực thời gian. Trong những thử thách này, model đạt được xếp hạng Elo cao (một hệ thống tính điểm đo lường trình độ kỹ năng dựa trên hiệu suất so với các đối thủ cạnh tranh khác) và vượt trội hơn các model trước đó. Nó cũng xuất sắc trong toán học và thực hiện tốt trong các kỳ thi như American Invitational Mathematics Examination (AIME).

Đánh giá khả năng lập trình của o1

Hình 3. Đánh giá khả năng viết code của o1.

Những tiến bộ này định vị OpenAI o1 như một bản nâng cấp đáng kể so với các model trước đó như GPT-4o. Nó mở ra những khả năng mới cho AI trong các lĩnh vực như kinh doanh, phát triển, nghiên cứu và chăm sóc sức khỏe. Ví dụ, trong nghiên cứu di truyền, OpenAI o1 có thể nhanh chóng xem qua một số lượng lớn các bài báo nghiên cứu, chọn ra những phát hiện quan trọng và các kết nối giữa các dấu hiệu di truyền và bệnh tật. Nó hiểu ngôn ngữ khoa học phức tạp và có thể tóm tắt các điểm quan trọng, giúp các nhà nghiên cứu tập trung vào những thông tin phù hợp nhất.

Link to this sectionTìm hiểu kỹ hơn về chuỗi suy nghĩ#

Chúng ta đã thấy trước đó rằng OpenAI o1 giới thiệu quy trình suy luận "Chuỗi suy nghĩ". Nó cho phép model giải quyết các vấn đề phức tạp theo cách tương tự như các chiến lược nhận thức của con người. Model có thể chia nhỏ các thử thách thành các bước nhỏ hơn, dễ quản lý hơn và lặp đi lặp lại việc tinh chỉnh phương pháp tiếp cận của mình. Không giống như các model trước đó dựa vào nhận dạng mẫu ngay lập tức, o1 tối ưu hóa việc ra quyết định của mình bằng cách khám phá nhiều con đường suy luận, học hỏi từ cả thành công và thất bại thông qua học tăng cường.

OpenAI đã quyết định giữ những chuỗi suy nghĩ thô này ẩn khỏi người dùng, thay vào đó cung cấp các bản tóm tắt mang lại cái nhìn sâu sắc về suy luận của model mà không tiết lộ từng bước. Quyết định này giúp ngăn chặn việc lạm dụng quy trình tư duy của model trong khi vẫn cho phép các nhà phát triển theo dõi và tinh chỉnh sự an toàn và căn chỉnh của AI. Bằng cách quan sát các chuỗi ẩn bên trong, các nhà phát triển có thể đảm bảo rằng o1 tuân thủ các nguyên tắc đạo đức và tránh các hành vi có hại.

Link to this sectionĐánh giá OpenAI o1#

OpenAI o1 cho thấy những cải tiến lớn so với GPT-4o trong một số điểm chuẩn kiểm tra khả năng suy luận và giải quyết vấn đề. Trong kỳ thi American Invitational Mathematics Examination (AIME) 2024, một kỳ thi toán học đầy thử thách dành cho học sinh trung học hàng đầu, o1 đạt tỷ lệ chính xác 74% chỉ với một mẫu cho mỗi vấn đề, so với 12% của GPT-4o. Với sự đồng thuận trên 64 mẫu, độ chính xác của nó tăng lên 83% và bằng cách sử dụng phương pháp xếp hạng lại tinh chỉnh với 1.000 mẫu, nó đạt 93%, đưa nó vào top 500 học sinh trên toàn quốc.

Ngoài toán học, o1 cũng thực hiện đặc biệt tốt trong các điểm chuẩn kiểm tra kiến thức khoa học, như GPQA Diamond, bao gồm các câu hỏi cấp độ Tiến sĩ về hóa học, vật lý và sinh học. Đáng chú ý, o1 đã vượt qua các chuyên gia con người có bằng Tiến sĩ trong bài kiểm tra này, khiến nó trở thành model AI đầu tiên làm được điều đó. Nó cũng vượt qua GPT-4o trên 54 trong số 57 danh mục trong điểm chuẩn MMLU, kiểm tra sự hiểu biết trên nhiều chủ đề đa dạng, bao gồm lịch sử, pháp luật và khoa học.

Đánh giá OpenAI o1

Hình 4. Đánh giá OpenAI o1.

Link to this sectionTrải nghiệm thực tế với OpenAI o1#

OpenAI đã giới thiệu hai model AI mới trong dòng o1: o1-preview và o1-mini. Model o1-preview được thiết kế để suy nghĩ sâu hơn trước khi phản hồi, vượt trội trong các tác vụ suy luận phức tạp về khoa học, lập trình và toán học. Nó cung cấp các khả năng giải quyết vấn đề nâng cao cho người dùng thực hiện các dự án đầy thử thách. Ngược lại, o1-mini là một model nhỏ hơn, nhanh hơn và tiết kiệm chi phí hơn được tối ưu hóa đặc biệt cho suy luận STEM, đặc biệt là toán học và lập trình. Mặc dù nó có thể có kiến thức thế giới ít rộng hơn, o1-mini gần như đạt hiệu suất của o1-preview trên các đánh giá chính như cuộc thi toán AIME và các thử thách lập trình Codeforces, tất cả với chi phí thấp hơn 80%.

So sánh các model OpenAI

Hình 5. So sánh các model OpenAI.

Bạn có thể thử nghiệm các model này thông qua nhiều nền tảng của OpenAI. Người dùng ChatGPT Plus và Team có thể truy cập cả o1-preview và o1-mini thông qua bộ chọn model, trải nghiệm các khả năng suy luận nâng cao trực tiếp trong ChatGPT. Các nhà phát triển có quyền truy cập API cấp 5 có thể bắt đầu tạo mẫu với các model này, mặc dù một số tính năng nâng cao vẫn đang được phát triển. OpenAI cũng có kế hoạch sớm cung cấp o1-mini cho tất cả người dùng ChatGPT Free. Bằng cách khám phá các model này, bạn có thể trực tiếp trải nghiệm những tiến bộ trong suy luận AI và chọn model phù hợp nhất với nhu cầu của mình.

Link to this sectionCác cân nhắc về AI đạo đức của OpenAI#

OpenAI đã tập trung vào đạo đức và an toàn trong khi phát triển dòng model o1. Trước khi phát hành các model o1-preview và o1-mini, họ đã thực hiện các đánh giá kỹ lưỡng, bao gồm các bài kiểm tra bên ngoài và kiểm tra nội bộ về các rủi ro như nội dung không được phép, ảo giác và thiên kiến. Các model được thiết kế với khả năng suy luận nâng cao để hiểu và tuân thủ các quy tắc an toàn tốt hơn.

OpenAI cũng đã triển khai các biện pháp bảo vệ như danh sách chặn và bộ phân loại an toàn để quản lý rủi ro. Model o1 có xếp hạng rủi ro tổng thể trung bình. Nó có rủi ro thấp trong các lĩnh vực như an ninh mạng và quyền tự chủ của model và rủi ro trung bình trong các lĩnh vực như nội dung CBRN (Hóa học, Sinh học, Phóng xạ và Hạt nhân) và thuyết phục. Nhóm Cố vấn An toàn và Ban giám đốc của OpenAI đã xem xét các biện pháp an toàn này để đảm bảo model an toàn và có đạo đức khi sử dụng.

Bảng điểm OpenAI o1

Hình 6. Thẻ điểm OpenAI o1.

Link to this sectionTừ tin đồn đến hiện thực: OpenAI o1 xuất hiện#

OpenAI o1 là một bước tiến lớn trong suy luận AI, biến một số tin đồn ban đầu thành hiện thực. Không giống như GPT-4o, dòng o1 suy nghĩ sâu hơn bằng cách sử dụng phương pháp "Chuỗi suy nghĩ", chia nhỏ các vấn đề phức tạp thành các bước nhỏ hơn để có phản hồi tốt hơn. Hiện có sẵn dưới dạng xem trước sớm trong ChatGPT và API, OpenAI có kế hoạch thêm các tính năng như duyệt web và tải lên tệp và hình ảnh. OpenAI cũng chia sẻ rằng họ có kế hoạch tiếp tục phát triển và phát hành các model trong dòng GPT, cùng với dòng OpenAI o1 mới. Khi AI tiếp tục phát triển, những tiến bộ như thế này đang mở đường cho các hệ thống AI mạnh mẽ, trực quan và linh hoạt hơn, có thể hỗ trợ và hiểu nhu cầu con người tốt hơn.

Luôn cập nhật những tin tức mới nhất về AI bằng cách tham gia cộng đồng của chúng tôi! Hãy truy cập kho lưu trữ GitHub của chúng tôi để xem cách chúng tôi tiên phong các giải pháp AI trong các lĩnh vực như sản xuất và chăm sóc sức khỏe. 🚀

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

OpenAI o1: Một chuỗi model OpenAI mới cho suy luận AI

Link to this sectionNhững tiến bộ mới trong AI của OpenAI#

Link to this sectionCác model mới của OpenAI nâng cao khả năng suy luận AI như thế nào#

Link to this sectionTìm hiểu kỹ hơn về chuỗi suy nghĩ#

Link to this sectionĐánh giá OpenAI o1#

Link to this sectionTrải nghiệm thực tế với OpenAI o1#

Link to this sectionCác cân nhắc về AI đạo đức của OpenAI#

Link to this sectionTừ tin đồn đến hiện thực: OpenAI o1 xuất hiện#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!