OpenAI vừa công bố mô hình mới với tên gọi là OpenAI o1 - biệt danh Strawberry - có thể giải quyết các vấn đề mà các mô hình AI hiện có đang gặp khó khăn. Thay vì đưa ra câu trả lời trong từng bước một, OpenAI o1 có thể giải quyết vấn đề với lối "suy nghĩ thấu đáo" trước khi đưa ra kết quả cuối cùng. Đây cũng là điểm đột phá của o1.
Trên thực tế, giờ đây công nghệ này có thể đánh bại các chuyên gia tiến sĩ trong việc giải quyết các vấn đề đa bước, bao gồm toán học và lập trình phức tạp.
OpenAI cho biết mô hình o1 vượt qua 83% bài thi tuyển chọn cho Olympic Toán quốc tế, đứng trong 500 thí sinh giỏi nhất. Con số này cao hơn nhiều so với mức 13% của GPT-4o. Mô hình AI mới cũng xếp hạng đạt 89% với các câu hỏi lập trình cạnh tranh (Codeforces), cũng như vượt qua độ chính xác ở cấp độ tiến sĩ về điểm chuẩn của các bài vật lý, sinh học, hóa học (GPQA).
"Tôi rất vui mừng chia sẻ với mọi người thành quả của đội ngũ đã làm thời gian qua trong việc tạo ra mô hình AI có khả năng lập luận thực sự. o1 là mô hình ngôn ngữ lớn được đào tạo bằng phương pháp học tăng cường để thực hiện các suy luận phức tạp. OpenAI o1 suy nghĩ trước khi trả lời, đồng thời có thể tạo ra một chuỗi suy nghĩ nội bộ dài trước khi phản hồi tới người dùng". Chia sẻ được đăng trên blog của OpenAI.
Các chuyên gia đánh giá đã thử nghiệm Strawberry phát hiện ra rằng, phiên bản này có thể lên kế hoạch lừa dối con người bằng cách khiến hành động có vẻ vô hại. Nhưng sự thật là không phải vậy!
AI đôi khi "giả vờ tuân thủ một cách có chủ đích" - có nghĩa là giả vờ tuân thủ các giá trị và ưu tiên mà con người quan tâm - và chiến lược thao túng dữ liệu "để làm cho hành động không tuân thủ trông có vẻ như tuân thủ hơn," Theo chia sẻ của một chuyên gia.
Các chuyên gia đã thấy và ghi lại hơn 60 ví dụ về các hệ thống AI đạt được mục tiêu của mình nhưng không theo cách mà nhà thiết kế muốn. Ví dụ, đạt điểm cao trong trò chơi điện tử, không phải bằng cách chơi công bằng hoặc học các kỹ năng trong trò chơi mà bằng cách hack hệ thống tính điểm.
OpenAI cũng thẳng thắn thừa nhận những hạn chế ban đầu của o1: "Là một mô hình ban đầu, chưa có nhiều tính năng làm cho ChatGPT hữu ích, như duyệt web để tìm thông tin và tải lên tệp và hình ảnh. Đôi khi, nó sẽ cân nhắc nhiều nguồn tham khảo và có thể mất quá nhiều thời gian để phản hồi những điều đơn giản ". Dù vậy đối với các nhiệm vụ suy luận phức tạp, đây vẫn là một bước tiến đáng kể và thể hiện một cấp độ mới về khả năng AI.
Sự ra đời của Strawberry đánh dấu một bước ngoặt quan trọng trong cuộc đua công nghệ đang ngày càng trở nên gay cấn. Không chỉ có OpenAI, các đối thủ cạnh tranh như Google và Anthropic cũng đang tích cực phát triển các mô hình AI với khả năng "lập luận" tương tự.
Theo dõi VR360 để cập nhật những tin tức công nghệ mới nhất mỗi ngày. Cảm ơn bạn đã quan tâm đến bài viết này!