OpenAI cập nhật Operator lên o3, tăng sức hấp dẫn cho gói ChatGPT Pro 200 đô la mỗi tháng

OpenAI cập nhật Operator lên o3, tăng sức hấp dẫn cho gói ChatGPT Pro 200 đô la mỗi tháng

OpenAI cập nhật Operator lên o3, tăng sức hấp dẫn cho gói ChatGPT Pro 200 đô la mỗi tháng

OpenAI vừa tung ra bản nâng cấp đáng chú ý cho Operator, tác nhân tự động duyệt web và điều khiển chuột trong ChatGPT. Bản cập nhật này, sử dụng mô hình ngôn ngữ lớn (LLM) o3 mạnh mẽ hơn thay thế cho GPT-4o trước đây, hứa hẹn mang đến trải nghiệm người dùng vượt trội. Động thái này được xem là nỗ lực của OpenAI nhằm củng cố vị thế cạnh tranh trong bối cảnh thị trường AI ngày càng sôi động.

Bản cập nhật Operator lên o3, ra mắt ngày 23/5/2025, hiện đang được cung cấp dưới dạng "xem trước nghiên cứu" cho người dùng đăng ký gói ChatGPT Pro với mức phí 200 đô la mỗi tháng. OpenAI khẳng định đây chưa phải là sản phẩm hoàn thiện, nhưng những cải tiến mà o3 mang lại là rất đáng mong đợi.

Operator, ra mắt lần đầu vào tháng 1/2025, là bước đi tiên phong của OpenAI trong lĩnh vực tác nhân bán tự động, cụ thể là Tác nhân Sử dụng Máy tính (CUAs). Về cơ bản, Operator có khả năng tự động "chỉ, nhấp, cuộn và gõ" để hoàn thành các tác vụ dựa trên web, như đặt chỗ ăn tối, tổng hợp danh sách mua sắm hoặc đặt vé sự kiện. Điều này cho phép nó thực hiện các yêu cầu của người dùng trực tiếp thông qua giao diện trình duyệt.

Vậy Operator hoạt động như thế nào? Thay vì sử dụng trình duyệt web hiện có trên máy tính của người dùng, Operator chạy trong một trình duyệt ảo được lưu trữ trên đám mây, có thể truy cập thông qua trang web riêng: operator.chatgpt.com. Người dùng có thể nhập yêu cầu và theo dõi tác nhân thực hiện tác vụ trong thời gian thực.

Theo OpenAI, việc chuyển đổi sang mô hình o3 mang lại nhiều cải tiến đáng kể. "Mô hình mới dựa trên o3 thể hiện sự cải thiện về độ chính xác, cấu trúc và tỷ lệ thành công trong quá trình tương tác với trình duyệt", đại diện OpenAI cho biết. Điều này đồng nghĩa với việc Operator sẽ hoàn thành các tác vụ của người dùng thành công hơn, giảm thiểu nhu cầu chỉnh sửa hoặc lặp lại.

Kết quả thử nghiệm cho thấy o3 vượt trội so với phiên bản trước. Trên bộ tiêu chuẩn OSWorld, đo lường khả năng hoàn thành các tác vụ dựa trên trình duyệt, o3 đạt số điểm 42.9 so với 38.1 của phiên bản cũ. Trên WebArena, điểm số của o3 là 62.9, tăng từ 48.1. Đặc biệt, trên bộ tiêu chuẩn GAIA, o3 đạt điểm số ấn tượng 62.2, vượt xa con số 12.3 của phiên bản trước.

"Những cải tiến này không chỉ dừng lại ở các con số. Trong thực tế, o3 mang đến trải nghiệm người dùng mượt mà và hiệu quả hơn", một người dùng ChatGPT Pro đã chia sẻ sau khi trải nghiệm phiên bản Operator mới. Ví dụ, khi yêu cầu đặt chỗ ăn tối, o3 cung cấp danh sách các nhà hàng chi tiết hơn, bao gồm địa điểm, đánh giá Michelin và ghi chú về chỗ ngồi, được trình bày dưới dạng bảng rõ ràng.

OpenAI cũng nhấn mạnh rằng các biện pháp bảo mật vẫn được duy trì và tăng cường. "Chúng tôi đã tích hợp quá trình đào tạo nâng cao để chống lại việc thực hiện các tác vụ có hại, các lỗ hổng tấn công prompt injection và các sai sót liên quan đến ý định của người dùng", OpenAI cho biết. Đánh giá cho thấy mô hình hiện xác nhận 94% các hành động nhạy cảm trước khi thực hiện, với tỷ lệ xác nhận 100% trong các giao dịch tài chính.

Việc nâng cấp Operator lên o3 có ý nghĩa gì đối với các nhà quản lý kỹ thuật? Theo các chuyên gia, nó có thể "cải thiện đáng kể quy trình làm việc của các chuyên gia trong lĩnh vực kỹ thuật AI, điều phối, quản lý dữ liệu và bảo mật CNTT". Khả năng tự động hóa các tương tác web thủ công giúp các kỹ sư dữ liệu tiết kiệm thời gian và tập trung vào các công việc tối ưu hóa cấp cao hơn. Các chuyên gia bảo mật cũng có thể sử dụng Operator để mô phỏng hành vi của người dùng trong các cuộc kiểm toán và ứng phó sự cố một cách an toàn hơn.

Với những cải tiến đáng kể về hiệu suất và bảo mật, bản cập nhật Operator lên o3 hứa hẹn mang đến một trải nghiệm AI mạnh mẽ và an toàn hơn cho người dùng ChatGPT Pro. Đây cũng là một bước tiến quan trọng của OpenAI trong việc hiện thực hóa tầm nhìn về các tác nhân AI thông minh, có khả năng thực hiện các tác vụ phức tạp thay mặt cho con người.