Mùa hè của Qwen: Qwen3-235B-A22B-Thinking-2507 mã nguồn mở mới vượt trội OpenAI, Gemini về khả năng suy luận trên các chuẩn đánh giá chính

Mùa hè của Qwen: Qwen3-235B-A22B-Thinking-2507 mã nguồn mở mới vượt trội OpenAI, Gemini về khả năng suy luận trên các chuẩn đánh giá chính

Trong thế giới AI đang không ngừng biến động, "bài hát của mùa hè" năm nay có lẽ thuộc về Alibaba và đội ngũ Qwen của họ. Liên tiếp những cột mốc mới được thiết lập, Qwen đang khẳng định vị thế dẫn đầu trong lĩnh vực mô hình AI tạo sinh mã nguồn mở.

Alibaba's Qwen Team vừa ra mắt bốn mô hình AI tạo sinh mã nguồn mở mới, đạt các chuẩn mực kỷ lục, vượt qua cả một số tùy chọn độc quyền hàng đầu. Tâm điểm chú ý là Qwen3-235B-A22B-Thinking-2507, mô hình ngôn ngữ lớn (LLM) được thiết kế đặc biệt để suy luận. Mô hình này sử dụng "chuỗi tư duy" và tự kiểm tra, hướng đến những phản hồi chính xác và toàn diện hơn cho các nhiệm vụ hóc búa.

Qwen3-Thinking-2507 hiện đang dẫn đầu hoặc bám sát các mô hình hàng đầu trên nhiều tiêu chuẩn chính. Đặc biệt, mô hình này đứng đầu trên AIME25, một chuẩn đánh giá khả năng giải quyết vấn đề trong toán học và logic, vượt qua cả OpenAI và Gemini. Qwen cũng cho thấy hiệu suất ấn tượng trên LiveCode, khẳng định năng lực vượt trội trong lĩnh vực lập trình.

Theo Andrew Curran, một chuyên gia trong lĩnh vực AI:

"Mô hình suy luận mạnh nhất của Qwen đã ra mắt, và nó đang ở đỉnh cao."

Việc Qwen3-Thinking-2507 dẫn đầu trên AIME25 với điểm số 92.3, vượt qua cả OpenAI o4-mini (92.7) và Gemini-2.5 Pro (88.0) là minh chứng rõ ràng cho khả năng suy luận vượt trội. Bên cạnh đó, hiệu suất 74.1 trên LiveCodeBench v6, bỏ xa các đối thủ như Google Gemini-2.5 Pro (72.5) và OpenAI o4-mini (71.8), cho thấy tiềm năng ứng dụng to lớn trong lĩnh vực phát triển phần mềm.

Sự ra đời của Qwen3-Thinking-2507 đánh dấu sự chuyển dịch chiến lược của đội ngũ Qwen, tập trung vào việc phát triển các mô hình chuyên biệt cho từng tác vụ cụ thể. Thay vì sử dụng các mô hình "lai" yêu cầu người dùng chuyển đổi giữa chế độ "tư duy" và "không tư duy", Qwen giờ đây tập trung vào việc huấn luyện các mô hình riêng biệt, tối ưu hóa cho từng mục đích sử dụng.

Cùng với Qwen3-Thinking-2507, Qwen còn giới thiệu Qwen3-Coder-480B-A35B-Instruct, một mô hình 480 tỷ tham số được xây dựng cho các quy trình làm việc phức tạp về mã hóa. Qwen3-MT, một mô hình dịch đa ngôn ngữ được huấn luyện trên hàng nghìn tỷ token trên 92+ ngôn ngữ, cũng được ra mắt. Tất cả các mô hình đều được cấp phép theo Apache 2.0 và có sẵn thông qua Hugging Face, ModelScope và Qwen API.

Việc cấp phép theo Apache 2.0 mang lại lợi thế lớn cho các doanh nghiệp. Giấy phép này cho phép các tổ chức tải xuống, sửa đổi, tự lưu trữ, tinh chỉnh và tích hợp mô hình vào các hệ thống độc quyền mà không bị hạn chế. Điều này tạo sự khác biệt so với các mô hình độc quyền hoặc các bản phát hành mở chỉ dành cho nghiên cứu, vốn thường yêu cầu quyền truy cập API, áp đặt giới hạn sử dụng hoặc cấm triển khai thương mại.

Với hiệu suất ấn tượng, khả năng xử lý ngữ cảnh dài và giấy phép cởi mở, Qwen3-Thinking-2507 hứa hẹn sẽ mở ra những cơ hội mới trong lĩnh vực AI, đặc biệt là trong các hệ thống đòi hỏi khả năng suy luận, lập kế hoạch và hỗ trợ ra quyết định. Hệ sinh thái Qwen3 rộng lớn, bao gồm các mô hình mã hóa, hướng dẫn và dịch thuật, càng làm tăng thêm sức hấp dẫn đối với các nhóm kỹ thuật và các đơn vị kinh doanh muốn tích hợp AI vào các lĩnh vực như kỹ thuật, bản địa hóa, hỗ trợ khách hàng và nghiên cứu.

Qwen đang dần khẳng định vị thế là một nền tảng mã nguồn mở vững chắc cho các hệ thống thông minh, mang lại cả khả năng kiểm soát và năng lực ở quy mô lớn. Sự trỗi dậy của Qwen hứa hẹn sẽ định hình lại cục diện thị trường AI, thúc đẩy sự đổi mới và mang lại lợi ích cho cộng đồng.

Mùa hè của Qwen: Qwen3-235B-A22B-Thinking-2507 mã nguồn mở mới vượt trội OpenAI, Gemini về khả năng suy luận trên các chuẩn đánh giá chính

Tin liên quan

Tin liên quan

Tin khác