Mistral AI ra mắt Devstral, mô hình SWE nguồn mở mạnh mẽ mới chạy trên laptop
Paris hoa lệ vừa chứng kiến một bước tiến đột phá trong lĩnh vực trí tuệ nhân tạo (AI) dành cho phát triển phần mềm (SWE). Mistral AI, công ty công nghệ Pháp đang nổi lên như một thế lực mới, vừa trình làng Devstral, một mô hình ngôn ngữ mã nguồn mở với sức mạnh đáng kinh ngạc, có thể chạy mượt mà ngay trên máy tính xách tay của bạn.
Đây là kết quả hợp tác giữa Mistral AI và startup All Hands AI, đánh dấu một bước đi táo bạo nhằm dân chủ hóa AI, trao quyền cho các nhà phát triển và tổ chức trên toàn thế giới. Devstral được kỳ vọng sẽ thay đổi cách chúng ta xây dựng phần mềm, từ việc sửa lỗi đơn giản đến việc điều hướng các dự án phức tạp.
Với 24 tỷ tham số, Devstral nhỏ gọn hơn nhiều so với các đối thủ cạnh tranh, nhưng sức mạnh của nó lại không hề kém cạnh. Mô hình này được thiết kế đặc biệt để hỗ trợ các tác vụ phát triển AI, "có khả năng hiểu ngữ cảnh trong các tệp, điều hướng cơ sở mã lớn và giải quyết các vấn đề thực tế," theo tuyên bố từ Mistral AI.
Một điểm đặc biệt quan trọng là Devstral được cung cấp hoàn toàn miễn phí dưới giấy phép Apache 2.0. Điều này đồng nghĩa với việc các nhà phát triển và tổ chức có thể tự do "triển khai, sửa đổi và thương mại hóa nó mà không bị hạn chế," mở ra một kỷ nguyên mới của sự hợp tác và đổi mới trong lĩnh vực phát triển phần mềm.
Devstral được xây dựng dựa trên nền tảng thành công của dòng sản phẩm Codestral trước đó của Mistral. Codestral, ra mắt vào tháng 5/2024, đã nhanh chóng được công nhận là một mô hình mạnh mẽ cho việc tạo và hoàn thiện mã. Sự thành công này đã thúc đẩy Mistral phát triển Devstral, "mở rộng từ việc hoàn thành mã nhanh chóng đến thực hiện tác vụ toàn diện," theo đại diện công ty.
Kết quả thử nghiệm trên SWE-Bench Verified, một bộ dữ liệu gồm 500 vấn đề thực tế trên GitHub, cho thấy Devstral đạt điểm số 46.8%, vượt trội so với tất cả các mô hình nguồn mở đã được phát hành trước đó. Thậm chí, nó còn vượt qua một số mô hình độc quyền lớn, bao gồm cả GPT-4.1-mini, với "mức chênh lệch hơn 20 điểm phần trăm," theo Mistral AI.
"Hiện tại, nó là mô hình mở tốt nhất cho SWE-bench verified và cho các tác nhân mã,"
Baptiste Rozière, nhà khoa học nghiên cứu tại Mistral AI, cho biết.
"So sánh Devstral với các mô hình đóng và mở được đánh giá theo bất kỳ giàn giáo nào, chúng tôi thấy rằng Devstral đạt được hiệu suất tốt hơn đáng kể so với một số giải pháp thay thế nguồn đóng,"
Sophia Yang, Tiến sĩ, Trưởng bộ phận Quan hệ nhà phát triển tại Mistral AI, chia sẻ trên mạng xã hội X.
Devstral không chỉ là một công cụ tạo mã, mà còn được tối ưu hóa để tích hợp vào các khung tác nhân như OpenHands, SWE-Agent và OpenDevin. Những khung này cho phép Devstral "tương tác với các trường hợp thử nghiệm, điều hướng các tệp nguồn và thực hiện các tác vụ đa bước trên các dự án," giúp tự động hóa các quy trình phát triển phần mềm.
Với kiến trúc nhỏ gọn 24B, Devstral có thể chạy cục bộ trên một GPU RTX 4090 hoặc một máy Mac với 32GB RAM. Điều này mang lại lợi ích lớn về quyền riêng tư và khả năng triển khai trên các thiết bị biên. Hơn nữa, giấy phép Apache 2.0 của nó tạo ra "một đề xuất hấp dẫn cho các ứng dụng thương mại," cho phép sử dụng, điều chỉnh và phân phối không hạn chế, ngay cả đối với các sản phẩm độc quyền.
"Mô hình này nhắm đến những người đam mê và những người quan tâm đến việc chạy một thứ gì đó cục bộ và riêng tư — một thứ gì đó họ có thể sử dụng ngay cả trên máy bay mà không cần internet,"
Rozière nói.
Devstral có thể truy cập thông qua API Le Platforme của Mistral, với mức giá 0.10 đô la cho một triệu token đầu vào và 0.30 đô la cho một triệu token đầu ra. Nó cũng hỗ trợ triển khai cục bộ thông qua các nền tảng như Hugging Face, Ollama, Kaggle, LM Studio và Unsloth.
Sự ra đời của Devstral đánh dấu một bước tiến quan trọng trong việc tạo ra các hệ thống kỹ thuật phần mềm tự động. Với hiệu suất vượt trội, giấy phép mở và thiết kế tập trung vào tác nhân, Devstral không chỉ là một công cụ tạo mã, mà còn là một mô hình nền tảng cho tương lai của ngành công nghiệp phần mềm. Giờ đây, các nhà phát triển trên toàn thế giới có thể khai thác sức mạnh của AI ngay trên chiếc laptop của mình, mở ra một kỷ nguyên mới của sự sáng tạo và đổi mới.