Một kỹ thuật mới mang tên TurboDiffusion vừa được công bố, hứa hẹn sẽ thay đổi hoàn toàn cục diện ngành đồ họa máy tính khi có thể tăng tốc độ tạo video bằng trí tuệ nhân tạo lên tới 200 lần so với các phương pháp hiện hành mà không gây ảnh hưởng đến chất lượng hình ảnh.
TurboDiffusion là thành quả nghiên cứu chung giữa nhóm chuyên gia từ Đại học Thanh Hoa (Trung Quốc), Đại học California tại Berkeley (Mỹ) và công ty AI Shengshu Technology. Trong các thử nghiệm thực tế trên hệ thống sử dụng GPU GeForce RTX 5090 (dòng card đồ họa cao cấp dành cho người dùng cá nhân của Nvidia), kỹ thuật này đã rút ngắn thời gian tạo một video 5 giây ở độ phân giải tiêu chuẩn từ hơn 3 phút xuống chỉ còn 1,9 giây, đạt mức tăng tốc gần 100 lần.
Đặc biệt, khi vận hành trên các hệ thống GPU chuyên dụng, TurboDiffusion có khả năng xuất video độ phân giải HD (1.280 x 720 pixel) dài 5 giây chỉ trong vòng 24 giây. Trước đây, quy trình này thường tiêu tốn tới 80 phút, đồng nghĩa với việc tốc độ đã được cải thiện vượt bậc lên đến 200 lần.
Theo đội ngũ phát triển, bí quyết giúp TurboDiffusion đạt được hiệu suất kinh ngạc nằm ở sự cải tiến trong quá trình huấn luyện mô hình, tiêu biểu là cơ chế Sparse Linear Attention. Thay vì xử lý toàn bộ dữ liệu cùng lúc, mô hình AI chỉ tập trung vào các phần quan trọng nhất, giúp tiết kiệm đáng kể chi phí tính toán và thời gian xử lý. Bên cạnh đó, việc nén các tham số mô hình từ 16-bit hoặc 32-bit xuống còn 8-bit cũng giúp giảm tiêu thụ bộ nhớ và đẩy nhanh tốc độ tính toán.
Hiện nay, các công cụ tạo video AI đình đám vẫn chưa đạt được tốc độ này. Ví dụ, để tạo đoạn video 5 giây, mô hình Sora của OpenAI cần hơn một phút, trong khi các công cụ hiện có của Shengshu mất từ 3 đến 5 phút.
TurboDiffusion đã được phát hành dưới dạng dự án mã nguồn mở hoàn toàn trên nền tảng GitHub. Sự ra đời của công nghệ này cho thấy tốc độ phát triển chóng mặt của lĩnh vực video AI kể từ sau cơn sốt Sora hồi đầu năm 2024. Nhà phân tích Kyon Xu nhận định, công nghệ này đại diện cho một bước ngoặt lớn trong ngành điện ảnh, khi AI không còn là "nút thắt cổ chai" cản trở quy trình sản xuất.
Đại diện tổ chức phi lợi nhuận AI Native Foundation chia sẻ trên X rằng TurboDiffusion đánh dấu sự chuyển dịch từ khả năng "có thể tạo ra" sang "có thể tạo ngay", cho phép ứng dụng video AI thời gian thực vào nhiều ngành công nghiệp. Điều này giúp các doanh nghiệp sản xuất video thương mại với chi phí thấp hơn và tốc độ lặp lại nhanh hơn, đồng thời cung cấp tiêu chuẩn mới cho giới nghiên cứu và nhà phát triển ứng dụng tương tác.
Tuy nhiên, sự bùng nổ của các công cụ tạo video nhanh như TurboDiffusion, Sora hay Google Veo cũng làm dấy lên nỗi lo ngại về tình trạng "AI Slop". Đây là thuật ngữ chỉ những nội dung được tạo ra quá nhanh, quá rẻ với số lượng lớn nhưng lại thiếu chiều sâu, dễ gây phản cảm hoặc sai lệch thông tin, gây ảnh hưởng tiêu cực đến trải nghiệm của người dùng trên các nền tảng mạng xã hội.