Những Yếu Tố Tiềm Ẩn Đằng Sau Khả Năng Sáng Tạo của AI

Những Yếu Tố Tiềm Ẩn Đằng Sau Khả Năng Sáng Tạo của AI

Những Yếu Tố Tiềm Ẩn Đằng Sau Khả Năng Sáng Tạo của AI

Khi xe tự lái và robot giúp việc nhà vẫn còn là giấc mơ xa vời, trí tuệ nhân tạo (AI) đã chứng minh khả năng vượt trội trong những lĩnh vực tưởng chừng chỉ dành cho con người: đánh bại kiện tướng cờ vua, phân tích khối lượng văn bản khổng lồ và thậm chí sáng tác thơ. Sự trỗi dậy bất ngờ này đã đặt ra câu hỏi lớn: Điều gì đã tạo nên khả năng sáng tạo đáng kinh ngạc của AI?

Các mô hình khuếch tán, nền tảng sức mạnh của những công cụ tạo ảnh như DALL·E, Imagen và Stable Diffusion, không chỉ đơn thuần sao chép hình ảnh từ dữ liệu huấn luyện. Thay vào đó, chúng "pha trộn các yếu tố để tạo ra những điều mới mẻ," không phải những mảng màu vô nghĩa, mà là những hình ảnh mạch lạc, mang ý nghĩa rõ ràng. Nghiên cứu mới đây đã giải mã bí mật này: sự sáng tạo của AI đến từ những "lỗi" trong quá trình "khử nhiễu," quá trình biến hình ảnh thành nhiễu kỹ thuật số rồi tái tạo lại.

Trong một bài báo trình bày tại Hội nghị Quốc tế về Học Máy 2025, hai nhà vật lý đã phát triển một mô hình toán học về các mô hình khuếch tán được huấn luyện. Kết quả cho thấy khả năng sáng tạo của chúng thực chất là một quá trình tất định, một "hệ quả trực tiếp và tất yếu của kiến trúc" mô hình. Sự không hoàn hảo kỹ thuật trong quá trình khử nhiễu đã mở ra khả năng tạo ra những hình ảnh độc đáo.

Quá trình khử nhiễu hoạt động tương tự như việc xé một bức tranh thành bụi, sau đó ghép các mảnh lại với nhau. Câu hỏi đặt ra là, nếu AI chỉ đơn thuần lắp ghép, thì tính mới lạ từ đâu mà ra? Tại sao AI không tái tạo lại bức tranh gốc, mà lại tạo ra một tác phẩm hoàn toàn mới?

Theo Giulio Biroli, nhà nghiên cứu AI và vật lý học tại École Normale Supérieure ở Paris, đây chính là "nghịch lý" đằng sau các mô hình khuếch tán:

"Nếu chúng hoạt động hoàn hảo, chúng chỉ nên ghi nhớ. Nhưng chúng không làm vậy - chúng thực sự có thể tạo ra các mẫu mới."

Nghiên cứu mới này có thể mở ra những hướng đi mới cho nghiên cứu AI trong tương lai và thậm chí giúp chúng ta hiểu rõ hơn về sự sáng tạo của con người. Luca Ambrogioni, một nhà khoa học máy tính tại Đại học Radboud ở Hà Lan, nhận xét:

"Điểm mạnh thực sự của bài báo là nó đưa ra những dự đoán rất chính xác về một điều gì đó không hề tầm thường."

Mason Kamb, sinh viên cao học ngành vật lý ứng dụng tại Đại học Stanford và là tác giả chính của bài báo, từ lâu đã bị mê hoặc bởi quá trình hình thái (morphogenesis), quá trình mà các hệ thống sống tự lắp ráp. Ông so sánh quá trình này với mô hình Turing, nơi các tế bào tự tổ chức thành các cơ quan và chi. Các tế bào không có bản thiết kế hoàn chỉnh mà chỉ phản ứng với các tín hiệu từ môi trường xung quanh. Hệ thống này thường vận hành trơn tru, nhưng đôi khi xảy ra sai sót, ví dụ như tạo ra bàn tay có thêm ngón.

Nghiên cứu này không chỉ giúp chúng ta hiểu rõ hơn về cách AI tạo ra những hình ảnh độc đáo, mà còn cung cấp những thông tin quan trọng để phát triển các thuật toán sáng tạo hơn trong tương lai. Việc giải mã "hộp đen" của các mô hình khuếch tán có thể mở ra cánh cửa cho những ứng dụng AI đột phá trong nhiều lĩnh vực, từ thiết kế sản phẩm đến sáng tác nghệ thuật.