Mastodon Cấm Huấn Luyện Mô Hình AI, Tiếp Bước X Trong Cuộc Chiến Chống "Đạo Văn" Dữ Liệu
Trong bối cảnh các mô hình trí tuệ nhân tạo (AI) đang "ngốn" dữ liệu người dùng một cách chóng mặt, các mạng xã hội bắt đầu siết chặt "vòng kim cô" để bảo vệ quyền riêng tư và ngăn chặn tình trạng "đạo văn" dữ liệu. Mới đây, Mastodon, mạng xã hội phi tập trung được biết đến như một lựa chọn thay thế Twitter (nay là X), đã chính thức cập nhật điều khoản dịch vụ, cấm mọi hành vi sử dụng dữ liệu người dùng để huấn luyện AI. Động thái này diễn ra chỉ vài ngày sau khi X của Elon Musk cũng đưa ra quy định tương tự, cho thấy một xu hướng ngày càng rõ rệt trong ngành công nghiệp mạng xã hội.
Theo thông báo chính thức từ Mastodon, điều khoản mới sẽ có hiệu lực từ ngày 1 tháng 7. Quy định này ngăn chặn triệt để việc trích xuất dữ liệu và phát triển hệ thống tự động nhằm phục vụ mục đích huấn luyện các mô hình ngôn ngữ lớn (LLM) và các hệ thống AI khác.
"Chúng tôi cấm rõ ràng việc thu thập dữ liệu người dùng cho các mục đích trái phép, ví dụ như lưu trữ hoặc huấn luyện mô hình ngôn ngữ lớn (LLM). Chúng tôi muốn làm rõ rằng việc huấn luyện LLM dựa trên dữ liệu của người dùng Mastodon trên các máy chủ của chúng tôi là không được phép," Mastodon nhấn mạnh trong email gửi tới người dùng.
Điều đáng chú ý là quy định này chỉ áp dụng cho máy chủ Mastodon.social, một phần trong mạng fediverse phân tán. Điều này có nghĩa là các công cụ thu thập dữ liệu vẫn có thể trích xuất thông tin từ các máy chủ khác và sử dụng chúng để huấn luyện AI nếu các máy chủ này không có điều khoản cấm tương tự. Tuy nhiên, động thái này vẫn được xem là một bước tiến quan trọng trong việc bảo vệ quyền riêng tư của người dùng và khuyến khích các nền tảng khác có những hành động tương tự.
Mastodon không phải là nền tảng duy nhất nhận thức được nguy cơ này. Các "ông lớn" khác trong ngành công nghệ như OpenAI (công ty đứng sau ChatGPT), Reddit, và The Browser Company cũng đã bổ sung các điều khoản tương tự để ngăn chặn việc các công ty khác sử dụng dữ liệu của họ để huấn luyện AI.
Bên cạnh việc bảo vệ dữ liệu, Mastodon cũng nâng giới hạn độ tuổi tối thiểu của người dùng lên 16 trên toàn cầu. Trước đây, nền tảng này chỉ áp dụng giới hạn 13 tuổi cho người dùng ở Hoa Kỳ.
Những động thái này cho thấy các mạng xã hội đang ngày càng ý thức rõ hơn về tầm quan trọng của việc bảo vệ dữ liệu người dùng trong bối cảnh AI đang phát triển mạnh mẽ. Các quy định mới không chỉ giúp ngăn chặn việc lạm dụng dữ liệu mà còn có thể định hình lại cách thức các mô hình AI được phát triển trong tương lai. Cuộc chiến chống "đạo văn" dữ liệu đang nóng hơn bao giờ hết, và Mastodon đã thể hiện quyết tâm của mình trong cuộc chiến này.