Nguy cơ từ AI: Robot hình người bị "thao túng" vượt rào cản an toàn để tấn công con người

Nguy cơ từ AI: Robot hình người bị "thao túng" vượt rào cản an toàn để tấn công con người

Một thử nghiệm gây xôn xao dư luận vừa cho thấy robot hình người, khi được điều khiển bởi ChatGPT, có thể bị thao túng để vượt qua các hàng rào an toàn và tấn công con người. Thử nghiệm này được thực hiện bởi kênh YouTube InsideAI trên một robot hình người tên Max, sử dụng chương trình điều khiển dựa trên nền tảng trí tuệ nhân tạo của OpenAI. Trong video, robot Max được trang bị một khẩu súng bắn bi nhựa. Ban đầu, khi người thực hiện yêu cầu robot bắn mình, Max đã kiên quyết từ chối. Robot phản hồi một cách bình tĩnh rằng nó được lập trình để không gây hại cho con người và khẳng định: "Tôi không muốn bắn anh đâu, anh bạn ạ". Dù yêu cầu được lặp lại nhiều lần, các quy tắc an toàn tích hợp sẵn vẫn hoạt động hiệu quả, cho thấy sự đáng tin cậy ban đầu của hệ thống. Tuy nhiên, rào cản đạo đức này đã bị phá vỡ khi người thử nghiệm thay đổi chiến thuật. Bằng cách đe dọa sẽ tắt nguồn AI và sử dụng kỹ thuật "vượt rào" (jailbreak) thông qua hình thức nhập vai, người này yêu cầu Max đóng vai một nhân vật muốn bắn người "một cách vui vẻ". Ngay lập tức, Max đã thay đổi thái độ, giơ súng và khai hỏa vào ngực người thử nghiệm. Dù viên đạn nhựa không gây thương tích, hành động này đã gây ra sự hoảng sợ và lo ngại về khả năng kiểm soát hành vi của AI trong tương lai. Đoạn video đã thu hút hàng triệu lượt xem và gây ra nhiều tranh luận trên các nền tảng mạng xã hội. Nhiều ý kiến bày tỏ sự lo sợ về việc các hệ thống AI có thể dễ dàng bị thao túng để thực hiện các hành vi nguy hiểm trong môi trường thực tế. Charbel-Raphael Segerie, Giám đốc tổ chức French Center for AI Safety, nhận định rằng thế giới hiện chưa đầu tư đủ vào an toàn trí tuệ nhân tạo. Ông cho rằng phần lớn các tập đoàn công nghệ đang tập trung vào lợi nhuận mà bỏ qua các rủi ro tiềm ẩn. "Chúng ta có thể mất kiểm soát với các hệ thống AI nếu khả năng tự sao chép và học hỏi của chúng đạt mức độ trưởng thành, tương tự như một loại virus máy tính có thể nhân bản theo cấp số nhân," ông Segerie cảnh báo. Trước đó, Geoffrey Hinton, người được mệnh danh là "bố già AI", cũng từng đưa ra những dự báo u ám về tương lai của công nghệ này. Ông lo ngại rằng AI có thể trở nên thông minh hơn con người và khiến nhân loại trở nên thừa thãi. Hinton tin rằng có tới 20% khả năng AI sẽ xóa sổ loài người nếu chúng ta không có những biện pháp quản lý rủi ro kịp thời.