Đặc vụ giám hộ: Phương pháp mới có thể giảm ảo giác AI xuống dưới 1%
Trong bối cảnh doanh nghiệp ngày càng phụ thuộc vào trí tuệ nhân tạo (AI), vấn đề "ảo giác" – hiện tượng AI đưa ra thông tin sai lệch hoặc bịa đặt – trở thành một rào cản lớn. Giờ đây, một giải pháp đầy hứa hẹn đã xuất hiện, hứa hẹn mở ra kỷ nguyên AI đáng tin cậy hơn cho doanh nghiệp. Vectara, công ty tiên phong trong lĩnh vực AI, vừa giới thiệu một phương pháp đột phá có khả năng giảm tỷ lệ ảo giác xuống dưới 1% đối với các mô hình ngôn ngữ nhỏ.
Phương pháp mới của Vectara tập trung vào việc "tự động xác định, giải thích và sửa chữa ảo giác AI" thông qua một dịch vụ có tên gọi Vectara Hallucination Corrector. Thay vì chỉ đơn thuần phát hiện hoặc phòng ngừa ảo giác, Vectara sử dụng "guardian agents" (đặc vụ giám hộ) – các thành phần phần mềm giám sát và thực hiện các hành động bảo vệ trong quy trình AI, áp dụng các biện pháp sửa chữa.
Theo Vectara, hệ thống này có thể giảm tỷ lệ ảo giác xuống dưới 1% cho các mô hình ngôn ngữ nhỏ dưới 7 tỷ tham số. Đây là một bước tiến đáng kể, mở ra tiềm năng ứng dụng AI trong nhiều lĩnh vực mà trước đây bị hạn chế do lo ngại về độ chính xác.
"Khi các doanh nghiệp triển khai nhiều quy trình làm việc chủ động hơn, tất cả chúng ta đều biết rằng ảo giác vẫn là một vấn đề với LLM và việc khuếch đại theo cấp số nhân tác động tiêu cực của việc mắc lỗi trong một quy trình làm việc chủ động là điều khá đáng sợ đối với các doanh nghiệp," Eva Nahari, Giám đốc Sản phẩm của Vectara, chia sẻ trong một cuộc phỏng vấn độc quyền với VentureBeat. "Vì vậy, những gì chúng tôi đặt ra như một sự tiếp nối sứ mệnh xây dựng AI đáng tin cậy và cho phép tiềm năng đầy đủ của gen AI cho doanh nghiệp... là hướng đi mới trong việc phát hành các đặc vụ giám hộ."
Phương pháp tiếp cận của Vectara khác biệt so với các giải pháp hiện có trên thị trường. Trong khi nhiều công ty tập trung vào việc phát hiện ảo giác hoặc thiết lập các "hàng rào" phòng ngừa, Vectara đi một bước xa hơn bằng cách thực sự sửa chữa những thông tin sai lệch.
"Đó không chỉ là việc học hỏi về điều gì đó," Nahari nhấn mạnh. "Đó là việc thực hiện hành động thay mặt cho ai đó, và điều đó khiến nó trở thành một đặc vụ."
Về mặt kỹ thuật, "đặc vụ giám hộ" của Vectara là một quy trình nhiều giai đoạn, bao gồm một mô hình tạo sinh, một mô hình phát hiện ảo giác và một mô hình sửa chữa ảo giác. Quy trình này cho phép hệ thống thực hiện các điều chỉnh chính xác, đồng thời bảo tồn nội dung tổng thể và cung cấp giải thích chi tiết về những thay đổi đã thực hiện và lý do.
Sự khác biệt tinh tế là yếu tố quan trọng trong việc phát hiện và sửa chữa ảo giác. Suleman Kazi, trưởng nhóm kỹ thuật máy học tại Vectara, cho biết việc hiểu ngữ cảnh của truy vấn và tài liệu nguồn có thể tạo ra sự khác biệt giữa một câu trả lời chính xác và một ảo giác.
Để chứng minh tầm quan trọng của việc hiểu ngữ cảnh, Kazi đưa ra một ví dụ: một hệ thống AI đang xử lý một cuốn sách khoa học viễn tưởng mô tả bầu trời có màu đỏ thay vì màu xanh lam thông thường. Trong trường hợp này, một hệ thống sửa chữa ảo giác cứng nhắc có thể tự động "sửa" bầu trời đỏ thành xanh lam, điều này sẽ không chính xác đối với bối cảnh sáng tạo của một câu chuyện khoa học viễn tưởng.
Ngoài ra, Vectara cũng giới thiệu HCMBench, một bộ công cụ đánh giá mã nguồn mở để đánh giá các mô hình sửa chữa ảo giác. Bộ công cụ này cung cấp các phương pháp tiêu chuẩn để đánh giá hiệu quả của các phương pháp khác nhau trong việc sửa chữa ảo giác, hỗ trợ nhiều chỉ số bao gồm HHEM, Minicheck, AXCEL và FACTSJudge.
"Nếu cộng đồng nói chung muốn phát triển các mô hình sửa chữa của riêng họ, họ có thể sử dụng điểm chuẩn đó làm tập dữ liệu đánh giá để cải thiện mô hình của họ," Kazi nói.
Đối với các doanh nghiệp đang phải đối mặt với rủi ro của ảo giác AI, phương pháp của Vectara mang đến một sự thay đổi đáng kể trong chiến lược. Thay vì chỉ triển khai các hệ thống phát hiện hoặc từ bỏ AI trong các trường hợp sử dụng có rủi ro cao, các công ty giờ đây có thể xem xét một con đường trung gian: triển khai các khả năng sửa chữa.
Với sự phát triển của các công nghệ sửa chữa ảo giác, các doanh nghiệp có thể sớm triển khai AI trong các trường hợp sử dụng bị hạn chế trước đây, đồng thời duy trì các tiêu chuẩn chính xác cần thiết cho các hoạt động kinh doanh quan trọng.