Giải pháp phiên dịch bằng AI của kỹ sư Việt

Giải pháp phiên dịch bằng AI của kỹ sư Việt

Giữa nhịp sống hối hả của các sự kiện quốc tế, nơi ngôn ngữ đôi khi trở thành rào cản, một giải pháp công nghệ đột phá đang dần thay đổi cách chúng ta giao tiếp. "Cabin AI", một sản phẩm "made in Vietnam" do kỹ sư Việt Trần Vũ Anh phát triển, mang đến khả năng phiên dịch lời nói trực tiếp với độ trễ đáng kinh ngạc, chỉ từ 3-5 giây. Hệ thống sử dụng trí tuệ nhân tạo (AI) để "học trước" ngữ cảnh cuộc hội thoại, từ đó cải thiện đáng kể tốc độ và độ chính xác trong việc nhận diện giọng nói, đặc biệt là với tên riêng, ngày tháng và các thuật ngữ nước ngoài. Cabin AI ra đời từ nhu cầu cấp thiết về một công cụ phiên dịch đuổi thời gian thực. Thay vì chỉ đơn thuần chuyển đổi ngôn ngữ, đội ngũ phát triển muốn tạo ra một hệ thống có khả năng "phản ứng như con người, vừa nghe, vừa hiểu, vừa dịch, bằng sức mạnh của trí tuệ nhân tạo", theo chia sẻ của anh Trần Vũ Anh. Sau thành công của DocTranslate.io, nhóm đã dành hơn một năm để phát triển Cabin AI, tập trung vào việc xử lý nội dung đa phương tiện, bao gồm cả âm thanh và video. Điểm đặc biệt của Cabin AI là người dùng không cần tai nghe phiên dịch truyền thống. Thay vào đó, họ có thể dễ dàng theo dõi bản dịch trực tiếp trên thiết bị cá nhân, tạo sự thuận tiện và liền mạch trong trải nghiệm. Tại diễn đàn về đổi mới sáng tạo quốc tế ở TP.HCM cuối tháng 10, Cabin AI đã được thử nghiệm rộng rãi. Hàng trăm khách tham dự được hướng dẫn quét mã QR để truy cập trang web, nơi họ có thể chọn ngôn ngữ mong muốn và theo dõi nội dung sự kiện dưới dạng phụ đề hoặc bản dịch âm thanh. Theo Vũ Anh, hai thách thức lớn nhất trong việc phát triển Cabin AI là tốc độ và độ chính xác trong nhận diện giọng nói. Các hệ thống AI trước đây thường phải chờ người nói kết thúc câu mới bắt đầu xử lý, gây ra sự chậm trễ đáng kể. Để giải quyết vấn đề này, nhóm kỹ sư DocTranslate đã áp dụng các mô hình AI chuyên biệt, tập trung vào nhận diện giọng nói và dịch thuật. Các mô hình này được tinh chỉnh dựa trên dữ liệu do công ty thu thập và xử lý, từ đó nâng cao khả năng hiểu và dịch chính xác các thuật ngữ chuyên ngành phức tạp. "Điểm đặc biệt của giải pháp là hệ thống cho phép AI 'học trước' bối cảnh của sự kiện, thông qua nội dung, slide trình bày, chủ đề thảo luận", Vũ Anh cho biết. Trong điều kiện lý tưởng, Cabin AI có thể phản hồi chỉ sau 3-5 giây kể từ khi người nói bắt đầu. Nền tảng hiện hỗ trợ hơn 32 ngôn ngữ, bao gồm tiếng Việt, Anh, Trung, Nhật, Hàn, Thái, Pháp, Đức, Tây Ban Nha, Italy, Nga, Hindi... Trong tháng 10 vừa qua, Cabin AI đã được triển khai tại nhiều sự kiện lớn như Diễn đàn Đổi mới Sáng tạo Mở và Hội thảo Khoa học về Công nghệ Lượng tử. Một đại biểu tham dự Diễn đàn Đổi mới Sáng tạo Mở nhận xét: "Phụ đề xuất hiện gần như đồng thời với lời nói, cảm giác người nói đang diễn đạt bằng tiếng mẹ đẻ của tôi". Cabin AI được kỳ vọng sẽ là một giải pháp bổ sung hiệu quả cho đội ngũ phiên dịch viên chuyên nghiệp, với khả năng triển khai đa dạng ngôn ngữ và chi phí hợp lý. Ước tính, chi phí triển khai giải pháp cho một sự kiện dao động từ 500.000 - 1.000.000 đồng mỗi giờ, tùy thuộc vào quy mô, số lượng ngôn ngữ và nhu cầu hỗ trợ kỹ thuật. Không chỉ dành cho các sự kiện offline, Cabin AI còn được tối ưu hóa cho các cuộc họp trực tuyến và trao đổi trực tiếp, giúp các đội nhóm đa quốc gia giao tiếp hiệu quả mà không còn rào cản ngôn ngữ. Giải pháp Cabin AI không chỉ là một công cụ phiên dịch, mà còn là một bước tiến quan trọng trong việc phá vỡ rào cản ngôn ngữ, thúc đẩy sự hợp tác và giao lưu quốc tế. Với khả năng ứng dụng rộng rãi và tiềm năng phát triển mạnh mẽ, Cabin AI hứa hẹn sẽ mang lại những thay đổi tích cực cho ngành công nghiệp dịch thuật và góp phần vào sự phát triển của cộng đồng toàn cầu. Trần Vũ Anh, nhà phát triển Cabin AI, là một trong 10 lãnh đạo công nghệ trẻ được vinh danh tại CTO Summit 2022 do VnExpress tổ chức. Giải pháp Doctranslate do anh và cộng sự phát triển trước đó từng vào Top 5 Techfest do Bộ Khoa học và Công nghệ tổ chức, cũng như được chọn vào chương trình Google for Startups Accelerator.