Cuộc chiến AI hóa web: NLweb và những điều doanh nghiệp cần biết
Trong bối cảnh trí tuệ nhân tạo (AI) đang thay đổi mọi mặt đời sống, web cũng không nằm ngoài cuộc cách mạng này. Giờ đây, các giao thức mới đang nổi lên, hứa hẹn "AI hóa" web, giúp AI dễ dàng tiếp cận và tương tác với các website hơn bao giờ hết. Liệu đây có phải là bước tiến tất yếu để hòa mình vào kỷ nguyên agentic AI, và doanh nghiệp cần chuẩn bị gì cho sự thay đổi này?
Nhằm giải quyết bài toán "AI hóa" web, nhiều giao thức đã ra đời như Model Control Protocol (MCP) của Anthropic, Agent2Agent của Google và LLMs.txt. Mới đây, Microsoft đã tung ra NLWeb (Natural Language Web), một giao thức mã nguồn mở đầy tiềm năng. Điểm đặc biệt của NLWeb là cho phép website dễ dàng tích hợp giao diện hội thoại AI, biến website thành một "ứng dụng AI" thực thụ. Người dùng có thể thoải mái truy vấn thông tin bằng ngôn ngữ tự nhiên, mở ra trải nghiệm tương tác hoàn toàn mới.
NLWeb không đi theo hướng cạnh tranh trực tiếp mà lựa chọn cách xây dựng dựa trên các giao thức hiện có. Giao thức này tận dụng các định dạng dữ liệu có cấu trúc quen thuộc như RSS và hoạt động như một máy chủ MCP. Kevin Scott, Giám đốc Công nghệ của Microsoft, đã ví NLWeb như "HTML cho web AI", giúp mọi website hoặc API trở thành một ứng dụng agentic.
Vậy NLWeb hoạt động như thế nào để "AI hóa" web cho doanh nghiệp? Hệ thống này khai thác dữ liệu có cấu trúc mà các website đã công bố, bao gồm markup, RSS feed và các định dạng bán cấu trúc khác thường được nhúng vào trang web. Sau đó, NLWeb cung cấp các công cụ để thêm dữ liệu có cấu trúc này vào cơ sở dữ liệu vector, cho phép tìm kiếm và truy xuất ngữ nghĩa hiệu quả. LLM (Large Language Model) sẽ tăng cường dữ liệu đã lưu trữ bằng kiến thức và ngữ cảnh bên ngoài. Kết quả là một giao diện ngôn ngữ tự nhiên phục vụ cả người dùng và các tác nhân AI.
Trong bối cảnh có nhiều giao thức AI đang nổi lên, việc lựa chọn giao thức phù hợp có thể là một thách thức. Google’s Agent2Agent tập trung vào việc cho phép các agent giao tiếp với nhau, trong khi LLMs.txt hướng đến việc giúp LLM truy cập nội dung web tốt hơn. Theo Michael Ni, VP và Chuyên gia phân tích chính tại Constellation Research, "NLWeb không cạnh tranh với LLMs.txt; nó tương tự như các công cụ thu thập dữ liệu web cố gắng suy luận ý định từ một trang web."
MCP đang dần trở thành một tiêu chuẩn thực tế và là một yếu tố nền tảng của NLWeb. Will McKeon-White, Chuyên gia phân tích cấp cao của Forrester, nhận thấy nhiều ưu điểm của NLWeb so với các lựa chọn khác:
"Ưu điểm chính của NLWeb là kiểm soát tốt hơn cách các hệ thống AI ‘nhìn thấy’ các phần tạo nên trang web, cho phép điều hướng tốt hơn và hiểu đầy đủ hơn về các công cụ. Điều này có thể giảm cả lỗi từ các hệ thống hiểu sai những gì chúng đang thấy trên trang web, cũng như giảm việc làm lại giao diện."
Nhiều tổ chức đã bắt đầu sử dụng NLWeb, bao gồm Chicago Public Media, Allrecipes, Eventbrite, Hearst (Delish), O’Reilly Media, Tripadvisor và Shopify. Andrew Odewahn, Giám đốc Công nghệ tại O’Reilly Media, nhận thấy tiềm năng thực sự của NLWeb:
"NLWeb tận dụng các phương pháp hay nhất và các tiêu chuẩn được phát triển trong thập kỷ qua trên web mở và cung cấp chúng cho LLM. Các công ty từ lâu đã dành thời gian tối ưu hóa loại siêu dữ liệu này cho SEO và các mục đích tiếp thị khác, nhưng giờ đây họ có thể tận dụng kho dữ liệu này để làm cho AI nội bộ của họ thông minh hơn và có khả năng hơn với NLWeb."
Tuy nhiên, có nên "nhảy" vào NLWeb ngay bây giờ hay nên chờ đợi? Michael Ni cho rằng NLWeb vẫn còn ở giai đoạn phát triển rất sớm và các doanh nghiệp nên dự kiến từ 2-3 năm để có bất kỳ sự chấp nhận đáng kể nào. Tuy nhiên, Maria Gorskikh lại có quan điểm mạnh mẽ hơn:
"Nếu bạn là một doanh nghiệp có một bề mặt nội dung lớn, cơ sở kiến thức nội bộ hoặc dữ liệu có cấu trúc, thì việc thử nghiệm NLWeb ngay bây giờ là một bước đi thông minh và cần thiết để đi trước. Đây không phải là thời điểm chờ xem — nó giống như việc áp dụng sớm API hoặc ứng dụng di động."
Dù vậy, Gorskikh cũng lưu ý rằng các ngành công nghiệp được quản lý chặt chẽ nên thận trọng.
Tóm lại, NLWeb là một bước ngoặt quan trọng đối với các nhà lãnh đạo AI doanh nghiệp. AI sẽ tương tác với trang web của bạn, và bạn cần "AI hóa" nó. NLWeb là một cách để làm điều đó, đặc biệt hấp dẫn đối với các nhà xuất bản. Trong tương lai, người dùng sẽ kỳ vọng điều này, họ sẽ muốn tìm kiếm và khám phá mọi thứ một cách dễ dàng, và các hệ thống AI agentic cũng cần có khả năng truy cập nội dung. Đó chính là lời hứa của NLWeb.