💡 Giao thức NLWeb của Microsoft có tiềm năng lớn trong việc định hình lại tương tác giữa AI và web, nhưng sự thành công của nó sẽ phụ thuộc vào việc các nhà phát triển và doanh nghiệp có sẵn sàng cấu trúc lại dữ liệu và đối mặt với các vấn đề quản trị mới hay không. Team RetroLab tin rằng đây là một bước tiến quan trọng, nhưng con đường phía trước còn nhiều thách thức.
Trong nhiều thập kỷ, trình duyệt web đã là cổng thông tin chính để tiếp cận thế giới trực tuyến. Tuy nhiên, sự trỗi dậy của các công cụ tìm kiếm bằng ngôn ngữ tự nhiên như Microsoft Copilot đang dần thay đổi bức tranh này, cho phép người dùng đặt câu hỏi và nhận câu trả lời trực tiếp mà không cần thông qua trang kết quả truyền thống.
NLWeb Protocol, một sáng kiến của Microsoft được công bố tại sự kiện Build 2025, hứa hẹn sẽ đẩy mạnh xu hướng này xuống cấp độ website. Đây là một giao thức mở cho phép bất kỳ trang web nào có khả năng phản hồi các truy vấn bằng ngôn ngữ tự nhiên mà không cần sự can thiệp của công cụ tìm kiếm. Sự kiện Microsoft Build 2026 sắp tới sẽ là phép thử quan trọng để đánh giá liệu NLWeb có thực sự tạo ra bước đột phá trong việc áp dụng hay vẫn chỉ là một thử nghiệm tìm kiếm tiêu chuẩn.
NLWeb Protocol là gì?
NLWeb, viết tắt của Natural Language Web, là một dự án mã nguồn mở của Microsoft cho phép các website tiếp nhận và phản hồi các truy vấn ngôn ngữ tự nhiên, biến chúng thành các ứng dụng được hỗ trợ bởi AI. Dự án được dẫn dắt bởi R.V. Guha, người có kinh nghiệm sâu rộng trong lĩnh vực hạ tầng web với các đóng góp tiên phong như RSS, RDF và Schema.org.
Tại Build 2025, Microsoft đã ví von vai trò của NLWeb với HTML trong việc phổ biến sáng tạo web. Nếu HTML giúp việc xuất bản nội dung trở nên dễ dàng, thì NLWeb lại giải quyết bài toán truy vấn nội dung đó cho cả con người và các tác nhân AI.
Điểm khác biệt cốt lõi của NLWeb so với các chatbot thông thường là mỗi điểm cuối NLWeb còn hoạt động như một máy chủ Model Context Protocol (MCP). MCP, một tiêu chuẩn mở do Anthropic phát triển vào tháng 11 năm 2024, đã được cộng đồng công nghệ chấp nhận rộng rãi để kết nối các hệ thống AI với nguồn dữ liệu bên ngoài. Việc xây dựng NLWeb trên nền tảng MCP giúp tích hợp nội dung website trực tiếp vào hệ sinh thái AI đang phát triển mạnh mẽ.
Những đơn vị tiên phong áp dụng NLWeb bao gồm Shopify, TripAdvisor, Eventbrite, O'Reilly Media, các trang thuộc Hearst như Delish, Chicago Public Media và Common Sense Media. Có thể thấy, các tên tuổi này đều sở hữu những website có cấu trúc dữ liệu rõ ràng, danh mục nội dung được tổ chức tốt, phù hợp với các định dạng web mà NLWeb yêu cầu.

Cách thức hoạt động của NLWeb Protocol
NLWeb hoạt động dựa trên dữ liệu có cấu trúc mà hầu hết các website đã công bố. Giao thức này đọc các định dạng như Schema.org và RSS – theo tài liệu dự án, chúng đang được sử dụng trên hơn 100 triệu website – và bổ sung một lớp ngôn ngữ tự nhiên bằng cách sử dụng mô hình ngôn ngữ lớn (LLM) do nhà phát triển lựa chọn.
Giao thức cung cấp hai điểm cuối chính: /ask và /mcp.
- /ask: Xử lý các truy vấn ngôn ngữ tự nhiên từ người dùng thông qua JSON qua REST, trả về kết quả dưới dạng JSON Schema.org có cấu trúc. Điểm cuối này duy trì lịch sử trò chuyện trong một phiên, cho phép các câu hỏi tiếp theo được xây dựng dựa trên ngữ cảnh trước đó, khác biệt rõ rệt so với tìm kiếm từ khóa truyền thống.
- /mcp: Triển khai máy chủ MCP, cho phép các tác nhân AI bên ngoài kết nối và truy vấn nội dung trang web theo các điều khoản mà nhà xuất bản kiểm soát.
Khi một truy vấn đến /ask, NLWeb không chỉ đơn thuần chuyển nó cho một LLM duy nhất. Thay vào đó, nó chia nhỏ truy vấn thành nhiều bước xử lý song song: tách ngữ cảnh, truy xuất nội dung liên quan từ cơ sở dữ liệu vector, và sử dụng LLM để xếp hạng và tạo phản hồi cuối cùng. Phương pháp này, với nhiều lệnh gọi mô hình tập trung thay vì một lời nhắc lớn duy nhất, mang lại kết quả nhất quán hơn.
NLWeb có tính chất độc lập với công nghệ, nghĩa là người dùng không bị ràng buộc vào bất kỳ mô hình, nhà cung cấp hạ tầng hay hệ điều hành cụ thể nào. Kho lưu trữ GitHub của dự án cung cấp một bản triển khai tham chiếu bằng Python và hướng dẫn nhanh, hỗ trợ tất cả các cơ sở dữ liệu vector và điểm cuối LLM chính.
Tại Microsoft Build 2026: Những kỳ vọng về NLWeb
Build 2026 diễn ra từ ngày 2-3 tháng 6 tại Fort Mason Center, San Francisco, đánh dấu sự thay đổi địa điểm đáng chú ý so với Trung tâm Hội nghị Seattle. Microsoft mô tả sự kiện năm nay là "không lan man", tập trung vào chiều sâu kỹ thuật thay vì các thông báo cho đối tượng rộng.
Danh mục phiên bao gồm hơn 90 mục được tổ chức thành bảy luồng chính: Agents and Apps, Azure AI Platform / Azure AI Foundry, GitHub and developer productivity, Microsoft Fabric, Responsible AI, Windows, và Working with Models. NLWeb liên quan trực tiếp nhất đến luồng Agents and Apps, nơi dự kiến sẽ bao gồm các cập nhật về công cụ MCP, thể hiện sự đầu tư liên tục của Microsoft vào giao thức này.
NLWeb được công bố cách đây hơn một năm, và Build 2026 là hội nghị lớn đầu tiên mà giao thức này có thể được đánh giá dựa trên việc triển khai thực tế thay vì tiềm năng. Cloudflare đã bổ sung hỗ trợ NLWeb gốc thông qua cơ sở hạ tầng AutoRAG vào đầu năm 2026, cung cấp một con đường triển khai được quản lý thay vì tích hợp thủ công, cho thấy hệ sinh thái đang dần định hình.
Microsoft đã gia nhập Ủy ban Chỉ đạo MCP tại Build 2025 và đóng góp một bản đặc tả ủy quyền cập nhật cùng thiết kế dịch vụ đăng ký máy chủ MCP. Bất kỳ cập nhật nào về quản trị MCP, khám phá tác nhân hoặc điều phối máy chủ tại Build 2026 sẽ có ý nghĩa trực tiếp đối với NLWeb, do sự liên kết chặt chẽ giữa hai giao thức này.
Bài phát biểu khai mạc của CEO Satya Nadella thường là nơi Microsoft định hình các ưu tiên ở cấp nền tảng. Tại Build 2025, ông Nadella đã mô tả sự kiện này đánh dấu "kỷ nguyên của các tác nhân AI". Dù NLWeb có nhận được sự chú ý đặc biệt trong bài phát biểu chính thức vào năm 2026 hay chỉ xuất hiện chủ yếu qua các phiên thảo luận, nó đều nằm gọn trong chủ đề trung tâm của hội nghị: đưa việc phát triển tác nhân AI từ giai đoạn công bố đến sẵn sàng sản xuất.
Ý nghĩa đối với các nhà phát triển web
Đối với các nhà phát triển web, NLWeb tạo ra áp lực thực tế để đánh giá mức độ cấu trúc dữ liệu trên trang web của họ. Giao thức hoạt động tốt nhất với nội dung được tổ chức dưới dạng danh sách các mục như sản phẩm, sự kiện, công thức nấu ăn, đánh giá. Các trang web có đánh dấu ngữ nghĩa kém hoặc thiếu sót sẽ cho kết quả yếu hơn đáng kể, vì lớp truy xuất của NLWeb phụ thuộc vào các chú thích Schema.org mà nhiều nhà xuất bản đã đầu tư chưa đủ.
Quan trọng hơn, NLWeb làm mờ ranh giới giữa một website và một API. Việc chạy một điểm cuối NLWeb đồng nghĩa với việc trang web của bạn có thể được truy vấn bởi các tác nhân AI bên ngoài, không chỉ người dùng truy cập qua trình duyệt. Điều này đặt ra các câu hỏi về quản trị: những tác nhân nào có thể truy cập nội dung của bạn, với tốc độ nào và theo những điều khoản nào.
Về mặt công cụ, Microsoft đang mở rộng Azure AI Foundry và cơ sở hạ tầng dành cho nhà phát triển liên quan đến MCP, cả hai đều dự kiến sẽ xuất hiện tại Build 2026. Đối với các nhà phát triển muốn thêm NLWeb vào website hiện có, bản triển khai tham chiếu trên GitHub là điểm khởi đầu rõ ràng nhất. Tích hợp AutoRAG của Cloudflare hiện cung cấp một con đường triển khai được quản lý cho các nhóm không muốn tự xử lý hạ tầng cơ bản.

Nguồn: TechRadar - https://www.techradar.com/pro/could-microsoft-kill-the-web-browser-at-build-everything-developers-need-to-know-about-the-nlweb-protocol





