Google AI: Cuộc chiến giành lại niềm tin từ “lỗi vô lý”
Từng được xem là bước tiến đột phá trong lĩnh vực AI, tính năng Google AI Overview ra mắt vào ngày 15/5 vừa qua đã nhanh chóng gây thất vọng. Nguyên nhân xuất phát từ việc công cụ này liên tục đưa ra những câu trả lời sai lệch, thậm chí là vô lý, khiến người dùng đặt dấu hỏi về hiệu quả của AI trong việc cải thiện trải nghiệm tìm kiếm.
Điển hình là trường hợp một người dùng tìm kiếm giải pháp cho việc “phô mai và bánh pizza không dính vào nhau”, công cụ AI của Google lại đưa ra lời khuyên “thêm 1/8 cốc keo không độc hại vào nước sốt để tăng độ kết dính”. Một ví dụ khác là khi được hỏi “Có con thỏ nào từng chơi ở giải bóng rổ NBA không”, công cụ này đã trả lời “Có” vì nhầm lẫn giữa từ “thỏ” với tên một cầu thủ. Trước làn sóng chỉ trích, Google đã lên tiếng thừa nhận những “ảo giác” này là hạn chế cố hữu của Mô hình Ngôn ngữ Lớn (LLM) – công nghệ cốt lõi của AI Overview. Đồng thời, hãng cũng cam kết sẽ tiếp tục cải thiện thuật toán để khắc phục tình trạng này.
Tuy nhiên, theo ông Sundar Pichai – Giám đốc Điều hành Google, những “ảo giác” này là hạn chế cố hữu của Mô hình Ngôn ngữ Lớn (LLM). LLM là công nghệ cốt lõi của tính năng AI Overview và việc Google thừa nhận hạn chế này cho thấy họ có thể đã quá vội vàng trong việc ra mắt sản phẩm khi chưa hoàn thiện. Quan điểm này cũng được nhiều chuyên gia công nghệ đồng tình.
Theo họ, người dùng có thể dễ dàng bỏ qua những câu trả lời “ngớ ngẩn” của ChatGPT vì mục đích giải trí. Tuy nhiên, với một công cụ tìm kiếm uy tín như Google, người dùng có quyền đòi hỏi sự chính xác và tin cậy. Việc Google AI Overview liên tục mắc lỗi “vô lý” cho thấy Google có thể đã quá nóng vội trong việc ra mắt sản phẩm để cạnh tranh với các đối thủ như Bing AI hay ChatGPT.
Nguyên nhân sâu xa dẫn đến những câu trả lời sai lệch của Google AI được cho là do quá trình huấn luyện AI dựa trên nguồn dữ liệu khổng lồ nhưng chưa được xử lý kỹ lưỡng. Ông Hồ Thiệu Dũng – Đồng sáng lập kiêm Giám đốc Công nghệ (CTO) của Công ty An ninh mạng Quan An (Trung Quốc) – cho biết: “Do con người đặt ra những câu hỏi rất đa dạng và phóng khoáng, AI sẽ cung cấp câu trả lời dựa trên xác suất thống kê gần nhất chứ không phải câu trả lời chính xác. Trong trường hợp này, câu trả lời của AI dù nghe có vẻ hợp lý nhưng có thể không đúng với thực tế. Vì vậy, việc làm sạch dữ liệu là khâu quan trọng để tránh lan truyền thông tin sai lệch”.
Vào ngày 21/2 năm nay, Google tuyên bố hợp tác với Reddit – mạng xã hội thường được ví như “diễn đàn Reddit của Mỹ” – để sử dụng nội dung trên nền tảng này huấn luyện cho mô hình AI.
Ông Trần Hi – Phó Tổng thư ký Ủy ban Tiêu chuẩn hóa Trí tuệ Nhân tạo Thượng Hải, Trưởng ban Nghiên cứu Tiêu chuẩn của Hiệp hội Công nghiệp Trí tuệ Nhân tạo Thượng Hải – cho rằng: “Reddit tuy có nhiều chủ đề đa dạng nhưng cũng chứa đựng nhiều thông tin nhiễu loạn và không chính xác, ví dụ như những câu trả lời ‘bá đạo’ của người dùng.
Nếu không được làm sạch và lọc kỹ càng, mô hình AI được huấn luyện rất dễ bị ‘nhiễu’ bởi những thông tin sai lệch này”. Cũng theo ông Trần Hi, Google AI rất có thể đã sử dụng kỹ thuật Tìm kiếm tăng cường tạo văn bản (RAG) và ưu tiên một số trang web nhất định. Theo đó, Reddit – với tư cách là đối tác – được ưu tiên trong việc thu thập và tổng hợp câu trả lời từ cơ sở kiến thức, sau đó được xử lý bởi mô hình ngôn ngữ lớn. Điều này vô tình khiến những câu trả lời mang tính chất đùa cợt, như “bôi keo vào bánh pizza”, lọt vào hệ thống.
Có thể thấy Google đang đối mặt với áp lực cạnh tranh gay gắt từ các đối thủ như Bing (với trợ lý AI “Bing thông minh” ra mắt từ năm 2019) và OpenAI (với mô hình GPT-4o ra mắt vào ngày 14/5).
Bên cạnh đó, sự thay đổi thói quen của người dùng, đặc biệt là giới trẻ, khi chuyển sang các nền tảng mới như TikTok cũng là một thách thức lớn. Trong bối cảnh đó, việc tích hợp AI vào công cụ tìm kiếm được xem là nỗ lực của Google nhằm thu hút người dùng, duy trì vị thế dẫn đầu trong kỷ nguyên AI. Tuy nhiên, sự cố lần này cho thấy Google cần cẩn trọng hơn trong việc phát triển và triển khai các sản phẩm AI. Việc vội vàng ra mắt sản phẩm chưa hoàn thiện không những không giúp Google giành lại thị phần mà còn có thể gây ảnh hưởng tiêu cực đến uy tín của hãng.