Google Bard không thực hiện được cam kết của mình - ngay cả sau các cập nhật mới nhất.

Tháng Chín 27, 2023

Trong tuần này Google tiến hành tổ chức kỷ niệm sinh nhật 25 năm thành lập trong bối cảnh những nỗ lực đẩy mạnh cạnh tranh với đối thủ trên mảng thị trường mũi nhọn chiến lược Generative AI vẫn còn chưa mấy sáng sủa.

Google đã thực hiện rất nhiều cải tiến đối với chatbot Bard, vào tuần trước thông qua một cuộc cải tổ lớn, cho phép người dùng truy cập vào nó từ một số sản phẩm phổ biến nhất của họ, bao gồm Gmail, Docs, Drive, Maps, YouTube và nhiều sản phẩm khác. Cập nhật này lý thuyết mang lại lợi thế cho Bard của Google so với ChatGPT, một công cụ dẫn đầu trên thị trường do OpenAI và Microsoft cùng phát triển. Về mặt thị trường, công cụ tìm kiếm của Google và các ứng dụng khác của họ có sự tiếp cận rộng lớn hơn đáng kể so với các ứng dụng phổ biến của Microsoft.

Sự giới thiệu của Bard Extensions lý thuyết là một động thái tiềm năng. Hãy tưởng tượng trợ lý trí tuệ nhân tạo của bạn không chỉ trình bày các sự thật từ cơ sở dữ liệu kiến thức được đào tạo trên hàng tỷ tham số, cạnh tranh với những gì mà ChatGPT đang cung cấp, mà còn có khả năng trích xuất dữ liệu cá nhân trực tiếp từ các dịch vụ Google của bạn. Ý tưởng về Bard lục lọi qua Gmail hoặc Google Drive của tôi để cung cấp các phản ứng cụ thể theo ngữ cảnh nghe có vẻ như một đoạn trích từ cuốn tiểu thuyết của William Gibson. Nhưng đây là nơi chúng ta gặp một vấn đề.

Trong tuần kể từ khi tôi báo cáo thông báo, tôi đã có cơ hội trải nghiệm sử dụng sản phẩm mới này. Thật không may, trong thực tế, tôi thấy Bard làm thất vọng ở nhiều khía cạnh. Nó không thể thực hiện được cam kết cốt lõi của mình về việc tích hợp tốt với các ứng dụng của Google và thường xuyên cho ra những đáp ứng không chính xác hoặc thiếu căn cứ xác đáng. Bard cũng thiếu đi sự sáng tạo và tính linh hoạt của GPT-4 (Nó cũng không có tính cách hoặc khả năng hài hước, mặc dù một số người dùng có thể không phản đối điều đó). Bard hoàn toàn chưa đáp ứng được kỳ vọng.

Vấn đề cốt lõi nằm ở mô hình nền tảng của trí tuệ nhân tạo, PaLM 2, là nguồn sức mạnh của những khả năng mới của Bard. Giống như tất cả các mô hình ngôn ngữ khác, PaLM 2 là sản phẩm của dữ liệu huấn luyện. Về cơ bản, mô hình tạo ra các đáp ứng dựa trên dữ liệu huấn luyện đã được cung cấp. Theo một báo cáo từ CNBC, PaLM 2 được đào tạo trên khoảng 340 tỷ tham số. Trong khi đó, có tin đồn rằng GPT-4 đã được đào tạo trên một bộ dữ liệu lớn với 1,8 nghìn tỷ tham số. Điều này có nghĩa là GPT-4 có quyền truy cập vào nhiều thông tin và kiến thức hơn so với PaLM 2, Và đương nhiên GPT-4 có thể tạo ra các văn bản có logic chặt chẽ và thú vị hơn.

Chưa đáp ứng kỳ vọng

Tôi đã kiểm tra sức mạnh mới của Bard bằng cách thử nghiệm hàng chục yêu cầu giống những gì được quảng cáo bởi Google trong cuộc ra mắt tuần trước. Ví dụ, tôi đã yêu cầu Bard lấy ra các điểm chính từ một tài liệu trong Docs và tạo một bản tóm tắt email. Bard đã trả lời bằng cách nói “Tôi không có đủ thông tin” và từ chối lấy ra bất kỳ tài liệu nào từ Google Drive của tôi. Sau đó, nó tóm tắt một tài liệu khác một cách kém cỏi và soạn thảo một email không thể sử dụng được cho tôi.

Một ví dụ khác: Tôi đã yêu cầu Bard tìm cho tôi các ưu đãi tốt nhất về vé máy bay từ San Francisco đến Los Angeles trên Google Flights. Cuộc trò chuyện đã đáp lại bằng cách soạn thảo một email giải thích cách tìm kiếm thủ công giá vé máy bay trên Google Flights.

Hiệu suất của Bard cũng thảm họa khi tôi thử sử dụng nó cho các nhiệm vụ sáng tạo, như viết bài hát hoặc kịch bản. Bard hoặc là bỏ qua thông tin tôi cung cấp hoặc tạo ra nội dung nhạt nhẽo và buồn tẻ, thiếu sự sáng tạo hoặc phong cách riêng. Bard cũng thiếu bất kỳ tùy chọn nào để điều chỉnh mức độ sáng tạo của nó, khác với GPT-4, có một bánh điều chỉnh cho phép người dùng điều khiển mức độ mạo hiểm hoặc thận trọng của kết quả đầu ra.

Điểm duy nhất có thể khen ngợi của Bard là nó có một tính năng tích hợp cho phép người dùng kiểm tra lại câu trả lời của nó qua Google Search. Bằng cách nhấp vào nút “Google It” sau một yêu cầu, người dùng có thể xem câu trả lời của Bard so sánh với kết quả từ Google Search. Sau đó, Bard sẽ làm nổi bật các phần của kết quả đầu ra của mình có thể sai lầm hoặc dẫn đến hiểu lầm. Tính năng này hữu ích để giảm thiểu các thông tin sai lệch và lỗi, nhưng cũng làm nổi bật sự không đáng tin cậy và không đáng tin cậy của Bard.

Tại sao điều này quan trọng? Bởi vì Google là một trong những công ty hàng đầu trong lĩnh vực công nghệ và sáng tạo trên toàn thế giới, và nó có ảnh hưởng rất lớn đối với cách mọi người truy cập và sử dụng thông tin. Sản phẩm và dịch vụ của Google được hàng tỷ người sử dụng hàng ngày, và chúng định hình cách chúng ta giao tiếp, học hỏi, làm việc và giải trí. Nếu Google muốn duy trì vị thế dẫn đầu trong lĩnh vực cạnh tranh và duy trì danh tiếng của mình là một người đi đầu trong lĩnh vực Trí tuệ Nhân tạo, họ cần phải làm tốt hơn Bard.

Bard không chỉ là một trợ lý ảo; nó là một phản ánh của tầm nhìn và giá trị của Google. Nó được thiết kế để là một trợ lý có thể giúp người dùng thực hiện các nhiệm vụ khác nhau và tăng cường năng suất và sáng tạo của họ. Nhưng Bard thất bại ở tất cả các khía cạnh này. Nó không hữu ích; nó thường khiến người dùng cảm thấy rất frustrating.

Bard 2.0 đã xuất hiện, nhưng nó còn kém xa. Ít nhất cho đến nay. Có thể mô hình sắp tới của Google, “Gemini,” sẽ là sự khắc phục mà họ đang tìm kiếm. Nhưng cho đến khi đó, tôi khuyên bạn nên dựa vào GPT-4 cho phần lớn các nhiệm vụ làm việc của bạn. GPT-4 của OpenAI có thể không hoàn hảo, nhưng nó vượt xa Bard về chức năng, độ tin cậy, sự sáng tạo và tính cách.

Google Bard không thực hiện được cam kết của mình - ngay cả sau các cập nhật mới nhất. - MyGPT

Chưa đáp ứng kỳ vọng