Các công cụ như OpenAI Embeddings API đang thay đổi cách thức tìm kiếm được thực hiện. Thay vì khớp từ khóa, một mô hình ngôn ngữ chuyển đổi văn bản thành các vector. Những vector này biểu diễn văn bản bằng cách sử dụng hàng trăm hoặc thậm chí hàng nghìn chiều toán học. Nhờ vậy, khi tìm kiếm, các kết quả có thể được tạo ra dựa trên ý định cơ bản của truy vấn thay vì chỉ dựa trên từ khóa.
Đây chính là phương pháp tìm kiếm mà các tác giả của bài viết “Precise Zero-Shot Dense Retrieval without Relevance Labels” đã cố gắng cải thiện thông qua quy trình của họ được gọi là Hypothetical Document Embeddings (HyDE).
Giả định của HyDE là tìm kiếm tài liệu sẽ đem lại kết quả tốt hơn bằng cách sử dụng các câu trả lời giả thay vì chỉ dựa trên chính nội dung câu hỏi.
Phương thức hoạt động của HyDE
Làm thế nào một LLM đặt câu hỏi cho một cơ sở dữ liệu? Quy trình điển hình là sử dụng một LLM khác để mã hóa câu hỏi thành một biểu diễn vector và sử dụng vector này để truy vấn một cơ sở dữ liệu vector. Bằng cách tìm các vector “tương tự” trong cơ sở dữ liệu đó, chúng ta giả định rằng các tài liệu liên quan nên chứa câu trả lời cho câu hỏi gốc. Bằng cách đưa những tài liệu đó vào một đoạn văn bản kích thích, chúng ta hy vọng rằng LLM sẽ có đủ ngữ cảnh để trả lời câu hỏi đó.
Quy trình này được gọi là “Retrieval Augmented Generation” (RAG), và nó mắc phải một vấn đề đơn giản: không có lý do gì cho việc một câu hỏi phải tương tự về mặt ngữ nghĩa với câu trả lời của nó. RAG có thể dẫn đến việc nhiều tài liệu không liên quan được cung cấp cho LLM mà không được cung cấp ngữ cảnh thích hợp để trả lời câu hỏi.
Một giải pháp cho vấn đề này là sử dụng kỹ thuật Hypothetical Document Embeddings (HyDE). Ý tưởng là sử dụng LLM để tạo ra một câu trả lời giả định, nhúng câu trả lời đó và sử dụng việc nhúng này để truy vấn cơ sở dữ liệu vector. Câu trả lời giả định sẽ sai, nhưng nó có nhiều khả năng tương tự về mặt ngữ nghĩa với câu trả lời đúng.
Phương pháp HyDE là một cách để tìm thông tin trong một tập hợp lớn tài liệu bằng cách sử dụng trí tuệ nhân tạo. Phương pháp bắt đầu bằng việc sử dụng Mô hình Ngôn ngữ Lớn (LLM), như ChatGPT, để tạo ra một tài liệu giả định dựa trên câu hỏi hoặc một chủ đề cụ thể. Tài liệu này có thể chứa một số thông tin sai, nhưng nó cũng chứa các mẫu liên quan có thể được sử dụng để tìm các tài liệu tương tự trong một cơ sở kiến thức đáng tin cậy.
Tiếp theo, một mô hình trí tuệ nhân tạo khác được sử dụng để chuyển tài liệu được tạo ra thành một vector nhúng, sau đó được sử dụng để tìm các tài liệu khác tương tự với tài liệu được tạo ra bởi mô hình trí tuệ nhân tạo.
Có những lợi ích gì?
HyDE có thể cho phép các mô hình ngôn ngữ được sử dụng trong các ứng dụng nhạy cảm hơn vì kết quả tìm kiếm được trả về trực tiếp từ một nguồn tin cậy. Quy trình này ngăn chặn việc “sự gian dối” bởi LLM từ việc trả về cho người dùng. Điều này có thể hữu ích trong các trường hợp cần đo lường chính xác hoặc câu trả lời sai có thể dẫn đến hậu quả khủng khiếp, như trong lĩnh vực y học.
Tìm kiếm tài liệu nội bộ một cách hiệu quả hơn có thể tiết kiệm hàng ngàn giờ đồng hồ và tối ưu hóa năng suất làm việc. Bài viết về HyDE tập trung vào việc tạo ra các câu trả lời giả đối với các câu hỏi bằng cách sử dụng LLM. Tuy nhiên, có thể dễ dàng tưởng tượng việc sử dụng LLM để bổ sung nội dung không đầy đủ tương tự để tìm tài liệu liên quan trong các ứng dụng ngoài tìm kiếm, như viết nội dung hoặc lập trình.
Ngoài ra, kết quả tìm kiếm không cần phải là điểm dừng. Ví dụ, tìm kiếm này có thể được sử dụng ẩn sau hậu trường để kích hoạt giao diện trò chuyện, giống như ChatGPT, mà sử dụng toàn bộ ngữ cảnh của cơ sở kiến thức của bạn trong các câu trả lời mà không cần điều chỉnh tinh chỉnh hoặc vượt quá giới hạn mã thông báo!
Và còn gì nữa?
Tất cả các mô hình ngôn ngữ cần thiết để xây dựng một hệ thống tìm kiếm HyDE có thể được tìm thấy tại OpenAI.
Bạn cần sự hỗ trợ để mở khả năng tối đa của HyDE và các công nghệ trí tuệ nhân tạo tiên tiến khác không?
Hãy hiểu rõ rằng công nghệ trí tuệ nhân tạo nào có thể là một đòn bẩy lớn nhất cho doanh nghiệp của bạn – Hãy lên lịch hẹn với myGPT để nhận tư vấn ngay hôm nay nhé!