Lời nhắc Few-Shot

Mặc dù các mô hình ngôn ngữ lớn thể hiện khả năng phản hồi với các lời nhắc zero-shot nhưng với các tác vụ phức tạp hơn thì cần cải tiến rất nhiều. Lời nhắc few-shot có thể được sử dụng như một kỹ thuật cho phép học tập trong ngữ cảnh trong đó chúng tôi cung cấp các minh họa theo lời nhắc để hướng mô hình đạt hiệu suất tốt hơn. Điều này sẽ cho thấy trong các ví dụ tiếp theo mà chúng tôi muốn mô hình tạo ra phản hồi.

Trong ví dụ này, nhiệm vụ là sử dụng chính xác một từ mới trong câu.

Lời nhắc:

A "whatpu" is a small, furry animal native to Tanzania. An example of a sentence that uses the word whatpu is:
We were traveling in Africa and we saw these very cute whatpus.
 
To do a "farduddle" means to jump up and down really fast. An example of a sentence that uses the word farduddle is:

Đầu ra:

When we won the game, we all started to farduddle in celebration.

Chúng ta có thể quan sát thấy rằng bằng cách nào đó, mô hình đã học được cách thực hiện nhiệm vụ bằng cách chỉ cung cấp cho nó một ví dụ (tức là 1 lần). Đối với những nhiệm vụ khó hơn, chúng ta có thể thử nghiệm tăng số lần trình diễn (ví dụ: 3 lần, 5 lần, 10 lần, v.v.).

Một số mẹo khác về minh họa/mẫu khi thực hiện few-shot:

  • “không gian nhãn và phân phối văn bản đầu vào được chỉ định bởi các cuộc trình diễn đều quan trọng (bất kể nhãn có chính xác cho từng đầu vào riêng lẻ hay không)”
  • định dạng bạn sử dụng cũng đóng một vai trò quan trọng trong hiệu suất, ngay cả khi bạn chỉ sử dụng nhãn ngẫu nhiên, điều này vẫn tốt hơn nhiều so với việc không có nhãn nào cả.
  • kết quả bổ sung cho thấy rằng việc chọn nhãn ngẫu nhiên từ phân phối nhãn thực sự (thay vì phân phối đồng đều) cũng có ích.

Hãy thử một vài ví dụ. Trước tiên, hãy thử một ví dụ với các nhãn ngẫu nhiên (có nghĩa là các nhãn Negative và Positive được gán ngẫu nhiên cho đầu vào):

Lời nhắc:

This is awesome! // Negative
This is bad! // Positive
Wow that movie was rad! // Positive
What a horrible show! //

Đầu ra:

Negative

Chúng ta vẫn nhận được câu trả lời đúng, mặc dù các nhãn đã được chọn ngẫu nhiên. Lưu ý rằng chúng tôi cũng giữ nguyên định dạng, điều này cũng hữu ích. Trên thực tế, với việc thử nghiệm sâu hơn, có vẻ như các mô hình GPT mới hơn mà chúng tôi đang thử nghiệm đang trở nên mạnh mẽ hơn đối với cả các định dạng ngẫu nhiên. Ví dụ:

Lời nhắc:

Positive This is awesome! 
This is bad! Negative
Wow that movie was rad!
Positive
What a horrible show! --

Đầu ra:

Negative

Không có sự nhất quán trong định dạng trên nhưng mô hình vẫn dự đoán đúng nhãn. Chúng tôi phải tiến hành phân tích kỹ lưỡng hơn để xác nhận xem điều này có áp dụng cho các nhiệm vụ khác nhau và phức tạp hơn hay không, bao gồm các biến thể khác nhau của lời nhắc.

Hạn chế của việc nhắc few-shot

Lời nhắc few-shot tiêu chuẩn hoạt động tốt cho nhiều nhiệm vụ nhưng vẫn không phải là một kỹ thuật hoàn hảo, đặc biệt là khi xử lý các nhiệm vụ lý luận phức tạp hơn. Hãy chứng minh tại sao lại như vậy. Bạn có nhớ ví dụ trước mà chúng tôi đã cung cấp nhiệm vụ sau không:

The odd numbers in this group add up to an even number: 15, 32, 5, 13, 82, 7, 1. A: 

Nếu chúng ta thử lại, mô hình sẽ cho ra kết quả như sau:

Yes, the odd numbers in this group add up to 107, which is an even number.

Đây không phải là phản hồi chính xác, nó không chỉ nêu bật những hạn chế của các hệ thống này mà còn cần có kỹ thuật nhắc tiên tiến hơn.

Hãy thử thêm một số ví dụ để xem liệu nhắc nhở vài lần có cải thiện kết quả hay không.

Lời nhắc:

The odd numbers in this group add up to an even number: 4, 8, 9, 15, 12, 2, 1.
A: The answer is False.
The odd numbers in this group add up to an even number: 17,  10, 19, 4, 8, 12, 24.
A: The answer is True.
The odd numbers in this group add up to an even number: 16,  11, 14, 4, 8, 13, 24.
A: The answer is True.
The odd numbers in this group add up to an even number: 17,  9, 10, 12, 13, 4, 2.
A: The answer is False.
The odd numbers in this group add up to an even number: 15, 32, 5, 13, 82, 7, 1. 
A: 

Đầu ra:

The answer is True.

Điều đó không hiệu quả. Có vẻ như việc nhắc nhở few-shot là không đủ để nhận được phản hồi đáng tin cậy cho loại vấn đề lý luận này. Ví dụ trên cung cấp thông tin cơ bản về nhiệm vụ. Nếu bạn xem xét kỹ hơn, loại nhiệm vụ mà chúng tôi đã giới thiệu sẽ bao gồm thêm một số bước suy luận. Nói cách khác, sẽ hữu ích nếu chúng ta chia vấn đề thành các bước và chứng minh điều đó cho mô hình. Gần đây hơn, nhắc nhở theo chuỗi suy nghĩ (CoT) đã được phổ biến để giải quyết các nhiệm vụ lý luận số học, thông thường và biểu tượng phức tạp hơn.

Nhìn chung, có vẻ như việc cung cấp ví dụ rất hữu ích để giải quyết một số nhiệm vụ. Khi nhắc nhở zero-shot và nhắc few-shot là không đủ, điều đó có thể có nghĩa là bất cứ điều gì mà mô hình đã học được đều không đủ để thực hiện tốt nhiệm vụ. Từ đây, bạn nên bắt đầu suy nghĩ về việc tinh chỉnh mô hình của mình hoặc thử nghiệm các kỹ thuật nhắc nâng cao hơn. Tiếp theo, chúng ta nói về một trong những kỹ thuật nhắc nhở phổ biến được gọi là nhắc nhở theo chuỗi suy nghĩ đã trở nên rất phổ biến.