Nhắc theo chuỗi suy nghĩ

Nhắc theo chuỗi suy nghĩ (CoT) cho phép khả năng suy luận phức tạp hơn thông qua các bước suy luận trung gian. Bạn có thể kết hợp nó với lời nhắc few-shot để có kết quả tốt hơn đối với các nhiệm vụ phức tạp hơn đòi hỏi phải suy luận trước khi phản hồi.

Dưới đây là một ví dụ về việc suy luận (bóp méo sự thật) thông qua chuỗi suy nghĩ:

The odd numbers in this group add up to an even number: 4, 8, 9, 15, 12, 2, 1.
A: Adding all the odd numbers (9, 15, 1) gives 25. The answer is False.
The odd numbers in this group add up to an even number: 17,  10, 19, 4, 8, 12, 24.
A: Adding all the odd numbers (17, 19) gives 36. The answer is True.
The odd numbers in this group add up to an even number: 16,  11, 14, 4, 8, 13, 24.
A: Adding all the odd numbers (11, 13) gives 24. The answer is True.
The odd numbers in this group add up to an even number: 17,  9, 10, 12, 13, 4, 2.
A: Adding all the odd numbers (17, 9, 13) gives 39. The answer is False.
The odd numbers in this group add up to an even number: 15, 32, 5, 13, 82, 7, 1. 
A:

Đầu ra:

Adding all the odd numbers (15, 5, 13, 7, 1) gives 41. The answer is False.

Ồ! Chúng ta có thể thấy một kết quả hoàn hảo khi chúng ta cung cấp bước suy luận. Trên thực tế, chúng ta có thể giải quyết nhiệm vụ này bằng cách cung cấp ít ví dụ hơn, tức là chỉ một ví dụ có vẻ đủ:

Lời nhắc:

The odd numbers in this group add up to an even number: 4, 8, 9, 15, 12, 2, 1.
A: Adding all the odd numbers (9, 15, 1) gives 25. The answer is False.
The odd numbers in this group add up to an even number: 15, 32, 5, 13, 82, 7, 1. 
A:

Đầu ra:

Adding all the odd numbers (15, 5, 13, 7, 1) gives 41. The answer is False.

Hãy nhớ rằng các tác giả cho rằng đây là một khả năng mới xuất hiện khi có các mô hình ngôn ngữ đủ lớn.

Nhắc nhở COT zero-shot

Một ý tưởng gần đây xuất hiện gần đây hơn là ý tưởng về CoT zero-shot (Kojima và cộng sự 2022) về cơ bản liên quan đến việc thêm “Hãy suy nghĩ từng bước” vào lời nhắc ban đầu. Hãy thử một vấn đề đơn giản và xem mô hình hoạt động như thế nào:

Lời nhắc:

I went to the market and bought 10 apples. I gave 2 apples to the neighbor and 2 to the repairman. I then went and bought 5 more apples and ate 1. How many apples did I remain with?

Đầu ra:

11 apples

Câu trả lời là sai! Bây giờ hãy thử với lời nhắc đặc biệt.

Lời nhắc:

I went to the market and bought 10 apples. I gave 2 apples to the neighbor and 2 to the repairman. I then went and bought 5 more apples and ate 1. How many apples did I remain with?Let's think step by step.

Đầu ra:

First, you started with 10 apples.You gave away 2 apples to the neighbor and 2 to the repairman, so you had 6 apples left.Then you bought 5 more apples, so now you had 11 apples.Finally, you ate 1 apple, so you would remain with 10 apples.

Thật ấn tượng khi lời nhắc đơn giản này lại có hiệu quả trong nhiệm vụ này. Điều này đặc biệt hữu ích khi bạn không có quá nhiều ví dụ để sử dụng trong lời nhắc.

Chuỗi suy nghĩ tự động (Auto-CoT)

Khi áp dụng phương pháp nhắc nhở theo chuỗi suy nghĩ bằng các trình diễn, quá trình này bao gồm việc tạo ra các ví dụ đa dạng và hiệu quả. Tuy nhiên những nỗ lực thủ công này có thể dẫn đến các giải pháp dưới mức tối ưu. 

Zhang và cộng sự. (2022) đề xuất một cách tiếp cận nhằm loại bỏ những nỗ lực thủ công bằng cách tận dụng LLM với lời nhắc “Hãy suy nghĩ từng bước” để tạo ra các chuỗi lý luận cho từng cuộc trình diễn một. Quá trình tự động này vẫn có thể mắc lỗi trong chuỗi được tạo. Để giảm thiểu tác động của những sai lầm, sự đa dạng của các cuộc biểu tình rất quan trọng. Công việc này đề xuất Auto-CoT, lấy mẫu các câu hỏi một cách đa dạng và tạo ra các chuỗi lý luận để xây dựng các minh chứng.

Auto-CoT bao gồm hai giai đoạn chính:

  • Giai đoạn 1): phân cụm câu hỏi: phân chia các câu hỏi của một tập dữ liệu nhất định thành một vài cụm
  • Giai đoạn 2): lấy mẫu trình diễn: chọn một câu hỏi đại diện từ mỗi cụm và tạo chuỗi lý luận bằng cách sử dụng Zero-Shot-CoT với phương pháp phỏng đoán đơn giản

Phương pháp phỏng đoán đơn giản có thể là độ dài của câu hỏi (ví dụ: 60 mã thông báo) và số bước trong cơ sở lý luận (ví dụ: 5 bước lý luận). Điều này khuyến khích mô hình sử dụng các minh họa đơn giản và chính xác.

Quá trình này được minh họa dưới đây:

Bạn có thể tìm thấy mã nguồn về phương pháp Auto-CoT tại đây: mã nguồn