Đó không phải là nhiệt độ vật lý!
Tác giả: Mohit Pandey
Khi chúng ta nói về Trí tuệ Nhân tạo (AI), sự giao nhau giữa yếu tố “nhiệt” và các Mô hình Ngôn ngữ Lớn (LLM) rất khó nhận ra ngay từ đầu. Nhìn chung, các mô hình LLM như ChatGPT hoặc Bard hay các phiên bản kế nhiệm của chúng là các thuật toán phức tạp được thiết kế để tạo ra văn bản, trong khi nhiệt độ là một thuật ngữ chúng ta thường liên kết với nhiệt động học. Tuy nhiên, trong bối cảnh của các LLM, nhiệt độ đóng một vai trò quan trọng trong việc điều chỉnh hành vi của các mô hình này.
Nhiệt độ, trong ngữ cảnh của các LLM, là một siêu tham số được sử dụng để điều chỉnh sự ngẫu nhiên và sự sáng tạo của văn bản được tạo ra. Đó là một khái niệm được mượn từ vật lý thống kê và được tích hợp vào hoạt động của các LLM như GPT. Tham số này cho phép người dùng điều chỉnh sự cân bằng giữa sự sáng tạo và tính nhất quán khi tạo ra văn bản.
Nhiệt độ cao đưa vào sẽ tạo ra sự ngẫu nhiên nhiều hơn, dẫn đến sự sáng tạo nhưng có thể gây ra đầu ra ít nhất quán hơn. Trái lại, nhiệt độ thấp sẽ tạo ra các phản ứng xác định hơn và tập trung hơn, nhấn mạnh tính nhất quán hơn là sự sáng tạo.
Các mô hình “nhiệt cao” và “nhiệt thấp”
Hãy tưởng tượng việc sử dụng cài đặt nhiệt độ cao cho một mô hình Trí tuệ Nhân tạo để tạo ra câu trả lời cho một tình huống hư cấu: “Hãy mô tả một ngày trong cuộc sống của một con bạch tuộc thông minh.”
Với nhiệt độ được thiết lập ở mức cao, trí tuệ nhân tạo có thể tạo ra một câu trả lời như sau:
“Trong một thế giới mà các sinh vật dưới nước đạt được sức mạnh của trí tuệ con người, Octavia con bạch tuộc dành ngày tháng của mình tham gia vào các cuộc tranh luận triết học với các cư dân biển đồng hương, suy tư về những bí ẩn của đại dương.”
Ở đây, nhiệt độ cao cho phép tạo ra một câu chuyện tưởng tượng, với con bạch tuộc có một cấp độ trí tuệ giống con người.
Bây giờ, hãy chuyển sang cài đặt nhiệt độ thấp và xem xét lại cùng một tình huống. Với nhiệt độ được giảm xuống, trí tuệ nhân tạo sẽ tạo ra một câu trả lời chặt chẽ hơn:
“Octavia, con bạch tuộc thông minh, thịnh vượng trong môi trường sống dưới nước của mình. Cô ấy truyền đạt với độ chính xác, sử dụng một hệ thống phức tạp của tín hiệu để phối hợp săn mồi và điều hướng.”
Trong trường hợp này, đầu ra tập trung và hợp lý hơn, nhấn mạnh tính nhất quán của câu chuyện và hành vi tự nhiên của con bạch tuộc.
Cần lưu ý rằng việc điều chỉnh nhiệt độ không thay đổi các tham số của mô hình gốc. Như OpenAI giải thích, “Nhiệt độ là một độ đo của việc mô hình xuất ra một ký tự ít có khả năng xảy ra hơn. Càng cao nhiệt độ, đầu ra càng ngẫu nhiên (và thường là sáng tạo). Tuy nhiên, điều này không đồng nghĩa với “sự chính xác”. Đối với hầu hết các trường hợp sử dụng dựa trên sự thật như trích xuất dữ liệu và câu hỏi và trả lời chính xác, nhiệt độ là 0 là tốt nhất.”
Nhiệt độ chỉ đơn giản là mang lại sự kiểm soát cho người dùng về tính sáng tạo và tính cứng đầu của đầu ra của mô hình, điều này có thể lý tưởng cho nhiều trường hợp sử dụng khác nhau.
Làm cách nào để điều chỉnh nhiệt độ trên ChatGPT
Rõ ràng thấy “đặt nhiệt độ” cho một chatbot có thể thực sự hữu ích cho bất kỳ ai sử dụng nó. Bằng cách điều chỉnh nhiệt độ, mô hình có thể phục vụ cho nhu cầu cụ thể của chúng ta. Làm thế nào để làm điều này? Khi nói đến ChatGPT, công việc này thật ra khá đơn giản.
Ngay sau khi bạn đưa ra một gợi ý trên ChatGPT và thêm “đặt nhiệt độ thành 0.1” để có một câu trả lời trực tiếp, ít sáng tạo hơn và dự kiến. Hoặc viết, “đặt nhiệt độ thành 0.8” để có một câu trả lời sáng tạo hơn.
Các cài đặt nhiệt độ có phạm vi từ 0 đến 1, và tìm kiếm sự cân bằng phù hợp là điều quan trọng. Đối với các câu trả lời trực tiếp, chỉ cần nhập 0. Hoặc nếu bạn muốn sáng tạo hơn một chút, bạn có thể đặt nhiệt độ lên 1 và thậm chí còn cao hơn.
Điều này đặt ra câu hỏi – nếu ai đó muốn ngăn mô hình Trí tuệ Nhân tạo (AI) sản sinh ra các câu trả lời sai lầm, liệu nhiệt độ có nên luôn được đặt là 0 không? Tuy nhiên, một người dùng trên Reddit giải thích rằng điều này phụ thuộc vào dữ liệu huấn luyện của mô hình và mô hình không hoàn toàn trở nên xác định ngay cả khi người dùng đặt nhiệt độ là 0.
Tương tự, Bard cũng cho phép người dùng đặt nhiệt độ trong khoảng từ 0 đến 2. Khác với ChatGPT, nhiệt độ của Bard cũng ảnh hưởng đến mức độ chi tiết của câu trả lời của nó. Lời mời như sau, “bạn cũng có thể sử dụng cài đặt nhiệt độ để kiểm soát độ dài của văn bản mà tôi tạo ra. Ví dụ, nếu bạn đặt nhiệt độ là 0.1, tôi sẽ tạo ra một câu trả lời ngắn gọn và súc tích. Nếu bạn đặt nhiệt độ là 2, tôi sẽ tạo ra một câu trả lời dài hơn và chi tiết hơn.”
Liệu ChatGPT có thể tự thay đổi nhiệt độ của mình không?
Nếu như ChatGPT tự mở nút điều chỉnh nhiệt độ và tạo ra sự hỗn loạn gây ảo giác, thì sao? Dường như trong những lúc mô hình bắt đầu có triệu chứng ảo giác, điều gần như chắc chắn là nó đã tự ý quyết định vặn nút điều chỉnh nhiệt độ.
Khi được hỏi, ChatGPT đã đảm bảo rằng không phải là tác nhân chủ chốt đằng sau nút điều chỉnh này và cho rằng thiếu tính tự nhận thức để tự mình điều chỉnh tham số nhiệt. Và sau rốt, giải pháp ChatGPT đưa ra là: “Người dùng có thể chỉ định nhiệt độ mà họ muốn khi tương tác với tôi, nhưng tôi không tự động thay đổi cài đặt này. Việc điều chỉnh nhiệt độ để đạt được phong cách phản ứng mong muốn là trách nhiệm của người dùng.”
Cuối cùng, thiết lập nhiệt độ cũng chưa phải là câu trả lời hiệu quả cho việc ngăn ngừa ChatGPT tạo ra các phản ứng chứa đầy ảo giác.
Mohit đi sâu vào thế giới Trí tuệ Nhân tạo để trình bày thông tin một cách đơn giản, dễ hiểu và đôi khi còn mang tính hài hước. Anh ấy cũng có sở thích đặc biệt trong lĩnh vực nhiếp ảnh, làm phim và ngành công nghiệp trò chơi.