Tác giả: Antoine Tardif
Ngày 13 tháng 12 năm 2023
Điều chỉnh Prompt (Prompt Tuning) bao gồm việc tạo ra và nhập một đoạn văn bản “prompt” được thiết kế một cách cẩn thận vào một Mô hình Ngôn ngữ Lớn (LLM). Đoạn prompt này cơ bản là hướng dẫn phản ứng của mô hình, đưa nó vào hướng đầu ra mong muốn về phong cách, ngôn ngữ hoặc nội dung. Khác với quá trình đào tạo mô hình truyền thống, yêu cầu việc huấn luyện lại mô hình trên một tập dữ liệu lớn, điều chỉnh prompt chỉ cần một số ví dụ nhỏ hoặc thậm chí chỉ cần một câu được xây dựng cẩn thận để ảnh hưởng đến hành vi của mô hình.
Cách Prompt Tuning Hoạt Động
- Thiết Kế Prompt: Bước này quan trọng và yêu cầu sự hiểu biết về khả năng của mô hình và công việc cụ thể. Prompt nên rõ ràng, ngắn gọn và phù hợp với đầu ra mong muốn.
- Nhập Prompt: Prompt được đưa vào LLM. Mô hình sử dụng nó như một ngữ cảnh hoặc một điểm xuất phát để tạo ra phản ứng của mình.
- Tạo Ra Đầu Ra: Mô hình xử lý prompt và tạo ra một đầu ra điều chỉnh theo hướng dẫn được cung cấp bởi prompt.
Ví dụ về Điều chỉnh Prompt
Bằng cách điều chỉnh prompt ban đầu, đầu ra của mô hình có thể thay đổi đáng kể để phù hợp với nhu cầu hoặc bối cảnh cụ thể. Dưới đây là các ví dụ về prompt ban đầu và phiên bản được tinh chỉnh thông qua điều chỉnh prompt:
Ví dụ 1: Tạo Nội Dung
- Prompt Ban Đầu: “Viết một câu chuyện về một con rồng.”
- Prompt Đã Điều Chỉnh: “Viết một câu chuyện hài hước về một chú rồng thân thiện thích nướng bánh quy và sống trong một khu rừng ma thuật.”
Giải Thích:
Prompt ban đầu mở rộng và có thể dẫn đến nhiều loại câu chuyện về rồng. Tuy nhiên, prompt đã được điều chỉnh xác định được thái độ (hài hước), bản chất của chú rồng (thân thiện và thích nướng bánh quy), và bối cảnh (khu rừng ma thuật), hướng dẫn LLM tạo ra một câu chuyện cụ thể và tinh chỉnh hơn.
Ví dụ 2: Email Chuyên Nghiệp
- Prompt Ban Đầu: “Soạn thảo một email cập nhật dự án.”
- Prompt Đã Điều Chỉnh: “Soạn thảo một email chính thức gửi đến một quản lý cấp cao cung cấp một bản cập nhật ngắn gọn về dự án XYZ, tập trung vào các cột mốc gần đây và các bước tiếp theo.”
Giải Thích:
Trong khi prompt ban đầu khá chung chung, phiên bản đã được điều chỉnh xác định đối tượng (quản lý cấp cao), dự án (XYZ), và nội dung tập trung (các cột mốc gần đây và các bước tiếp theo), đảm bảo một email nhắm mục tiêu và thích hợp hơn cho môi trường doanh nghiệp.
Ví dụ 3: Tài Liệu Giáo Dục
- Prompt Ban Đầu: “Giải thích quá trình quang hợp.”
- Prompt Đã Điều Chỉnh: “Giải thích quá trình quang hợp bằng ngôn ngữ đơn giản cho lớp khoa học lớp 5, bao gồm vai trò của ánh sáng mặt trời, nước và khí carbon dioxide.”
Giải Thích:
Prompt ban đầu có thể dẫn đến nhiều giải thích phù hợp với các cấp độ kiến thức khác nhau. Tuy nhiên, prompt đã được điều chỉnh tinh chỉnh giải thích cho một đối tượng cụ thể (học sinh lớp 5) và nhấn mạnh các yếu tố chính cần bao gồm (ánh sáng mặt trời, nước và khí carbon dioxide), làm cho nó phù hợp hơn cho bối cảnh giáo dục.
Ví dụ 4: Hỗ Trợ Kỹ Thuật
- Prompt Ban Đầu: “Làm thế nào để sửa chữa một router?”
- Prompt Đã Điều Chỉnh: “Cung cấp hướng dẫn từng bước dành cho người mới bắt đầu về cách xử lý và sửa chữa các vấn đề phổ biến với router Wi-Fi gia đình, bao gồm việc khởi động lại router và kiểm tra kết nối cáp.”
Giải Thích:
Prompt ban đầu mở rộng và có thể dẫn đến nhiều giải pháp khác nhau. Prompt đã được điều chỉnh hạn chế phản ứng thành một hướng dẫn từng bước dành cho người mới bắt đầu, tập trung vào các vấn đề phổ biến và các phương pháp xử lý cơ bản, điều này thực tế hơn đối với người dùng không chuyên.
Ví dụ 5: Tạo Công Thức Nấu Ăn
- Prompt Ban Đầu: “Cho tôi một công thức nấu ăn với gà.”
- Prompt Đã Điều Chỉnh: “Cung cấp một công thức nấu ăn gà nướng lành mạnh phù hợp cho chế độ ăn kiêng ket, bao gồm các nguyên liệu như thảo mộc tươi và dầu ô liu, và tránh đường và tinh bột.”
Giải Thích:
Prompt ban đầu có thể dẫn đến bất kỳ loại công thức nào với gà. Prompt đã được điều chỉnh xác định yêu cầu dinh dưỡng (ăn kiêng ket), phương pháp nấu ăn (nướng), và các nguyên liệu ưa thích (thảo mộc tươi, dầu ô liu), đồng thời cũng đề cập đến những thứ cần tránh (đường, tinh bột), dẫn đến một gợi ý công thức cụ thể hơn.
Ví dụ 6: Tư Vấn Du Lịch
- Prompt Ban Đầu: “Đề xuất một điểm đến du lịch.”
- Prompt Đã Điều Chỉnh: “Gợi ý một điểm đến du lịch cho một gia đình có trẻ nhỏ, tập trung vào những nơi có giá trị giáo dục và các hoạt động thích hợp cho trẻ em ở châu Âu.”
Giải Thích:
Prompt đã được điều chỉnh hạn chế tập trung vào những điểm đến thân thiện với gia đình ở châu Âu, với sự tập trung vào các hoạt động giáo dục và thích hợp cho trẻ em, mang lại một gợi ý du lịch được cá nhân hóa hơn cho gia đình có trẻ nhỏ.
Ví dụ 7: Hướng Dẫn Tập Luyện
- Prompt Ban Đầu: “Cho tôi một kế hoạch tập luyện.”
- Prompt Đã Điều Chỉnh: “Thiết kế một kế hoạch tập luyện 30 phút tại nhà dành cho người mới bắt đầu, tập trung vào các bài tập cơ bản không cần dụng cụ để cải thiện sức khỏe tim mạch.”
Giải Thích:
Thay vì một kế hoạch tập luyện chung chung, prompt đã được điều chỉnh chỉ định một kế hoạch 30 phút không cần dụng cụ cho người mới bắt đầu, tập trung vào bài tập cơ bản để cải thiện sức khỏe tim mạch, làm cho nó phù hợp hơn cho những người mới bắt đầu tập luyện hoặc có hạn chế về không gian hoặc dụng cụ.
Ví dụ 8: Học Ngôn Ngữ
- Prompt Ban Đầu: “Dạy tôi tiếng Tây Ban Nha.”
- Prompt Đã Điều Chỉnh: “Cung cấp một bài học cơ bản tiếng Tây Ban Nha dành cho người mới bắt đầu, tập trung vào các từ và câu thông thường cho du khách như lời chào, hỏi đường và đặt món.”
Giải Thích:
Prompt đã được điều chỉnh để hướng dẫn LLM tạo ra một bài học tiếng Tây Ban Nha cấp độ người mới bắt đầu, tập trung vào các cụm từ thực tế liên quan đến lời chào, hỏi đường và đặt món, điều này phù hợp hơn cho người có kế hoạch đi du lịch.
Ví dụ 9: Chuẩn Bị Phỏng Vấn Việc Làm
- Prompt Ban Đầu: “Làm thế nào tôi nên chuẩn bị cho một buổi phỏng vấn việc làm?”
- Prompt Đã Điều Chỉnh: “Phác thảo các chiến lược chính để chuẩn bị cho một buổi phỏng vấn việc làm trong ngành công nghiệp công nghệ, bao gồm mẹo về thảo luận về kỹ năng lập trình và dự án phần mềm đã làm.”
Giải Thích:
Prompt đã được điều chỉnh tập trung vào việc chuẩn bị phỏng vấn cho ngành công nghiệp công nghệ, với sự tập trung cụ thể vào thảo luận về kỹ năng lập trình và kinh nghiệm về dự án phần mềm, do đó mang lại lời khuyên có liên quan hơn cho những chuyên gia công nghệ muốn phát triển sự nghiệp của mình.
Ví dụ 10: Nhận Thức Về Môi Trường
- Prompt Ban Đầu: “Viết về biến đổi khí hậu.”
- Prompt Đã Điều Chỉnh: “Soạn một bài viết thông tin về tác động của biến đổi khí hậu đối với hệ sinh thái đại dương, đặc biệt là tác động lên đời sống biển và rạn san hô.”
Giải Thích:
Thay vì một bài viết tổng quan về biến đổi khí hậu, prompt đã được điều chỉnh yêu cầu một bài viết tập trung vào tác động của nó đối với hệ sinh thái đại dương, đặc biệt là ảnh hưởng đến đời sống biển và rạn san hô, mang lại một góc nhìn chuyên sâu và sáng tạo hơn về chủ đề.
Những Điểm Cần Lưu ý
Những ví dụ này minh họa hiệu quả của việc điều chỉnh prompt trong việc làm cho đầu ra của Mô hình Ngôn ngữ Lớn (LLM) trở nên tinh chỉnh hơn. Bằng cách cung cấp prompt chi tiết và phù hợp ngữ cảnh, các phản ứng có thể được điều chỉnh để đáp ứng các yêu cầu và đối tượng cụ thể, nâng cao tính tiện ích và độ chính xác của nội dung được tạo ra.
Ưu điểm của việc tinh chỉnh Prompt
- Hiệu Quả Tài Nguyên: Loại bỏ nhu cầu sử dụng tài nguyên tính toán lớn thường được yêu cầu cho quá trình đào tạo toàn bộ mô hình.
- Đặc Trưng Nhiệm Vụ: Cho phép tùy chỉnh các LLM tổng quát cho các nhiệm vụ cụ thể mà không cần thay đổi cấu trúc cơ bản của mô hình.
- Tốc Độ: Điều chỉnh prompt có thể được triển khai nhanh chóng, làm cho nó lý tưởng cho các chu kỳ phát triển nhanh chóng.
Ứng Dụng của Việc Điều Chỉnh Prompt
1. Tạo Nội Dung: Sáng Tạo Văn Học, Báo Chí, hoặc Quảng Cáo
- Sáng Tạo Văn Học: Điều chỉnh prompt có thể hướng dẫn trí tuệ nhân tạo tạo ra các câu chuyện, thơ, hoặc kịch bản với các chủ đề, phong cách hoặc phát triển nhân vật cụ thể. Ví dụ, prompts có thể được điều chỉnh để tạo ra một kịch bản hài hước lãng mạn hoặc một cuốn tiểu thuyết fantasy với các yếu tố cốt truyện cụ thể.
- Báo Chí: Trong báo chí, việc điều chỉnh prompt giúp tạo ra các bài viết hoặc báo cáo được tùy chỉnh cho một thể loại tin tức hoặc đối tượng cụ thể. Ví dụ, prompts có thể được thiết kế để tạo ra một bài báo điều tra sâu rộng về vấn đề môi trường hoặc một tóm tắt tin tức ngắn gọn cho một buổi thông báo cộng đồng địa phương.
- Quảng Cáo: Đối với quảng cáo, việc điều chỉnh prompt có thể tạo ra bản quảng cáo hướng đến một đối tượng cụ thể hoặc phù hợp với giọng điệu của một thương hiệu. Người quảng cáo có thể điều chỉnh prompt để tạo nội dung quảng cáo dành cho một chiến dịch quảng cáo sản phẩm trẻ trung, năng động hoặc một chiến dịch quảng cáo thương hiệu sang trọng, tinh tế.
2. Dịch Vụ Khách Hàng: Chatbot Trong Các Ngành Cụ Thể:
- Các Truy vấn Cụ Thể cho Ngành Cụ Thể: Việc điều chỉnh prompt có thể giúp chatbot hiểu và phản ứng đối với các truy vấn cụ thể cho các ngành công nghiệp như tài chính, chăm sóc sức khỏe, hoặc du lịch. Ví dụ, một chatbot cho ngân hàng có thể được điều chỉnh để hỗ trợ với các yêu cầu tài khoản, trong khi một chatbot cho chăm sóc sức khỏe có thể tập trung vào việc đặt lịch hẹn và câu hỏi sức khỏe chung.
- Tone và Thương Hiệu: Không chỉ có kiến thức ngành nghề, việc điều chỉnh prompt có thể điều chỉnh cách chatbot phản ứng để phù hợp với phong cách thương hiệu của công ty – có thể là chuyên nghiệp và chính thức cho dịch vụ pháp lý hoặc thân thiện và thoải mái cho một doanh nghiệp bán lẻ.
3. Dịch Ngôn Ngữ: Sự Tinh Tế Văn Hóa và Thuật Ngữ Cụ Thể Ngành Nghề
- Nhạy Bén Văn Hóa: Việc điều chỉnh prompt có thể giúp mô hình dịch xem xét các sự tinh tế văn hóa, thành ngữ và biểu hiện địa phương, đảm bảo rằng bản dịch không chỉ ngôn ngữ chính xác mà còn phù hợp văn hóa.
- Chính Xác Kỹ Thuật: Trong các lĩnh vực như pháp luật, y học hoặc kỹ thuật, việc điều chỉnh prompt có thể đảm bảo rằng các bản dịch phản ánh chính xác các thuật ngữ cụ thể của ngành nghề, quan trọng cho các tài liệu kỹ thuật hoặc giao tiếp chuyên nghiệp.
4. Công Cụ Giáo Dục: Các Phương Tiện Học Phù Hợp với Chương Trình Học hoặc Phong Cách Giảng Dạy
- Học theo Chương Trình: Việc điều chỉnh prompt có thể tạo ra nội dung giáo dục phù hợp với các chương trình học cụ thể, như tạo các bài toán thực hành cho một khóa đại số trung học hoặc câu hỏi thảo luận cho một khóa lịch sử cấp đại học.
- Phong Cách Học Thích Ứng: Các phong cách giảng dạy khác nhau có thể được tích hợp thông qua việc điều chỉnh prompt, cho dù đó là việc tạo ra các câu hỏi tương tác, thám hiểm cho việc học dựa trên sự điều tra, hoặc giải thích chi tiết cho một phương pháp giảng dạy truyền thống hơn.
Thay lời kết
Mặc dù việc điều chỉnh prompt là mạnh mẽ, nhưng không phải không có thách thức. Việc tạo ra các prompt hiệu quả đòi hỏi kỹ năng và sự hiểu biết về cách mô hình hoạt động. Ngoài ra, còn có rủi ro mô hình tạo ra nội dung có độ chệch hoặc không mong muốn, tùy thuộc vào tính chất của prompt.
Việc điều chỉnh prompt tăng cường tính linh hoạt của các mô hình trí tuệ nhân tạo, giúp chúng tạo ra nội dung không chỉ phù hợp ngữ cảnh mà còn phù hợp với các nhu cầu và sở thích cụ thể của người dùng trên nhiều lĩnh vực. Khả năng tùy chỉnh này quan trọng trong các lĩnh vực nơi độ chính xác của thông tin và sự tinh tế trong cách trình bày đều quan trọng, làm cho các công cụ trí tuệ nhân tạo trở nên hiệu quả và thân thiện với người dùng.