GPT-3.5 Turbo được thiết kế chủ yếu để trò chuyện hoặc tham gia vào cuộc trò chuyện, bắt chước những phản ứng giống con người. Trong khi đó, “hướng dẫn” là một công cụ linh hoạt hơn có thể được sử dụng không chỉ cho cuộc trò chuyện mà còn để hoàn thành các nhiệm vụ hoặc câu hỏi khác nhau.
Tác giả: K L Krithika
OpenAI đã mở một cách im lặng “gpt-3.5-turbo-instruct,” một mô hình ngôn ngữ hướng dẫn mới được thiết kế để cung cấp các hướng dẫn cụ thể một cách hiệu quả, tương tự như GPT-3.5 Turbo tập trung vào cuộc trò chuyện.
Mô hình mới này sẽ thay thế các mô hình Instruct hiện có và một số mô hình dựa trên văn bản cụ thể. Nó duy trì cùng mức giá và hiệu suất như các mô hình GPT-3.5 khác trong một cửa sổ ngữ cảnh 4K, sử dụng dữ liệu huấn luyện đến tháng 9 năm 2021.
So sánh với GPT-3.5, gpt-3.5-turbo-instruct không phải là một mô hình trò chuyện. Thay vào đó, nó xuất sắc trong việc trả lời trực tiếp các câu hỏi và hoàn thành nhiệm vụ văn bản một cách nhanh chóng, phù hợp với mục đích của nó là tuân theo hướng dẫn một cách hiệu quả.
OpenAI nhấn mạnh rằng GPT-4 vượt trội hơn so với GPT-3.5 trong việc hiểu được các hướng dẫn phức tạp, tạo ra đầu ra chất lượng cao hơn và làm việc đó một cách nhanh chóng và tiết kiệm chi phí hơn.
Các mô hình Instruct, bao gồm cả phiên bản mới này, là nền tảng quan trọng cho những bước đột phá thấy trong ChatGPT, dựa trên sự hoàn thiện liên tục thông qua phản hồi từ con người trong quá trình và sau quá trình tiền huấn luyện. Những mô hình này nổi tiếng vì khả năng hiểu và đáp ứng tốt hơn các câu hỏi của con người với ít lỗi và nội dung gây hại hơn, khiến chúng trở nên ưa chuộng ngay cả khi có số lượng tham số ít hơn đáng kể so với các mô hình GPT thông thường.
Vào tháng 1, OpenAI đã phát hành các mô hình Instruct GPT với mục tiêu làm giảm hiện tượng mê tưởng và thuyết phục mô hình tạo ra các phản ứng “đúng sự thật” hơn và ít độc hại hơn. GPT-3 đã làm điều này vì họ đã giải thích rằng “nó được huấn luyện để dự đoán từ tiếp theo trên một bộ dữ liệu lớn về văn bản trên Internet, thay vì thực hiện một nhiệm vụ ngôn ngữ an toàn mà người dùng muốn.” Mô hình này không phù hợp với người dùng và thường tạo ra các sự thật giả mạo, điều này đã được InstructGPT khắc phục.
Sự khác biệt chính giữa bản cập nhật mới và phiên bản cũ là GPT 3.5 Turbo, thay vì trò chuyện, sẽ ‘hướng dẫn’ một cách tập trung vào nhiệm vụ cần giải quyết. Mô hình này sẽ không “nói quá nhiều” và sẽ tuân theo hướng dẫn mà không cần các kỹ thuật hỗ trợ bổ sung.
K L Krithika là một nhà báo công nghệ tại AIM. Ngoài việc viết tin tức công nghệ, cô ấy thích đọc tiểu thuyết khoa học viễn tưởng và suy tư về những công nghệ không thể có trong thực tế, trong khi cố gắng không làm rối lẫn nó với những bước tiến công nghệ đạt được trong cuộc sống thực.