Bởi Jose Antonio Lanz
Công ty OpenAI vừa công bố cho biết thông qua việc huấn luyện thích hợp, phiên bản GPT-3.5 được fine-tuning có thể vượt trội hơn GPT-4 trong một số nhiệm vụ cụ thể.
OpenAI đang tiếp tục phát triển mạnh mẽ, liên tục công bố những nâng cấp cho hai mô hình trí tuệ nhân tạo nổi bật nhất của họ mà người dùng có thể tùy chỉnh.
Tháng trước, công ty đã tiết lộ người dùng ChatGPT hiện có thể cung cấp “hướng dẫn tùy chỉnh” để cá nhân hóa phản hồi của chatbot. Bây giờ, OpenAI đã thông báo rằng việc fine-tuning (điều chỉnh tinh chỉnh) đã có sẵn cho GPT-3.5 Turbo, cho phép các nhà phát triển trí tuệ nhân tạo đạt được hiệu suất cải thiện trên các nhiệm vụ chuyên biệt thông qua dữ liệu chuyên dụng.
Những cải tiến này có thể giúp công ty duy trì vị thế dẫn đầu so với các đối thủ có nguồn tài trợ lớn như Google với Bard hoặc Anthropic với Claude.
“Chúng tôi vừa mới ra mắt tính năng fine-tuning cho GPT-3.5 Turbo,” OpenAI thông báo trên Twitter. “Fine-tuning cho phép bạn huấn luyện mô hình trên dữ liệu của công ty và triển khai ở quy mô lớn.”
“Những thử nghiệm ban đầu đã cho thấy rằng GPT-3.5 Turbo đã được điều chỉnh tinh chỉnh có thể phù hợp hoặc vượt trội so với GPT-4 trên các nhiệm vụ hẹp,” thêm vào đó.
OpenAI đã giải thích rằng thông qua việc fine-tuning, các nhà phát triển có thể tạo hình trực tiếp các kỹ năng của GPT-3.5 Turbo để phù hợp với nhu cầu của họ. Ví dụ, một nhà phát triển có thể điều chỉnh tinh chỉnh GPT-3.5 Turbo để tạo mã tùy chỉnh hoặc tóm tắt các tài liệu pháp lý bằng tiếng Đức hoàn hảo sau khi cung cấp cho nó một tập dữ liệu hiện có từ khắp doanh nghiệp của khách hàng.
Khả năng này đặc biệt có giá trị đối với các doanh nghiệp và nhà phát triển đang xây dựng trải nghiệm người dùng được tùy chỉnh. Ví dụ, các công ty có thể điều chỉnh tinh chỉnh mô hình để phù hợp với giọng điệu thương hiệu của họ, đảm bảo rằng chatbot có một cá nhân và tông điệu phù hợp.
Sức mạnh của việc tùy chỉnh cũng được thể hiện trong cộng đồng phát triển Stable Diffusion. Các mô hình SD v1.5 đã được điều chỉnh tinh chỉnh đạt được một mức chất lượng vượt trội hơn so với mô hình gốc, mô hình v2.1 có khả năng cao hơn, và thậm chí có thể được so sánh tốt với SDXL cao cấp vừa được ra mắt gần đây.
Hơn nữa, lợi ích từ việc fine-tuning mở rộng đến việc cải thiện khả năng điều khiển, định dạng đầu ra nhất quán và giảm kích thước prompt, OpenAI cho biết, dẫn đến thời gian đáp ứng API nhanh hơn và giảm chi phí. Ví dụ, các prompt có thể thu nhỏ lên đến 90%, giúp tăng tốc quy trình công việc và giảm chi phí.
Trong khi các mô hình cơ bản GPT-3.5 Turbo bắt đầu từ 0,0004 đô la cho 1.000 token (đơn vị cơ bản của thông tin được xử lý bởi một Mô Hình Ngôn Ngữ Lớn), các phiên bản đã được điều chỉnh tinh chỉnh có giá cao hơn ở mức 0,012 đô la cho 1.000 token đầu vào và 0,016 đô la cho 1.000 token đầu ra. Quá trình huấn luyện ban đầu cũng phải chịu các khoản phí dựa trên kích thước dữ liệu. Tuy nhiên, mức giá cao cấp có thể xứng đáng với khả năng tùy chỉnh.
Điều này, một lần nữa, bổ sung thêm vào tính năng “hướng dẫn tùy chỉnh” được giới thiệu cho người dùng ChatGPT Plus vào tháng 7. Ví dụ, người dùng có thể xác định ngôn ngữ lập trình mà họ muốn để đảm bảo ChatGPT luôn đề xuất các giải pháp Python. Các tùy chỉnh cá nhân khác mà OpenAI đề xuất bao gồm vị trí, sở thích, mục tiêu và tông điệu ưa thích.
Hướng dẫn tùy chỉnh cho phép người dùng tạo hình cho ChatGPT thành một trợ lí số hóa được điều chỉnh theo nhu cầu riêng biệt của họ. Mọi cuộc trò chuyện sẽ tuân theo các hướng dẫn, loại bỏ sự phiền toái của việc lặp lại các ưu tiên. Thay vì một mô hình hoàn toàn mới, nâng cấp này là một mô hình mà ta có thể nói là “nhận thức” khác biệt.
Công ty đã thực hiện các biện pháp để đảm bảo việc sử dụng tính năng fine-tuning một cách có trách nhiệm.
“Để bảo tồn các tính năng an toàn của mô hình mặc định qua quá trình fine-tuning, dữ liệu huấn luyện fine-tuning sẽ thông qua API kiểm duyệt của chúng tôi và một hệ thống kiểm duyệt được trang bị bởi GPT-4,” OpenAI giải thích. Hệ thống này cố gắng nhận diện và vô hiệu hóa dữ liệu huấn luyện không an toàn, đảm bảo rằng ngay cả đầu ra được tùy chỉnh cũng tuân theo tiêu chuẩn an toàn của OpenAI.
Điều này cũng đồng nghĩa với việc OpenAI có một mức độ kiểm soát nhất định đối với dữ liệu mà người dùng nhập vào mô hình của họ.
Giữa việc fine-tuning và hướng dẫn tùy chỉnh, OpenAI đang trao nhiều quyền kiểm soát hơn cho người dùng mong muốn định hình các mô hình theo yêu cầu cụ thể của họ. Trong cuộc chiến tranh về ưu thế trong lĩnh vực trí tuệ nhân tạo tạo ra, tính tùy chỉnh có thể là biên giới tiếp theo mang lại lợi thế cho OpenAI. Tuy nhiên, hiện tại, những khả năng này vẫn hơi độc quyền đối với các khách hàng trả phí.