Tác giả: OpenAI
Ngày 25 tháng 1 năm 2024
Sản phẩm Chúng tôi đang phát hành các mô hình mới, giảm giá cho GPT-3.5 Turbo và giới thiệu các cách mới để nhà phát triển quản lý khóa API và hiểu rõ về việc sử dụng API. Các mô hình mới bao gồm:
Hai mô hình nhúng mới Một mô hình xem trước GPT-4 Turbo được cập nhật Một mô hình GPT-3.5 Turbo được cập nhật Một mô hình kiểm duyệt văn bản được cập nhật Mặc định, dữ liệu gửi đến API của OpenAI sẽ không được sử dụng để huấn luyện hoặc cải thiện các mô hình của OpenAI.
Các mô hình nhúng mới với giá thấp hơn
Chúng tôi giới thiệu hai mô hình nhúng mới: một mô hình nhúng văn bản nhỏ gọn và hiệu quả cao, được gọi là text-embedding-3-small, và một mô hình nhúng văn bản lớn hơn và mạnh mẽ hơn, được gọi là text-embedding-3-large.
Một nhúng là một chuỗi số biểu thị các khái niệm trong nội dung như ngôn ngữ tự nhiên hoặc mã code. Những nhúng giúp cho các mô hình máy học và các thuật toán khác dễ dàng hiểu về mối quan hệ giữa nội dung và thực hiện các nhiệm vụ như phân nhóm hoặc truy xuất. Chúng là nguồn năng lượng cho các ứng dụng như truy xuất kiến thức trong cả ChatGPT và Assistants API, cũng như nhiều công cụ phát triển truy xuất gia tăng (RAG).
Mô hình nhúng văn bản mới nhỏ gọn text-embedding-3-small
Mô hình nhúng văn bản mới nhỏ gọn text-embedding-3-small là mô hình nhúng mới của chúng tôi, hiệu quả cao và đem lại một nâng cấp đáng kể so với phiên bản trước đó, mô hình text-embedding-ada-002 được phát hành vào tháng 12 năm 2022.
Hiệu suất mạnh mẽ. So sánh giữa text-embedding-ada-002 và text-embedding-3-small, điểm trung bình trên một bộ kiểm thử phổ biến cho việc truy xuất đa ngôn ngữ (MIRACL) đã tăng từ 31,4% lên 44,0%, trong khi điểm trung bình trên một bộ kiểm thử phổ biến cho các nhiệm vụ tiếng Anh (MTEB) đã tăng từ 61,0% lên 62,3%.
Giảm giá. text-embedding-3-small cũng đáng kể hiệu quả hơn so với mô hình trước đó là text-embedding-ada-002. Do đó, giá cho text-embedding-3-small đã giảm đi 5 lần so với text-embedding-ada-002, từ giá mỗi 1k token là $0,0001 xuống còn $0,00002.
Chúng tôi không ngừng hỗ trợ text-embedding-ada-002, vì vậy mặc dù chúng tôi khuyến khích sử dụng mô hình mới hơn, khách hàng có thể tiếp tục sử dụng mô hình thế hệ trước nếu muốn.
Mô hình nhúng văn bản mới lớn: text-embedding-3-large
text-embedding-3-large là mô hình nhúng lớn mới của chúng tôi thế hệ tiếp theo và tạo ra các nhúng với đến 3072 chiều.
Hiệu suất mạnh mẽ. text-embedding-3-large là mô hình hiệu suất tốt nhất của chúng tôi. So sánh giữa text-embedding-ada-002 và text-embedding-3-large: trên MIRACL, điểm trung bình đã tăng từ 31,4% lên 54,9%, trong khi trên MTEB, điểm trung bình đã tăng từ 61,0% lên 64,6%.
Đây là bảng so sánh giữa các mô hình trên các bộ kiểm thử MIRACL và MTEB:
Bộ kiểm thử | text-embedding-ada-v2 | text-embedding-3-small | text-embedding-3-large |
---|---|---|---|
MIRACL | 31.4 | 44.0 | 54.9 |
MTEB | 61.0 | 62.3 | 64.6 |
Các con số trong bảng là điểm trung bình trên từng bộ kiểm thử cho từng mô hình. Có thể thấy rằng cả hai mô hình mới, text-embedding-3-small và text-embedding-3-large, đều có hiệu suất mạnh mẽ hơn so với text-embedding-ada-v2, với các điểm số trung bình cao hơn trên cả MIRACL và MTEB.
text-embedding-3-large sẽ có giá là $0.00013 / 1k tokens.
Bạn có thể tìm hiểu thêm về cách sử dụng các mô hình nhúng mới trong Hướng dẫn về Nhúng của chúng tôi.
Hỗ trợ tự nhiên cho việc rút gọn nhúng
Việc sử dụng nhúng lớn hơn, chẳng hạn như lưu trữ chúng trong một cửa hàng vector để truy xuất, thường tăng chi phí và tiêu tốn nhiều nguồn tính toán, bộ nhớ và lưu trữ hơn so với việc sử dụng nhúng nhỏ hơn.
Cả hai mô hình nhúng mới của chúng tôi được đào tạo với một kỹ thuật cho phép nhà phát triển cân nhắc giữa hiệu suất và chi phí khi sử dụng nhúng. Cụ thể, nhà phát triển có thể rút gọn nhúng (tức là loại bỏ một số số từ cuối của chuỗi) mà không làm mất tính chất biểu diễn khái niệm của nhúng bằng cách chuyển tham số API kích thước. Ví dụ, trên bảng kiểm thử MTEB, một nhúng text-embedding-3-large có thể được rút gọn xuống kích thước 256 vẫn có hiệu suất vượt trội so với một nhúng text-embedding-ada-002 không rút gọn với kích thước 1536.
Dưới đây là bảng so sánh kích thước nhúng và điểm trung bình trên bộ kiểm thử MTEB cho các mô hình:
Mô hình | Embedding Size | Average MTEB Score |
---|---|---|
ada-v2 | 1536 | 61.0 |
text-embedding-3-small | 512 | 61.6 |
text-embedding-3-large | 1536 | 62.3 |
text-embedding-3-small | 256 | 62.0 |
text-embedding-3-small | 1024 | 64.1 |
text-embedding-3-large | 3072 | 64.6 |
Bảng này mô tả kích thước của nhúng và điểm trung bình trên bộ kiểm thử MTEB cho mỗi mô hình. Có thể thấy rằng có sự đánh đổi giữa kích thước nhúng và hiệu suất, và nhà phát triển có thể lựa chọn kích thước phù hợp với yêu cầu cụ thể của họ.
Điều này mang lại sự linh hoạt rất lớn trong việc sử dụng. Ví dụ, khi sử dụng một cửa hàng dữ liệu vector chỉ hỗ trợ nhúng có độ dài tối đa là 1024 chiều, các nhà phát triển có thể sử dụng mô hình nhúng tốt nhất của chúng tôi là text-embedding-3-large và chỉ định một giá trị là 1024 cho tham số API kích thước. Điều này sẽ làm giảm kích thước nhúng từ 3072 chiều xuống, đồng thời đánh đổi một số độ chính xác để có được kích thước vector nhỏ hơn.
Các mô hình mới khác và giá thấp hơn
Mô hình GPT-3.5 Turbo được cập nhật và giảm giá
Tuần tới, chúng tôi sẽ giới thiệu một mô hình GPT-3.5 Turbo mới, gpt-3.5-turbo-0125, và lần thứ ba trong năm qua, chúng tôi sẽ giảm giá cho GPT-3.5 Turbo để hỗ trợ khách hàng mở rộng quy mô. Giá đầu vào cho mô hình mới giảm 50% xuống còn $0.0005 /1K tokens và giá đầu ra giảm 25% xuống còn $0.0015 /1K tokens. Mô hình này cũng sẽ có các cải tiến khác bao gồm độ chính xác cao hơn khi phản hồi theo định dạng yêu cầu và một sửa lỗi gây ra vấn đề về mã hóa văn bản cho cuộc gọi hàm không phải tiếng Anh.
Khách hàng sử dụng mô hình ghim gpt-3.5-turbo sẽ được tự động nâng cấp từ gpt-3.5-turbo-0613 lên gpt-3.5-turbo-0125 hai tuần sau khi mô hình này được ra mắt.
Mô hình GPT-4 Turbo xem trước được cập nhật
Hơn 70% yêu cầu từ khách hàng sử dụng API GPT-4 đã chuyển sang GPT-4 Turbo kể từ khi nó được phát hành, khi các nhà phát triển tirơi chờ kiến thức cập nhật, cửa sổ ngữ cảnh lớn hơn 128k, và giá thấp hơn.
Hôm nay, chúng tôi đang phát hành một mô hình GPT-4 Turbo xem trước được cập nhật, gpt-4-0125-preview. Mô hình này thực hiện các nhiệm vụ như tạo mã code một cách toàn diện hơn so với mô hình xem trước trước đó và được thiết kế để giảm trường hợp “lười biếng” khi mô hình không hoàn thành một nhiệm vụ. Mô hình mới cũng bao gồm sửa lỗi ảnh hưởng đến việc tạo ra văn bản UTF-8 không phải tiếng Anh.
Đối với những người muốn tự động nâng cấp lên các phiên bản xem trước mới của GPT-4 Turbo, chúng tôi cũng giới thiệu một tên gọi mô hình mới là gpt-4-turbo-preview, luôn trỏ đến mô hình xem trước GPT-4 Turbo mới nhất của chúng tôi.
Chúng tôi dự định sẽ phát hành GPT-4 Turbo với khả năng thị giác (vision) chung trong thời gian tới.
Mô hình kiểm duyệt được cập nhật
API Miễn phí cho phép các nhà phát triển xác định văn bản có thể gây hại. Như một phần của công việc an toàn liên tục của chúng tôi, chúng tôi đang phát hành text-moderation-007, mô hình kiểm duyệt mạnh mẽ nhất của chúng tôi cho đến nay. Các tên gọi alias text-moderation-latest và text-moderation-stable đã được cập nhật để trỏ đến nó. Bạn có thể tìm hiểu thêm về việc xây dựng hệ thống AI an toàn thông qua hướng dẫn các biện pháp an toàn của chúng tôi.
Các cách mới để hiểu về việc sử dụng API và quản lý khóa API
Chúng tôi đang triển khai hai cải tiến trên nền tảng để cung cấp cho nhà phát triển cả khả năng theo dõi sử dụng và kiểm soát khóa API.
Đầu tiên, nhà phát triển hiện có thể gán quyền cho khóa API từ trang khóa API. Ví dụ, một khóa có thể được gán quyền chỉ đọc để hỗ trợ một bảng theo dõi nội bộ, hoặc bị hạn chế chỉ có thể truy cập một số điểm cuối cụ thể.
Thứ hai, bảng theo dõi sử dụng và chức năng xuất sử dụng hiện đã hiển thị các số liệu trên cấp khóa API sau khi bật theo dõi. Điều này giúp dễ dàng xem sử dụng ở cấp độ từng tính năng, đội, sản phẩm, hoặc dự án, chỉ bằng cách sử dụng các khóa API riêng biệt cho mỗi loại.
Trong những tháng sắp tới, chúng tôi dự định sẽ tiếp tục cải thiện khả năng của nhà phát triển để xem sử dụng API và quản lý khóa API, đặc biệt là trong các tổ chức lớn.
Để cập nhật thông tin mới nhất về các API của OpenAI, hãy theo dõi chúng tôi trên X tại @OpenAIDevs.