Sự phổ biến của ChatGPT đã khơi mạch sự quan tâm đến việc áp dụng trí tuệ nhân tạo sáng tạo; tuy nhiên, để đưa ra quyết định có hiểu biết và đạt được giá trị, các Giám đốc Công nghệ (CTO) cần hiểu về các phương pháp khác nhau. Ở đây, chúng tôi so sánh các phương pháp triển khai và cung cấp một khuôn khổ quyết định để chọn một phương pháp hơn phương pháp khác.
Giả định về Kế hoạch Chiến lược
- Đến năm 2026, hơn 80% doanh nghiệp sẽ đã sử dụng các giao diện lập trình ứng dụng (APIs), mô hình trí tuệ nhân tạo (AI) sáng tạo hoặc triển khai các ứng dụng được bật AI sáng tạo trong môi trường sản xuất, đây là một sự tăng đáng kể so với dưới 5% hiện nay.
- Đến năm 2026, hơn 70% các nhà cung cấp phần mềm độc lập (ISVs) sẽ tích hợp khả năng AI sáng tạo vào các ứng dụng doanh nghiệp của họ, đây là một sự tăng đáng kể so với dưới 1% hiện nay.
- Đến năm 2026, gần 80% sự khuyến khích sẽ được bán tự động hóa – thông qua các công cụ khuyến khích tự động hoặc qua các đại lý tự động, yêu cầu ít khuyến khích.
- Đến năm 2028, hơn 50% doanh nghiệp đã xây dựng các mô hình từ đầu sẽ từ bỏ nỗ lực của họ do chi phí, sự phức tạp và nợ kỹ thuật trong triển khai của họ.
Giới thiệu
Sự phổ biến của ChatGPT đã mở cánh cửa cho sự đổi mới trong lĩnh vực trí tuệ nhân tạo sáng tạo. Trong vòng sáu tháng qua, đã có một loạt các mô hình AI cơ bản, các mô hình được tinh chỉnh bởi nhà cung cấp, các ứng dụng AI sáng tạo và các công cụ học máy (MLOps) được phát hành trên thị trường. Ngoài ra, nhiều nhà cung cấp phần mềm độc quyền lớn đang nhúng trí tuệ nhân tạo sáng tạo vào các ứng dụng hiện có của họ để mang lại sức mạnh của trí tuệ nhân tạo sáng tạo cho người dùng doanh nghiệp. Mặc dù những sự phát triển nhanh chóng này biểu thị sự cạnh tranh mạnh mẽ là đặc trưng của hầu hết các thị trường sớm có rủi ro cao, nhưng đồng thời cũng đưa ra một loạt các lựa chọn phức tạp mà các nhà lãnh đạo Công nghệ Thông tin doanh nghiệp cần phải điều hướng. Ở đây, chúng tôi nhằm mục đích làm rõ sự khác biệt giữa các phương pháp triển khai trí tuệ nhân tạo sáng tạo khác nhau (xem Hình 1) và đề xuất một khung quyết định để chọn một trong số chúng.
Hình 1: Các Phương pháp Triển khai Trí tuệ Nhân tạo Sáng tạo
Có năm phương pháp chính để tiêu thụ các khả năng trí tuệ nhân tạo sáng tạo: tiêu thụ, nhúng, mở rộng thông qua truy xuất dữ liệu, mở rộng thông qua tinh chỉnh và xây dựng. Cách đơn giản nhất để triển khai trí tuệ nhân tạo sáng tạo là bằng cách tiêu thụ các ứng dụng như ChatGPT thông qua giao diện web hoặc ứng dụng di động của họ. Tuy nhiên, những dịch vụ này hướng đến người tiêu dùng hơn, mặc dù OpenAI và các đối tác khác dự định giới thiệu các dịch vụ cấp doanh nghiệp (ví dụ: ChatGPT for Business) trong tương lai, với các điều khoản bảo vệ dữ liệu tốt hơn. Ngoài ra, Gartner nhận thấy có năm phương pháp chính để tiêu thụ các khả năng trí tuệ nhân tạo sáng tạo đang nổi lên:
- Tiêu thụ trí tuệ nhân tạo được nhúng sẵn bên trong các ứng dụng: Tổ chức có thể trực tiếp sử dụng các ứng dụng thương mại có tính năng trí tuệ nhân tạo được nhúng trong chúng. Một ví dụ điển hình cho điều này là sử dụng một ứng dụng phần mềm thiết kế đã được xác lập, trong đó bao gồm khả năng tạo ra hình ảnh (ví dụ: Adobe Firefly).
- Nhúng các API trí tuệ nhân tạo sáng tạo vào một khung ứng dụng tùy chỉnh: Doanh nghiệp có thể xây dựng các ứng dụng của riêng mình, tích hợp trí tuệ nhân tạo sáng tạo thông qua các API mô hình cơ sở. Hầu hết các mô hình trí tuệ nhân tạo nguồn đóng (GPT-3, GPT-4, PaLM 2, vv.) đều có sẵn để triển khai thông qua các API đám mây. Phương pháp này có thể được tinh chỉnh hơn thông qua kỹ thuật khuyến khích – điều này có thể bao gồm các mẫu, ví dụ – để cung cấp thông tin tốt hơn cho kết quả của mô hình cơ sở. Một ví dụ cho điều này là phân tích tâm trạng, trong đó bạn có thể cung cấp hướng dẫn chi tiết trong khuyến khích về cách bạn muốn phân loại tâm trạng (ví dụ: tích cực, tiêu cực hoặc trung lập) và minh họa nó bằng các ví dụ để điều khiển các mô hình cung cấp phản hồi tối ưu.
- Mở rộng các mô hình Trí tuệ nhân tạo thông qua truy xuất dữ liệu: Truy xuất được bổ sung (RAG) cho phép các doanh nghiệp truy xuất dữ liệu từ bên ngoài một mô hình cơ sở (thường là dữ liệu nội bộ của bạn) và bổ sung vào các khuyến khích bằng cách thêm dữ liệu đã truy xuất. Điều này sẽ cải thiện độ chính xác và chất lượng của phản hồi mô hình cho các nhiệm vụ cụ thể của ngành. RAG không đòi hỏi việc tạo ra các mô hình tùy chỉnh. Một ví dụ là tìm kiếm trong cơ sở dữ liệu tài liệu riêng để tìm dữ liệu liên quan để thêm vào khuyến khích của mô hình cơ sở, bổ sung phản hồi của nó bằng thông tin tương tự, tương tự.
- Mở rộng các mô hình trí tuệ nhân tạo thông qua việc tinh chỉnh: Việc tinh chỉnh sử dụng một mô hình cơ sở lớn, đã được huấn luyện trước như một điểm khởi đầu và tiếp tục huấn luyện nó trên một tập dữ liệu mới để tích hợp thêm kiến thức ngành hoặc cải thiện hiệu suất trên các nhiệm vụ cụ thể. Điều này thường dẫn đến các mô hình tùy chỉnh dành riêng cho tổ chức. Ví dụ, một công ty bảo hiểm có thể tinh chỉnh một mô hình cơ bản với các tài liệu chính sách của riêng mình để tích hợp kiến thức này vào mô hình và cải thiện hiệu suất của nó trên các trường hợp sử dụng cụ thể.
- Xây dựng các mô hình cơ bản tùy chỉnh từ đầu: Tổ chức có thể cuối cùng xây dựng các mô hình cơ bản của riêng mình từ đầu, tùy chỉnh hoàn toàn chúng cho dữ liệu và lĩnh vực kinh doanh của riêng mình. Ví dụ, một tổ chức tài chính có thể tạo ra một mô hình cơ bản được huấn luyện với dữ liệu tài chính, sau đó có thể được sử dụng cho nhiều trường hợp sử dụng trong lĩnh vực dịch vụ tài chính (BloombergGPT là một ví dụ nổi bật).
Không có một phương pháp tốt nhất duy nhất cho tất cả các trường hợp sử dụng, nhưng cần xem xét các sự đánh đổi thực sự giữa các phương pháp này khi đưa ra quyết định có hiểu biết.
Phân tích đặc điểm của từng chiến lược ứng dụng trí tuệ nhân tạo tổng quát hỗ trợ ra quyết đinh
1. Tiêu Thụ Trí Tuệ Nhân Tạo được Nhúng trong Ứng Dụng
Ưu điểm
- Dễ dàng triển khai, không cần chi phí cố định hoặc chi phí thấp để bắt đầu thử nghiệm các khả năng trí tuệ nhân tạo sáng tạo.
- Những cải tiến cho mô hình trí tuệ nhân tạo cơ bản điều khiển ứng dụng có thể trực tiếp dịch thành sự hữu ích gia tăng cho người dùng, mà không cần đầu tư bổ sung.
- Dễ tích hợp với luồng công việc hiện tại – làm cho đây là phương pháp ít gây rối nhất.
Nhược điểm
- Thiếu tính linh hoạt để xây dựng các luồng công việc phức tạp hơn không phải là các tính năng tiêu chuẩn của ứng dụng và không thể mở rộng khả năng của mô hình vượt ra ngoài ứng dụng đó.
- Các ứng dụng có trí tuệ nhân tạo được nhúng có thể không thể hiểu sâu về bối cảnh của một cuộc trò chuyện hoặc nhiệm vụ, dẫn đến các phản ứng ít chính xác hoặc không liên quan.
- Tổ chức có ít quyền kiểm soát hơn đối với rủi ro bảo mật và quyền riêng tư dữ liệu, phụ thuộc mạnh mẽ vào các điều khiển bảo mật và bảo vệ dữ liệu của nhà cung cấp ứng dụng, có thể biến đổi rộng lớn, tùy thuộc vào loại nhà cung cấp phần mềm.
2. Nhúng Các API Trí Tuệ Nhân Tạo vào Khung Ứng Dụng Tùy Chỉnh
Ưu điểm
- Dễ triển khai hơn và với chi phí cố định thấp hơn, vì bạn chỉ trả tiền cho việc sử dụng mô hình (suy luận) mà thôi, không phải là cho việc huấn luyện. Phương pháp này thường cung cấp lợi thế về thời gian ra thị trường – bạn có thể đưa trường hợp sử dụng của mình vào sản xuất nhanh hơn, với mức độ tùy chỉnh chấp nhận được.
- Các mô hình cơ bản đã được chứng minh là hiệu quả trong việc học bài qua ít dữ liệu, điều này có nghĩa là, với một số lượng hạn chế các mẫu chất lượng cao, chúng có thể hoàn thành các nhiệm vụ mới với độ chính xác đủ.
- Trong kỹ thuật khuyến khích, mô hình cơ bản dưới đây được đóng băng – điều này cung cấp khả năng sử dụng cùng một mô hình cho nhiều trường hợp sử dụng khác nhau – điều này đơn giản hóa quản lý và quản trị mô hình.
Nhược điểm
- Có một giới hạn về lượng dữ liệu có thể được truyền qua các khuyến khích, điều này có thể hạn chế các trường hợp sử dụng cho phương pháp này.
- Kỹ thuật khuyến khích là một lĩnh vực mới nổi, nơi các quy ước tốt nhất chỉ mới bắt đầu xuất hiện, và cần có các kỹ năng mới.
- Có nguy cơ về các vấn đề tương thích ngược, với các thay đổi trong mô hình API cơ bản ảnh hưởng đến các luồng công việc và ứng dụng tùy chỉnh được xây dựng trên nền tảng đó. Các nhà cung cấp phải tiếp tục hỗ trợ các phiên bản trước của các mô hình.
3. Mở Rộng Các Mô Hình Trí Tuệ Nhân Tạo thông qua Truy Xuất Dữ Liệu
Ưu điểm
- Truy xuất dữ liệu thông qua RAG cho phép tổ chức tích hợp thông tin bổ sung ngoài những gì có trong dữ liệu huấn luyện của mô hình cơ bản. Điều này có thể là dữ liệu cập nhật hơn, cũng như dữ liệu cụ thể cho ngành hoặc dữ liệu riêng tư.
- Mở rộng các mô hình thông qua phương pháp RAG có thể cung cấp một sự cân bằng phù hợp giữa việc đưa bối cảnh tổ chức vào các mô hình cơ bản mà không phức tạp và chi phí của việc sửa đổi các mô hình cơ bản (tinh chỉnh hoặc xây dựng mô hình từ đầu).
- Tăng độ chính xác trên các nhiệm vụ cụ thể của ngành và giảm thiểu các hiện tượng ảo trong kết quả của mô hình do cải thiện khuyến khích và cơ sở dữ liệu của tổ chức.
Nhược điểm
- Phương pháp RAG bị hạn chế bởi cửa sổ ngữ cảnh của mô hình tạo, hạn chế lượng thông tin được truy xuất mà có thể được gửi đến mô hình. Tương tự, bước truy xuất bổ sung để bổ sung vào khuyến khích có thể tăng độ trễ, ảnh hưởng đến tính khả dụng của nó cho các trường hợp sử dụng thời gian thực.
- Triển khai một phương pháp RAG liên quan đến việc thiết kế lại kiến trúc kỹ thuật và quy trình làm việc để bao gồm các thành phần công nghệ mới như cơ sở dữ liệu vector và các mô hình nhúng – kiến thức về các thành phần công nghệ này và kiến trúc tổng thể khá cơ bản trong hầu hết các doanh nghiệp. Các thành phần bổ sung này mang theo các chi phí bổ sung.
- Tổ chức cần đảm bảo rằng không có thông tin nhạy cảm hoặc đặc quyền nào bị rò rỉ qua quá trình truy xuất, điều này đòi hỏi có đủ các biện pháp bảo vệ quanh kiểm soát truy cập, truy xuất thông tin và theo dõi kết quả truy xuất.
4. Mở Rộng Các Mô Hình Trí Tuệ Nhân Tạo thông qua Tinh Chỉnh
Ưu điểm
- Tinh chỉnh cho phép tổ chức nhanh chóng cải thiện hiệu suất cho các trường hợp sử dụng cụ thể, mà không cần phải huấn luyện một mô hình đầy đủ từ đầu. Điều này có thể dẫn đến việc cải thiện hiệu suất và khả năng giảm hiện tượng ảo bằng cách tinh chỉnh nó với dữ liệu tổ chức và/hoặc dữ liệu cụ thể cho các nhiệm vụ cụ thể.
- Thông thường, việc tinh chỉnh không đòi hỏi lượng lớn dữ liệu (mặc dù dữ liệu cần phải chất lượng cao), đặc biệt là khi so sánh với dữ liệu cần thiết để huấn luyện các mô hình cơ sở dưới lying, đòi hỏi nhiều dữ liệu hơn nhiều lần.
- Có một xu hướng tiếp tục hướng tới các mô hình cơ sở mã nguồn mở nhỏ hơn, nhưng hiệu suất cao. Điều này có thể làm cho việc tạo ra các mô hình được tinh chỉnh trở nên khả thi và hiệu quả về chi phí hơn.
Nhược điểm
- Chi phí của việc sử dụng một mô hình được tinh chỉnh (chi phí suy luận) có thể đáng kể, ngay cả khi chi phí của việc huấn luyện tinh chỉnh không cao. Các mô hình được tinh chỉnh vẫn là các mô hình lớn, với hàng tỷ tham số, và sẽ cần được tối ưu hóa để có thể sử dụng một cách thực tế ở quy mô lớn.
- Việc tinh chỉnh trên một mô hình cơ sở nhất định có thể hạn chế tính linh hoạt trong việc sử dụng các mô hình cơ sở tốt hơn có thể xuất hiện trong tương lai.
- Các mô hình cơ sở được tinh chỉnh cho các trường hợp sử dụng cụ thể có thể mất khả năng mở rộng ra các trường hợp sử dụng rộng lớn hơn. Việc tinh chỉnh có thể làm cho các mô hình quá chuyên biệt cho các trường hợp sử dụng cụ thể, mất đi khả năng tổng quát của chúng.
5. Xây Dựng Các Mô Hình Cơ Bản Tùy Chỉnh Từ Đầu
Ưu điểm
- Các mô hình được tùy chỉnh hoàn toàn cho trường hợp sử dụng hoặc lĩnh vực của bạn – lý thuyết, phương pháp này có tiềm năng mang lại độ chính xác cao nhất.
- Nếu việc quản lý dữ liệu được thực hiện đầy đủ, tổ chức sẽ có hoàn toàn quyền kiểm soát các tập dữ liệu huấn luyện và các tham số mô hình. Điều này có thể tăng đáng kể sự phù hợp với trường hợp sử dụng và giảm thiểu độ chệch và các hậu quả không ý định hoặc có hại khác.
- Việc hoàn toàn kiểm soát mô hình của bạn có thể mang lại sự phân biệt cạnh tranh và một sản phẩm mạnh mẽ hơn, so với các đối thủ của bạn. Mô hình cơ bản có thể được thương mại hóa nếu nó đạt được hiệu suất đủ cao và cụ thể cho ngành.
Nhược điểm
- Chi phí huấn luyện và duy trì một mô hình trí tuệ nhân tạo sáng tạo lớn có thể cao. Nó có thể bao gồm chi phí cơ sở hạ tầng huấn luyện, thu thập dữ liệu, cơ sở hạ tầng và chi phí gắn nhãn, kiểm tra chất lượng mô hình bằng con người và chi phí suy luận.
- Việc tiếp tục tiếp cận các nhà nghiên cứu trí tuệ nhân tạo hàng đầu là quan trọng để xây dựng một mô hình chất lượng cao và duy trì và cập nhật nó thường xuyên.
- Tốc độ đổi mới trong hệ sinh thái trí tuệ nhân tạo sáng tạo là nhanh chóng và, đối với hầu hết các khách hàng, tốc độ đổi mới bên ngoài từ các nhà cung cấp công nghệ sẽ lớn hơn so với sự đổi mới nội bộ của họ. Trong tương lai, quyết định xây dựng có thể gây ra sự hối tiếc.
Thay lời kết
Sự phổ biến của ChatGPT đã khơi mạch sự quan tâm đến việc áp dụng trí tuệ nhân tạo sáng tạo; tuy nhiên, để đưa ra quyết định có hiểu biết và đạt được giá trị, các Giám đốc Công nghệ (CTO) cần hiểu về các phương pháp khác nhau. Ở đây, chúng tôi so sánh các phương pháp triển khai và cung cấp một khuôn khổ quyết định để chọn một phương pháp hơn phương pháp khác.