Các mô hình cơ bản nên được xem như các hệ thống backend – được trừu tượng hóa khỏi người sử dụng.
Các mô hình Trí tuệ Nhân tạo có khả năng tạo ra những điều tuyệt vời đa dạng. Tuy nhiên, việc khiến chúng thực hiện những gì chúng ta muốn lại rất khó khăn – đòi hỏi sự kỹ thuật nhanh chóng và nhiều thử nghiệm – khiến cho việc sử dụng rộng rãi bởi người tiêu dùng trở nên khó khăn.
Ngày nay, chúng ta được yêu cầu xem xét các mô hình Trí tuệ Nhân tạo như các giao diện trò chuyện đa năng, được cung cấp cho chúng ta dưới dạng người tiêu dùng.
Nếu chúng ta muốn được giúp đỡ trong việc viết một bài blog, chúng ta chỉ cần mở ChatGPT (hoặc Bard, Claude, v.v.), và bắt đầu gõ (chủ yếu bằng đôi ngón tay, vì hầu hết các thiết bị tính toán hiện đại đều có sử dụng trên điện thoại di động).
“Bạn là một người viết bài đăng blog có 40 năm kinh nghiệm trong việc viết quảng cáo. Hãy viết cho tôi một bài đăng blog dài 500 từ về ‘Cách Trí tuệ Nhân tạo sẽ ảnh hưởng đến lĩnh vực y học’. Hãy làm cho bài viết mang tính chuyên nghiệp. Đối tượng mục tiêu là các bác sĩ đang lo lắng về sự chấn động trong ngành của họ. Dưới đây cũng là một đoạn mẫu của phong cách viết của tôi. Hãy đảm bảo rằng bài đăng blog tuân theo phong cách của tôi. – <chèn một vài trăm từ thể hiện đúng phong cách viết của bạn>”
Một cách tiếp cận thay thế dựng giao diện cho ứng dụng AI
Tại sao chúng ta không nghĩ về các mô hình cơ bản như là các dịch vụ backend, thay vì là các giao diện phục vụ người tiêu dùng?
- Dự liệu 1: Chúng ta cho phép những người quan tâm đến cách hoạt động của các mô hình Trí tuệ Nhân tạo, chúng ta gọi họ là “kỹ sư tạo lời gợi ý,” tạo ra các giao diện trước đơn giản và dễ hiểu cho người tiêu dùng sử dụng – trừu tượng hóa các mô hình Trí tuệ Nhân tạo và loại bỏ nhu cầu hiểu về cách tạo lời gợi ý.
- Dự liệu 2: Chúng ta giáo dục người tiêu dùng tiếp cận Trí tuệ Nhân tạo theo cách họ tiếp cận thiết bị di động – cho bất kỳ việc gì bạn muốn làm, “có ứng dụng để làm điều đó.”
Thực tế sẽ như thế nào?
Hãy tưởng tượng một công cụ, một Môi trường Phát triển Tích hợp (IDE), cho phép các kỹ sư tạo lời gợi ý tạo ra các Trí tuệ Nhân tạo có mục đích cụ thể và chuyên biệt – mà người tiêu dùng có thể sử dụng để hoàn thành công việc.
Hãy gọi công cụ này là MindStudio.
Một kỹ sư tạo lời gợi ý có thể sử dụng MindStudio để xây dựng một “Trình tạo bài đăng cá nhân” – một Trí tuệ Nhân tạo được xây dựng với mục đích cụ thể để tạo ra các bài đăng blog cho các đối tượng mục tiêu cụ thể, trong phong cách viết riêng của từng người tiêu dùng.
Để làm điều đó, kỹ sư tạo lời gợi ý (prompt) cần làm như sau:
- Xác định loại thông tin cần thu thập từ người dùng để viết các bài đăng blog xuất sắc.
- Phong cách viết của người dùng (cho phép họ tải lên tài liệu họ đã viết, hoặc chỉ định một loại phong cách khác mà họ muốn).
- Tiêu đề / chủ đề bài đăng blog.
- Đối tượng mục tiêu.
- Số từ.
- Tông (thân thiện, chuyên nghiệp, thách thức, v.v.).
- Và bất kỳ số lượng thông tin người dùng liên quan khác.
- Xác định cách định dạng bài đăng blog.
- Tạo lời gợi ý phức tạp để tạo ra các bài đăng blog.
- Lựa chọn mô hình phù hợp để đạt được kết quả tốt nhất.
- Điều chỉnh các tham số của mô hình khác nhau để điều chỉnh đầu ra.
- Kiểm tra và làm tinh chỉnh cho đến khi hài lòng.
- Xuất bản Trình tạo Bài đăng Blog Cá nhân và làm cho nó sẵn sàng cho người tiêu dùng sử dụng.
Cấu trúc của Lớp Ứng dụng
Cá nhân hóa
Các mô hình Trí tuệ Nhân tạo có khả năng trả về kết quả khác nhau (cá nhân hóa) cho mỗi người dùng – nếu họ được cung cấp một hồ sơ cá nhân hóa. Thật không may, giao diện trò chuyện hiện tại thường làm cho người dùng khó khăn trong việc cung cấp hồ sơ cá nhân như vậy. Điều gần giống nhất chúng ta có là “hướng dẫn tùy chỉnh” trong ChatGPT – cho phép người dùng chỉ định một số ưa thích được chèn vào mọi yêu cầu.
Các Trí tuệ Nhân tạo được xây dựng bằng MindStudio có thể thu thập các ưu tiên cá nhân hóa từ mỗi người dùng – thường qua một hướng dẫn sử dụng ban đầu của Trí tuệ Nhân tạo. Các ưu tiên cá nhân hóa này sau đó có thể được tận dụng trong hoạt động của Trí tuệ Nhân tạo để tạo ra kết quả được cá nhân hóa.
Không giống như Hướng dẫn Tùy chỉnh của ChatGPT, đó là các thiết lập toàn cầu, mỗi Trí tuệ Nhân tạo được xây dựng bằng MindStudio có thể có các tham số cá nhân hóa cụ thể, liên quan đến chức năng của nó.
Dữ liệu cá nhân hóa này được liên kết với hồ sơ của người dùng và có thể được tận dụng qua các Trí tuệ Nhân tạo khác, với sự cho phép rõ ràng của người dùng. Ví dụ, một Trí tuệ Nhân tạo có thể yêu cầu người dùng cung cấp mẫu về phong cách viết của họ, và các Trí tuệ Nhân tạo khác có thể yêu cầu người dùng đơn giản là cấp quyền truy cập vào dữ liệu cá nhân hóa này – loại bỏ nhu cầu cung cấp lại nó.
Lời gợi ý (Prompt)
Gợi ý các mô hình cơ bản là một sự nghệ thuật hơn là một khoa học. Có những thực hành tốt đang phát triển có thể được tuân theo, nhưng mỗi trường hợp sử dụng Trí tuệ Nhân tạo thường yêu cầu thử nghiệm và điều chỉnh lời gợi ý – công việc kỹ thuật về lời gợi ý.
MindStudio cho phép các kỹ sư tạo lời gợi ý viết lời gợi ý tiên tiến, làm cho hoạt động của Trí tuệ Nhân tạo trở nên tinh vi hơn – sử dụng các tham số cá nhân hóa, biến thời gian chạy, luồng làm việc đa bước, v.v.
Thông số Mô hình
MindStudio không phụ thuộc vào mô hình cụ thể, hỗ trợ các mô hình chính bao gồm OpenAI (GPT-3, GPT-3.5, GPT-3.5 Instruct, GPT-4.0), Anthropic (Claude 1, Claude 2), Google PaLM2. Các mô hình mới được thêm vào thường xuyên khi chúng có sẵn thương mại.
Các kỹ sư tạo lời gợi ý chọn mô hình tốt nhất cho trường hợp sử dụng của Trí tuệ Nhân tạo của họ, và sau đó có thể đặt các tham số tùy chỉnh cho mô hình đã chọn. Các tham số phổ biến bao gồm:
- Nhiệt độ (Temperature) — ảnh hưởng đến độ chính xác so với tính sáng tạo của mô hình.
- Kích thước phản hồi (Response size) — lượng dữ liệu được trả về bởi mô hình cho mỗi tương tác.
- Chiến lược tràn token (Token overflow strategy) — làm gì khi cửa sổ token bị vượt quá.
- Thông điệp giới thiệu hệ thống (System introduction messages) — tham số được chèn vào đầu mỗi cuộc trò chuyện.
- Xử lý thông điệp người dùng (User message processing) — hướng dẫn Augmented Generation (RAG), cho phép Trí tuệ Nhân tạo sử dụng các Nguồn Dữ liệu khác ngoài những gì nó đã được đào tạo.
Nguồn Dữ liệu
Các kỹ sư tạo lời gợi ý có thể tải lên các loại dữ liệu khác nhau vào Trí tuệ Nhân tạo trong quá trình xây dựng, và chỉ dẫn Trí tuệ Nhân tạo tham chiếu các nguồn dữ liệu này trong các phản hồi của nó. Các loại dữ liệu hiện được hỗ trợ bao gồm (txt, docx, pdf, csv, xlsx và html).
Khả năng này giúp tạo ra các loại Trí tuệ Nhân tạo mới mạnh mẽ. Một số ví dụ bao gồm:
- Trí tuệ Nhân tạo Dự án sách (Book AIs) — cho phép các tác giả biến sách của họ thành Trí tuệ Nhân tạo tương tác.
- Ứng dụng SMB (Small and Medium-sized Businesses) — Cho phép các SMB tải lên dữ liệu của họ và sử dụng Trí tuệ Nhân tạo để phân tích nó – phân tích dữ liệu AI mà không cần một chuyên gia phân tích chuyên nghiệp.
- Ứng dụng Doanh nghiệp — Cho phép các chức năng khác nhau trong doanh nghiệp tận dụng Trí tuệ Nhân tạo cho các nhu cầu tùy chỉnh của họ.
- Và vô số các trường hợp sử dụng khác.
Dữ liệu được tải lên sẽ được tự động phân tích, chia thành các phần, nhúng vectơ và lưu trữ an toàn trong cơ sở dữ liệu vectơ.
Tự động hóa
Các Trí tuệ Nhân tạo được xây dựng bằng MindStudio có thể thực hiện các luồng làm việc đa bước. Các luồng làm việc này có thể thực hiện nhiều công việc khác nhau, bao gồm:
- Thu thập dữ liệu đầu vào thời gian chạy từ người dùng.
- Tận dụng các điểm cuối web bên ngoài (trang web, API) trong luồng làm việc – lấy nội dung từ một URL, sau đó sử dụng nó trong luồng làm việc.
- Tận dụng các Nguồn Dữ liệu được cấu hình bởi kỹ sư tạo lời gợi ý.
- Yêu cầu người dùng tải lên các loại dữ liệu khác nhau.
- Tận dụng dữ liệu cá nhân hóa cho mỗi người dùng để tùy chỉnh đầu ra.
- Đầu ra được xử lý theo luồng, chỉnh sửa định dạng văn bản phong phú và nhiều tính năng khác.
- Các khả năng mới đang được thêm vào liên tục!
Điều này cho phép tạo ra các ứng dụng Trí tuệ Nhân tạo linh hoạt và phức tạp, có khả năng thực hiện nhiều tác vụ và tương tác với nhiều nguồn dữ liệu và đối tượng người dùng khác nhau.
Tất cả các khả năng này được trở nên truy cập cho các kỹ sư tạo lời gợi ý không cần kiến thức kỹ thuật (không cần viết mã) để tạo ra các Trí tuệ Nhân tạo (trong vài phút), điều này trước đây đòi hỏi nhiều giờ của các nhà phát triển chuyên nghiệp viết mã tùy chỉnh.
Siêu dữ liệu (Metadata)
Mỗi Trí tuệ Nhân tạo được tạo ra bằng MindStudio có thể triển khai bằng cách nhấn một nút, dù là riêng tư hoặc công khai. Các kỹ sư tạo lời gợi ý có thể cấu hình tất cả các loại siêu dữ liệu, bao gồm Tên, Slogan, Hình thu nhỏ, Thẻ, Video xem trước, Ảnh chụp màn hình, siêu dữ liệu Open-Graph, Mô tả Văn bản Phong phú, Liên kết Ngoại vi, Tính hiển thị, và Tham số Giá cả (bao nhiêu tiền người dùng phải trả để sử dụng Trí tuệ Nhân tạo).
Gỡ lỗi / Xem trước Nháp Trực tiếp
MindStudio cho phép các kỹ sư tạo lời gợi ý kiểm tra / xem trước Trí tuệ Nhân tạo của họ khi họ đang phát triển nó. Điều này xuất hiện dưới dạng một bảng điều khiển trực tiếp (có thể được sử dụng để tương tác trực tiếp với Trí tuệ Nhân tạo trong quá trình phát triển), một công cụ gỡ lỗi tích hợp (cho phép kiểm tra các thông điệp, biến số, mục lời đầu, lời gợi ý, mô hình và hiệu suất), và một chế độ xem trước nháp trực tiếp trước khi xuất bản.
Phân tích dữ liệu
Mỗi Trí tuệ Nhân tạo triển khai thông qua MindStudio tự động thu thập dữ liệu phân tích, cho phép các kỹ sư tạo lời gợi ý hiểu về hiệu suất và hiệu quả của Trí tuệ Nhân tạo của họ và thực hiện các điều chỉnh liên quan theo thời gian.
Điều gì tiếp theo?
Tất cả đều chỉ là sự bắt đầu!
Các khả năng của các mô hình cơ bản đang gia tăng với tốc độ nhanh chóng – khó có thể chỉ ra bất kỳ công nghệ nào khác đã phát triển với tốc độ của Trí tuệ Nhân tạo. Mỗi tuần chúng ta thấy sự tiến bộ mới mẻ đáng kể.
Chào mừng bạn đến với Lớp Ứng dụng của Trí tuệ Nhân tạo – BẠN có thể TẠO RA Trí tuệ Nhân tạo để giải quyết mọi loại trường hợp sử dụng – của riêng bạn, người tiêu dùng, doanh nghiệp nhỏ và vừa, và doanh nghiệp lớn.