ChatGPT của OpenAI phản ánh sự đổi mới trong các mô hình ngôn ngữ lớn và các công nghệ trí tuệ nhân tạo khác, hứa hẹn mở ra tiềm năng của trí tuệ nhân tạo tạo ra. Nhưng thay vì xem xét nó như một sản phẩm tiêu dùng, các nhà lãnh đạo sản phẩm nên nghiên cứu các công nghệ cơ bản của nó và xây dựng kế hoạch phát triển riêng cho trí tuệ nhân tạo tạo ra.
Các công ty công nghệ nên biết và làm gì về ChatGPT?
Họ nên biết rằng ChatGPT là một ví dụ ấn tượng về tiềm năng của trí tuệ nhân tạo tạo ra, được kích hoạt bởi mô hình cơ sở tổng quan bên dưới, nhưng không nên xem nó như một sản phẩm tiêu dùng. Thay vì cố gắng tích hợp ChatGPT vào sản phẩm và dịch vụ của họ, họ nên tập trung vào hiểu rõ các công nghệ cơ bản và phát triển kế hoạch riêng của họ cho trí tuệ nhân tạo tạo ra trong các trường hợp sử dụng kinh doanh có giá trị cao.
ChatGPT là một trong những phát triển mới và quan trọng nhất trong lĩnh vực trí tuệ nhân tạo tạo ra (AI), thu hút hàng tỷ đô la đầu tư từ các nhà đầu tư công nghệ.
ChatGPT là một dịch vụ trí tuệ nhân tạo trò chuyện, được xây dựng bởi OpenAI, một công ty nghiên cứu và phát triển trí tuệ nhân tạo. Dịch vụ này sử dụng một chatbot để tương tác hoặc “trò chuyện” với nguồn thông tin Generative Pre-trained Transformer (GPT). GPT là một mô hình ngôn ngữ lớn (LLM) — còn được gọi là mô hình cơ sở trí tuệ nhân tạo — sử dụng học sâu để tạo ra văn bản đọc như được viết bởi con người.
ChatGPT có thể tạo ra nội dung mới, tổng hợp nội dung và thực hiện nhiều nhiệm vụ khác tạo ra phản hồi văn bản thông qua một cuộc trò chuyện được gọi là một yêu cầu. Một yêu cầu là một cụm từ hoặc từ khóa cụ thể được sử dụng làm đầu vào. Dựa trên đoạn văn bản ban đầu làm yêu cầu, ChatGPT tạo ra văn bản tiếp tục yêu cầu, tương tự như một cuộc trò chuyện. Dữ liệu huấn luyện được sử dụng cho LLM xác định cách câu hỏi sẽ được trả lời.
Trong trường hợp của ChatGPT, LLM được huấn luyện bởi OpenAI trên một lượng lớn nội dung đa ngành công khai và có sẵn.
ChatGPT có khả năng làm được những gì?
Các mô hình cơ sở trí tuệ nhân tạo như GPT đại diện cho một bước tiến lớn trong lĩnh vực trí tuệ nhân tạo. Mặc dù việc xây dựng các mô hình LLM tổng quan đa năng rất đắt và tốn thời gian, nhưng chúng làm cho việc tạo ra các mô hình cụ thể cho các lĩnh vực cụ thể trở nên nhanh chóng và dễ dàng hơn.
ChatGPT tích hợp ba công nghệ trí tuệ nhân tạo mới nổi: LLM, chatbot (trợ lý ảo), và học tăng cường với sự tham gia của con người. Mỗi công nghệ này là kết quả của các cải tiến đáng kể riêng biệt trong vòng năm năm qua. Kết hợp lại, chúng cho phép ChatGPT chấp nhận yêu cầu bằng ngôn ngữ trò chuyện và tạo ra nội dung có vẻ như do con người tạo ra và có kiến thức. Theo OpenAI, ChatGPT có thể “trả lời các câu hỏi tiếp theo, thừa nhận lỗi của nó, thách thức các giả thiết sai lầm và từ chối các yêu cầu không thích hợp.” Tuy nhiên, khi đến việc thực hiện các cuộc trò chuyện có ý nghĩa, thực tế là ChatGPT có ít sự kiên nhẫn với ngữ cảnh.
Kể từ khi công bố dịch vụ đột phá này, truyền thông xã hội, các phương tiện truyền thông, doanh nghiệp, chính trị gia và giáo viên đã nói nhiều về các khả năng của nó – và các nguy cơ đi kèm – từ việc tạo ra mã máy tính đến viết luận cho học sinh trung học và đại học. Chắc chắn có nhiều ứng dụng cho các mô hình cơ sở trí tuệ nhân tạo như GPT, trong các lĩnh vực bao gồm tiếp thị, thị giác máy tính, kỹ thuật phần mềm và nghiên cứu và phát triển khoa học. Các mô hình cơ sở đã được sử dụng cho nhiều mục đích, bao gồm việc tạo ra:
- Nội dung văn bản cho tiếp thị
- Hình ảnh từ văn bản
- Mã máy tính từ ngôn ngữ tự nhiên
- Molekulin thuốc mới và giải mã chuỗi gen trong lĩnh vực chăm sóc sức khỏe
- Vật liệu mới với các tính chất cụ thể trong lĩnh vực khoa học vật liệu
Tuy nhiên, cách mà các mô hình này được xây dựng đồng nghĩa với việc LLMs – và các sản phẩm và dịch vụ sử dụng chúng – có những hạn chế rõ ràng trong việc ổn định, sai lầm trong quá trình suy luận và thực tế, khả năng hiểu bản ngữ cảnh đầy đủ, tính minh bạch, khả năng điều khiển, độ chệch và thiếu sự đảm bảo đáng kể. Hơn nữa, còn một vấn đề sâu xa về cách GPT và các LLM khác được xây dựng. Dựa trên lượng lớn dữ liệu mà không xem xét sự thật cơ bản, chúng có thể gây nguy hiểm. Khả năng của GPT tạo ra thông tin mà không thể dự đoán và sai lầm đồng nghĩa với việc đầu ra của nó chỉ có thể sử dụng trong tình huống mà kết quả được đánh giá một cách chủ quan hoặc sai lầm có thể được sửa chữa bởi con người. Ví dụ, nếu bạn yêu cầu ChatGPT “Viết một câu chuyện trước giờ ngủ cho một đứa trẻ ba tuổi về con thỏ,” nó sẽ cung cấp một câu trả lời hoàn toàn chấp nhận được, vì kết quả được đánh giá chủ quan. Tuy nhiên, để coi thuật toán của GPT có khả năng hiểu biết và thông minh giống con người là một sai lầm nghiêm trọng và đánh đốn. Góc nhìn hữu ích hơn là coi LLMs như ChatGPT là các công nghệ tiềm năng hữu ích cho việc thực hiện các nhiệm vụ cụ thể. Sự thành công sẽ phụ thuộc vào việc xác định các ứng dụng cho các công nghệ này mà mang lại lợi ích có ý nghĩa cho người dùng.
Các nhà cung cấp công nghệ nên thận trọng khi ChatGPT chỉ là một ví dụ trong nhiều đổi mới trong lĩnh vực trí tuệ nhân tạo và nên tránh bị mê hoặc bởi sự quảng cáo quanh nó, bởi vì công nghệ này có những hạn chế và điểm yếu. Thế hệ tiếp theo của GPT (GPT-4) đang đến – ChatGPT chỉ là một bước đầu. Thay vì chỉ là một phần mềm hữu ích mà các doanh nghiệp có thể tích hợp vào hoạt động của họ, ChatGPT thực chất là một cách cho OpenAI thử nghiệm và hoàn thiện sản phẩm của họ và chỉ ra tiềm năng của LLMs. Nó làm nổi bật các khả năng của công nghệ cơ bản bên dưới – trí tuệ nhân tạo cơ sở đa năng – nhưng không phải là một sản phẩm tiêu dùng. Thay vì cố gắng tích hợp ChatGPT vào sản phẩm và dịch vụ của họ, các nhà lãnh đạo sản phẩm của các công ty công nghệ nên tập trung vào hiểu rõ công nghệ cơ bản và ưu tiên phát triển kế hoạch riêng của họ cho trí tuệ nhân tạo tạo ra trong các trường hợp sử dụng kinh doanh có giá trị cao.