Đây là một câu hỏi mà nhóm dự án đã nhận được từ không ít người sử dụng đặc biệt kể từ khi giới thiệu myGPT. Câu trả lời là có tuy nhiên việc này sẽ rất khó khăn bởi các lý do dưới đây:
Nó phụ thuộc vào nhiều yếu tố như độ phức tạp của mô hình, kích thước dữ liệu, tốc độ xử lý và bộ nhớ của hệ thống, cũng như yêu cầu thời gian đáp ứng và độ chính xác mong muốn.
Một số mô hình như Decision Trees hoặc Naive Bayes có thể được huấn luyện nhanh chóng và đáp ứng realtime với dữ liệu đầu vào nhỏ. Tuy nhiên, các mô hình phức tạp hơn như Neural Networks hoặc Deep Learning Models có thể yêu cầu nhiều thời gian để huấn luyện và xử lý dữ liệu đầu vào lớn hơn.
Để đảm bảo mô hình có đáp ứng realtime, cần thiết phải tối ưu hóa mô hình, tăng tốc độ xử lý và bộ nhớ của hệ thống, và tối ưu hóa thuật toán để đạt được độ chính xác mong muốn trong thời gian đáp ứng được cho phép. Các kỹ thuật như Threading, Parallel Computing và GPU Computing cũng có thể được sử dụng để tăng tốc độ huấn luyện và đáp ứng realtime của mô hình.
Như chúng ta đã biết, các dữ liệu được huấn luyện khi đưa lên mạng neuron của mô hình GPT thì khi chúng ta bổ sung thêm các neuron mới lên sẽ cần phải tính toán lại trọng số ảnh hưởng bất kể dữ liệu lớn hay nhỏ, việc này sẽ tạo nên sự bùng nổ tính toán và khó có hệ thống nào đáp ứng nổi nếu chúng ta làm realtime trong khi tính hợp lý giữa dữ liệu cũ và dữ liệu mới có thể chồng lấn và sai sót từ sự xử lý không đồng bộ của con người.
Chúng ta cũng đều biết rằng, kể cả mô hình của OpenIA huấn luyện hay các mô hình khác thì chúng cũng đều được triển khai theo đợt để đảm bảo tính nhất quán, đồng bộ của một lượt xử lý đồng thời có thể huy động sức mạnh tổng hợp của mạng lưới máy tính lớn nhằm thống kê và tính toán dữ liệu trước khi đưa vào mạng neuron.
Với myGPT câu trả lời là có, tuy nhiên chúng tôi sẽ không đưa dữ liệu realtime thực tế lên mô mình chứa kiến thức (pre-trained) mà sẽ huấn luyện cho mô hình biết rằng sẽ tồn tại các nguồn realtime để chỉ dẫn cho người dùng truy xuất chính xác các nguồn dữ liệu realtime đó khi có nhu cầu (ví dụ như các nguồn APIs hoặc các URL truy xuất tổng hợp).
Trong trường hợp có thay đổi về các chỉ dẫn của nguồn truy xuất bên ngoài thì mô hình sẽ cần được huấn luyện lại để được cập nhật.
Việc làm này đòi hỏi phải thiết kế riêng các mô hình cụ thể đồng thời phải làm việc trực tiết với các đơn vị thiết kế và lập trình sản sinh ra các nguồn dữ liệu realtime để trao đổi thông tin và ghép nối ứng dụng với nhau.
Hy vọng với những thông tin trên sẽ trả lời rõ các bạn về câu hỏi này!