Tác giả: Tiến sĩ Tehseen Zia
Cập nhật vào ngày 4 tháng 4 năm 2024
Dự báo chuỗi thời gian đóng một vai trò quan trọng trong quyết định quan trọng trong các quy trình quyết định chính trong nhiều ngành công nghiệp như bán lẻ, tài chính, sản xuất và chăm sóc sức khỏe. Tuy nhiên, so với các lĩnh vực như xử lý ngôn ngữ tự nhiên và nhận dạng hình ảnh, việc tích hợp các kỹ thuật trí tuệ nhân tạo (AI) tiên tiến vào dự báo chuỗi thời gian đã diễn ra chậm chạp. Mặc dù AI cơ bản đã đạt được tiến bộ đáng kể trong các lĩnh vực như xử lý ngôn ngữ tự nhiên và nhận dạng hình ảnh, tác động của nó đối với dự báo chuỗi thời gian đã bị hạn chế cho đến gần đây. Tuy nhiên, hiện nay đã có sự tăng đà ngày càng trong việc phát triển các mô hình cơ bản được thiết kế đặc biệt cho việc dự báo chuỗi thời gian. Bài viết này nhằm mục đích đi sâu vào cảnh quan tiến hóa của AI cơ bản cho việc dự báo chuỗi thời gian, khám phá các tiến bộ gần đây trong lĩnh vực này. Tuy nhiên, trước khi đi sâu vào những tiến bộ này, hãy tóm tắt ngắn gọn về dự báo chuỗi thời gian và các ứng dụng của nó trong các ngành công nghiệp khác nhau.
Dự báo Chuỗi Thời gian và Các Ứng Dụng
Dữ liệu chuỗi thời gian đề cập đến một chuỗi các điểm dữ liệu được thu thập hoặc ghi lại tại các khoảng thời gian đều đặn. Loại dữ liệu này phổ biến trong nhiều lĩnh vực, như kinh tế, thời tiết, sức khỏe và nhiều hơn nữa. Mỗi điểm dữ liệu trong một chuỗi thời gian đều được đánh dấu thời gian, và chuỗi thường được sử dụng để phân tích xu hướng, mẫu mã và biến thể theo mùa qua thời gian.
Dự báo chuỗi thời gian liên quan đến việc sử dụng dữ liệu lịch sử để dự đoán các giá trị trong tương lai của chuỗi. Đây là một phương pháp quan trọng trong thống kê và học máy giúp đưa ra các quyết định có căn cứ dựa trên các mẫu quá khứ. Dự báo có thể đơn giản như việc dự đoán cùng tỷ lệ tăng trưởng vào tương lai hoặc phức tạp như sử dụng các mô hình AI để dự đoán các xu hướng tương lai dựa trên các mẫu phức tạp và các yếu tố bên ngoài.
Một số ứng dụng của dự báo chuỗi thời gian bao gồm:
- Thị trường Tài chính: Trong tài chính, dự báo chuỗi thời gian được sử dụng để dự đoán giá cổ phiếu, tỷ giá hối đoái và xu hướng thị trường. Các nhà đầu tư và nhà phân tích sử dụng dữ liệu lịch sử để dự báo các di chuyển tương lai và đưa ra quyết định giao dịch.
- Dự báo Thời tiết: Các cơ quan khí tượng sử dụng dữ liệu chuỗi thời gian để dự đoán điều kiện thời tiết. Bằng cách phân tích dữ liệu thời tiết trong quá khứ, họ dự báo các mẫu thời tiết tương lai, giúp trong việc lập kế hoạch và ra quyết định cho nông nghiệp, du lịch và quản lý thảm họa.
- Bán hàng và Tiếp thị: Các doanh nghiệp sử dụng dự báo chuỗi thời gian để dự đoán doanh số bán hàng, nhu cầu và hành vi của người tiêu dùng trong tương lai. Điều này giúp trong quản lý hàng tồn kho, thiết lập mục tiêu bán hàng và phát triển chiến lược tiếp thị.
- Ngành Năng lượng: Các công ty năng lượng dự báo nhu cầu và cung cấp để tối ưu hóa sản xuất và phân phối. Dự báo chuỗi thời gian giúp dự đoán các mẫu tiêu thụ năng lượng, cho phép quản lý năng lượng hiệu quả và lập kế hoạch.
- Chăm sóc Sức khỏe: Trong lĩnh vực chăm sóc sức khỏe, dự báo chuỗi thời gian được sử dụng để dự đoán sự bùng phát bệnh, lượng nhập viện của bệnh nhân và yêu cầu về hàng tồn kho y tế. Điều này hỗ trợ quá trình lập kế hoạch, sắp xếp nguồn lực trong ngành.
Các Mô hình Cơ sở Cho Chuỗi Thời Gian
Các mô hình AI cơ sở là những mô hình được đào tạo mạnh mẽ trước đó, tạo nên cơ sở cho các ứng dụng trí tuệ nhân tạo khác nhau. Chúng được đào tạo trên các bộ dữ liệu lớn và đa dạng, giúp chúng phân biệt các mẫu, kết nối và cấu trúc trong dữ liệu. Thuật ngữ “cơ sở” đề cập đến khả năng của chúng để được điều chỉnh hoặc sửa đổi cho các nhiệm vụ hoặc lĩnh vực với ít sự đào tạo bổ sung nhất có thể. Trong ngữ cảnh của dự báo chuỗi thời gian, các mô hình này được xây dựng tương tự như các mô hình ngôn ngữ lớn (LLMs), sử dụng kiến trúc transformer. Giống như LLMs, chúng được đào tạo để dự đoán yếu tố tiếp theo hoặc thiếu trong một chuỗi dữ liệu. Tuy nhiên, khác với LLMs, các mô hình chuỗi thời gian cơ sở xem chuỗi các điểm thời gian liên tục như là các token, cho phép chúng xử lý dữ liệu chuỗi thời gian theo trình tự.
Gần đây, đã có nhiều mô hình cơ sở được phát triển cho dữ liệu chuỗi thời gian. Với sự hiểu biết tốt hơn và việc lựa chọn mô hình cơ sở phù hợp, chúng ta có thể tận dụng các khả năng của chúng một cách hiệu quả và hiệu quả hơn. Trong các phần tiếp theo, chúng ta sẽ khám phá các mô hình cơ sở khác nhau có sẵn cho phân tích dữ liệu chuỗi thời gian.
- TimesFM: Phát triển bởi Google Research, TimesFM là một mô hình cơ sở chỉ có bộ giải mã với 200 triệu tham số. Mô hình được đào tạo trên một bộ dữ liệu gồm 100 tỷ điểm thời gian thực tế, bao gồm cả dữ liệu tổng hợp và thực tế từ các nguồn đa dạng như Google Trends và Wikipedia Pageviews. TimesFM có khả năng dự báo không cần dữ liệu thử nghiệm trong nhiều lĩnh vực, bao gồm bán lẻ, tài chính, sản xuất, chăm sóc sức khỏe và các ngành khoa học tự nhiên khác, trên các mức độ chi tiết thời gian khác nhau. Google dự định phát hành TimesFM trên nền tảng Google Cloud Vertex AI của mình, cung cấp các tính năng dự báo phức tạp cho khách hàng bên ngoài.
- Lag-Llama: Được tạo ra bởi các nhà nghiên cứu từ Đại học Montreal, Viện Trí tuệ Nhân tạo Mila-Québec và Đại học McGill, Lag-Llama là một mô hình cơ sở được thiết kế cho việc dự báo xác suất chuỗi thời gian một biến. Xây dựng trên nền tảng của Llama, mô hình sử dụng kiến trúc transformer chỉ có bộ giải mã, sử dụng các độ trễ thời gian và độ phân giải thời gian biến đổi cho việc dự báo. Mô hình được đào tạo trên các bộ dữ liệu chuỗi thời gian đa dạng từ nhiều nguồn khác nhau trong sáu nhóm khác nhau bao gồm năng lượng, giao thông, kinh tế, tự nhiên, chất lượng không khí và các hoạt động đám mây. Mô hình dễ dàng truy cập thông qua thư viện Huggingface.
- Moirai: Được phát triển bởi Salesforce AI Research, Moirai là một mô hình chuỗi thời gian cơ sở được thiết kế cho việc dự báo toàn diện. Moirai được đào tạo trên bộ dữ liệu Lưu trữ Chuỗi Thời gian Quy mô Lớn (LOTSA), chứa 27 tỷ quan sát từ chín lĩnh vực riêng biệt, tạo nên bộ sưu tập lớn nhất các tập dữ liệu chuỗi thời gian mở. Bộ dữ liệu đa dạng này cho phép Moirai học từ nhiều loại dữ liệu chuỗi thời gian, cho phép nó xử lý các nhiệm vụ dự báo khác nhau. Moirai sử dụng nhiều lớp chiều hình ảnh với kích thước patch để ghi lại các mẫu thời gian qua các tần số khác nhau. Một khía cạnh quan trọng của Moirai là sử dụng cơ chế chú ý đa biến, cho phép dự báo trên bất kỳ số biến số nào. Mã nguồn, trọng số mô hình và dữ liệu liên quan với Moirai có sẵn trong kho lưu trữ GitHub có tên là “uni2ts“.
- Chronos: Phát triển bởi Amazon, Chronos là một bộ sưu tập các mô hình xác suất được đào tạo trước cho việc dự báo chuỗi thời gian. Dựa trên kiến trúc transformer T5, các mô hình sử dụng một từ vựng gồm 4096 token và có các tham số biến thiên, từ 8 triệu đến 710 triệu. Chronos được tiền đào tạo trên một loạt rộng lớn các dữ liệu công cộng và tổng hợp được tạo ra từ các quy trình Gaussian. Chronos khác biệt với TimesFM ở chỗ đó là nó là một mô hình mã hóa-mã giải, cho phép trích xuất các nhúng của bộ mã hóa từ dữ liệu chuỗi thời gian. Chronos có thể dễ dàng tích hợp vào môi trường Python và truy cập thông qua API của nó.
- Moment: Được phát triển cộng tác bởi Đại học Carnegie Mellon và Đại học Pennsylvania, Moment là một họ mô hình chuỗi thời gian cơ bản mã nguồn mở. Nó sử dụng các biến thể của kiến trúc T5, bao gồm các phiên bản nhỏ, cơ sở và lớn, với mô hình cơ bản bao gồm khoảng 125 triệu tham số. Mô hình trải qua quá trình tiền đào tạo trên bộ dữ liệu “Time-series Pile” mở rộng, một bộ sưu tập đa dạng của các dữ liệu chuỗi thời gian công cộng trải rộng qua các lĩnh vực khác nhau. Khác với nhiều mô hình cơ bản khác, MOMENT được tiền đào tạo trên một phổ nhiệm vụ rộng lớn, tăng cường hiệu quả của nó trong các ứng dụng như dự báo, phân loại, phát hiện bất thường và điền dữ liệu. Toàn bộ kho mã Python và mã sổ tay Jupyter của nó được công khai để sử dụng mô hình.
Thay lời kết
Dự báo chuỗi thời gian là một công cụ quan trọng trong nhiều lĩnh vực, từ tài chính đến chăm sóc sức khỏe, giúp ra quyết định có căn cứ dựa trên các mẫu lịch sử. Các mô hình cơ sở tiên tiến như TimesFM, Chronos, Moment, Lag-Llama và Moirai cung cấp các khả năng tinh vi, tận dụng các kiến trúc transformer và các bộ dữ liệu đào tạo đa dạng để dự báo và phân tích chính xác. Những mô hình này cung cấp một cái nhìn về tương lai của phân tích chuỗi thời gian, trang bị doanh nghiệp và nhà nghiên cứu với các công cụ mạnh mẽ để điều hướng hiệu quả qua các cảnh quan dữ liệu phức tạp.