关于 TimeGPT
TimeGPT 是一个生产就绪的生成预训练变换器,用于时间序列。它能够仅使用几行代码准确预测零售、电力、金融和物联网等各个领域。
它用户友好且低代码。用户只需上传他们的时间序列数据,就可以生成预测或检测异常,全部只需一行代码。
TimeGPT 是唯一一个可以通过我们的公共 API 使用的现成基础模型,支持通过 Azure Studio 作为 TimeGEN-1 或在您自己的基础设施上使用。
特性与能力
零-shot 推理:TimeGPT 可以直接生成预测并检测异常,无需提前训练数据。这使得任何时间序列数据能够立即部署并快速获得洞察。
微调:通过在您的特定数据集上微调模型,增强 TimeGPT 的能力,使模型能够适应您独特时间序列数据的细微差别,并提高定制任务的性能。
API 访问:通过我们健壮的 API 将 TimeGPT 无缝集成到您的应用中。即将支持 Azure Studio,将提供更多灵活的集成选项。或者,将 TimeGPT 部署到您自己的基础设施上,以保持对数据和工作流程的完全控制。
添加外生变量:结合可能影响您预测的额外变量,以提高预测准确性。(例如:特殊日期、事件或价格)
多系列预测:同时预测多个时间序列数据,优化工作流程和资源。
特定损失函数:通过从多种损失函数中选择,定制微调过程以满足特定性能指标。
交叉验证:实施现成的交叉验证技术,以确保模型的稳健性和可推广性。
预测区间:在预测中提供区间,以有效量化不确定性。
不规则时间戳:处理具有不规则时间戳的数据,适应非均匀间隔序列,无需预处理。
异常检测:自动检测时间序列中的异常,并使用外生特征以提高性能。
开始使用我们的 快速入门指南,了解不同功能的教程,并从我们的文档中的真实案例中学习。
架构
自注意力,这一由论文Attention is all you need提出的革命性概念,是本基础模型的基础。TimeGPT模型并不是基于任何现有的大型语言模型(LLM)。相反,它是独立于大量时间序列数据进行训练的,同时大型变压器模型的设计旨在最小化预测误差。
该架构由一个编码-解码结构组成,包含多个层,每层都有残差连接和层归一化。最后,一个线性层将解码器的输出映射到预测窗口的维度。总体直观是,基于注意力的机制能够捕捉过去事件的多样性,并正确推断潜在的未来分布。
为了进行预测,TimeGPT “阅读” 输入序列的方式类似于人类阅读句子——从左到右。它查看过去数据的窗口,我们可以把这些窗口视为“令牌”,并预测接下来会发生什么。这个预测基于模型在过去数据中识别出的模式,并将其外推到未来。
探索示例和用例
访问我们的全面文档,探索 TimeGPT 的广泛示例和实用用例。无论您是想要通过我们的 快速入门指南 开始使用,还是要 设置您的 API 密钥,或是寻找高级预测技术,我们的资源旨在指导您完成每一步。
学习如何处理 异常检测,使用特定损失函数 微调模型,以及使用 Spark、Dask 和 Ray 等框架扩展计算能力。
此外,我们的文档还涵盖了专业主题,例如处理 外生变量、通过 交叉验证 验证模型,以及使用 分位数预测 和 预测区间 在不确定性下进行预测。
Give us a ⭐ on Github