术语表

这些是与时间序列预测相关的一些关键概念,旨在帮助您更好地理解和利用TimeGPT的功能。

时间序列

时间序列是按时间索引的数据点序列,用于建模随时间变化的现象,例如股票价格、温度或产品销售。时间序列通常可以被认为由以下几个组成部分构成:

  • 趋势:数据的持续、长期方向,无论是向上还是向下。它反映了系列随时间的持续、总体变化。

  • 季节性:围绕已知和固定周期重复的周期。

  • 残差:在考虑趋势和季节性效应后,数据中留下的残余值或随机噪声。

预测

预测是基于历史数据预测时间序列未来值的过程。它在金融、医疗保健、零售和经济学等多个领域的决策过程中发挥了至关重要的作用。

预测可以使用多种方法,从统计方法到机器学习、深度学习和基础模型等新技术。这些模型可以根据用于进行预测的变量数量进一步分类为单变量模型和多变量模型,或者根据模型的应用范围分类为局部模型和全局模型,局部模型为每个系列独立估计参数,全局模型则跨多个系列联合估计参数。

预测本身可以作为点预测呈现,预测单个未来值,或者作为概率预测,提供未来值的完整概率分布,从而提供不确定性的度量。

基础模型

基础模型是指一种大型的、预训练的模型,可以适应多种任务,包括时间序列预测。最初为自然语言处理和计算机视觉等领域开发的基础模型现在越来越多地应用于时间序列等顺序数据。这些模型通常在大量数据集中进行训练,捕获复杂的模式和依赖关系,并可针对特定任务进行微调。

TimeGPT

由Nixtla开发的TimeGPT是第一个用于时间序列预测的基础模型。TimeGPT是在来自多个领域的公共数据集中训练的数十亿条观察值的基础上产生的,能够在无需额外训练的情况下为新的时间序列生成准确的预测,仅使用历史值作为输入。该模型以类似于人类阅读句子的方式“读取”时间序列数据——从左到右顺序读取。它观察过去数据的窗口,我们可以把它看作是“令牌”,然后预测接下来会发生什么。这个预测是基于模型在过去数据中识别的模式,并推断到未来。

令牌

TimeGPT将时间序列数据分块处理。序列中的每个数据点可以被视为一个“令牌”,类似于自然语言处理中如何处理单个单词或字符。

微调

微调是机器学习中的一种过程,其中像TimeGPT这样的预训练模型经过额外训练,以适应特定数据集。最初,TimeGPT可以以零样本方式运行,这意味着它可以直接生成预测。虽然这种零样本方法提供了一个稳固的基准,但通过微调通常可以改善TimeGPT的性能。在这个过程中,TimeGPT模型在特定数据集上进行额外训练,从预训练参数开始。更新后的模型随后生成预测。

了解如何微调TimeGPT

历史预测

历史预测,也称为样本内预测,是针对历史数据做出的预测。这些预测通常用于评估预测模型的性能,通过比较预测值与实际值来进行比较。

了解如何使用TimeGPT进行历史预测

异常检测

异常检测是指识别明显偏离预期数据行为的异常观察值的过程。异常,也称为离群值,可能由多种因素引起,例如数据收集过程中的错误、数据潜在模式的突然变化或意外事件。这些异常可能对许多预测模型构成挑战,因为它们可能扭曲趋势、季节模式或自相关的估计。因此,异常可能会显著影响预测的准确性。因此,能够准确识别它们至关重要。

异常检测在各个行业有许多应用,包括检测金融交易中的欺诈、监控在线服务的性能或识别能源使用中的异常模式。

了解如何使用TimeGPT检测异常

时间序列交叉验证

时间序列交叉验证是一种评估模型在历史数据上表现的方法。它通过定义滑动窗口跨越过去的观察,并预测其后的周期来工作。它与标准交叉验证不同,保持数据的时间顺序,而不是随机拆分。

这种方法通过考虑多个顺序周期,更准确地估算预测模型的预测能力。当仅使用一个窗口时,这种方法类似于标准的训练-测试拆分,最后一组观察值作为测试数据,所有之前的数据作为训练集。

了解如何使用TimeGPT进行交叉验证

外生变量

外生变量是可以影响时间序列行为的外部因素,但并不直接受到其影响。例如,在零售销售预测中,外生变量可能包括假期、促销、价格或电力负荷预测的天气数据。通过将这些变量纳入预测模型,可以捕捉目标序列与外部因素之间的关系,从而实现更准确的预测。

了解如何在TimeGPT中包含外生变量

Give us a ⭐ on Github