数据集:

ett

英文

数据集卡片: Electricity Transformer Temperature

数据集概述

电力配送问题是根据连续使用情况将电力分配到不同地区的问题。但是,根据工作日、假日、季节、天气、温度等因素来预测特定地区的未来需求是困难的。然而,目前没有现有的方法能够基于超长期真实世界数据进行长期预测,并且具有高精度。任何错误的预测都可能损坏电力变压器。因此,目前在没有有效的电力使用预测方法的情况下,管理人员不得不根据经验数据做出决策,这比真实需求高得多。这导致了电力和设备折旧的不必要浪费。另一方面,油温可以反映变压器的状态。最有效的策略之一是预测电力变压器的油温是否安全,避免不必要的浪费。因此,为了解决这个问题,作者和北京国网富达科技发展公司提供了两年的数据。

具体而言,该数据集结合了短期周期模式、长期周期模式、长期趋势和许多不规则模式。数据集来自2个站点的2个电力变压器,以每小时或每15分钟的频率提供数据,包含2年×365天×24小时×(每15分钟4个)次= 17,520(15T为70,080)个数据点。

目标时间序列是油温,数据集以以下6个一元设置协变量提供:

  • 高使用负载
  • 高使用低负载
  • 中使用高负载
  • 中使用低负载
  • 低使用高负载
  • 低使用低负载

数据集使用

若要加载数据集的特定变体,请指定其名称,例如:

load_dataset("ett", "m1", multivariate=False) # univariate 15-min frequency dataset from first transformer

或者可以指定预测长度:

load_dataset("ett", "h2", prediction_length=48) # multivariate dataset from second transformer with prediction length of 48 (hours)

支持的任务和排行榜

时间序列数据被划分为 12/4/4 个月的训练/验证/测试集。给定预测长度(默认值:1天(24小时或24*4 15T),我们为验证/测试集创建了这个长度的滚动窗口。

time-series-forecasting univariate-time-series-forecasting

一元时间序列预测任务涉及在数据集的某些预测长度时间步骤中学习时间序列的未来一维目标值。可以通过验证集中的真实值和测试集来验证预测模型的性能。协变量存储在每个时间序列的feat_dynamic_real键中。

multivariate-time-series-forecasting

多元时间序列预测任务涉及学习数据集中时间序列的未来目标值的多元向量,时间步长为预测长度。与一元设置类似,可以通过验证集中的真实值和测试集来验证多元模型的性能。

语言

数据集结构

数据示例

下面是训练集的一个样本:

{
  'start': datetime.datetime(2012, 1, 1, 0, 0),
  'target': [14.0, 18.0, 21.0, 20.0, 22.0, 20.0, ...],
  'feat_static_cat': [0], 
  'feat_dynamic_real': [[0.3, 0.4], [0.1, 0.6], ...],
  'item_id': 'OT'
}

数据字段

对于一元规则时间序列,每个时间序列具有以下键:

  • start:数据集中每个时间序列的第一个条目的日期时间
  • target:实际目标值的浮点数数组
  • feat_static_cat:包含数据集中每个时间序列的分类标识符的无符号整数数组
  • feat_dynamic_real:可选的协变量特征数组
  • item_id:用于引用数据集中每个时间序列的字符串标识符

对于多元时间序列,目标是每个时间点的多元维度的向量。

数据拆分

时间序列数据被划分为 12/4/4 个月的训练/验证/测试集。

数据集创建

策划理由

开发可以根据超长期真实世界数据进行长期预测的时间序列方法,并具有高精度。

源数据

初始数据收集和归一化

[需要更多信息]

谁是源语言的生产者?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是注释者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

  • 周皓熠

许可信息

Creative Commons Attribution 4.0 International

引用信息

@inproceedings{haoyietal-informer-2021,
  author    = {Haoyi Zhou and
               Shanghang Zhang and
               Jieqi Peng and
               Shuai Zhang and
               Jianxin Li and
               Hui Xiong and
               Wancai Zhang},
  title     = {Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting},
  booktitle = {The Thirty-Fifth {AAAI} Conference on Artificial Intelligence, {AAAI} 2021, Virtual Conference},
  volume    = {35},
  number    = {12},
  pages     = {11106--11115},
  publisher = {{AAAI} Press},
  year      = {2021},
}

贡献

感谢 @kashif 添加此数据集。