数据集:
electricity_load_diagrams
任务:
计算机处理:
monolingual大小:
1K<n<10K语言创建人:
found批注创建人:
no-annotation源数据集:
original许可:
该数据集包含了2011年至2014年期间葡萄牙370个客户的每小时总有功功率的时间序列数据。
数据集具有以下配置参数:
例如,您可以通过以下方式指定与论文中不同的自定义配置:
load_dataset("electricity_load_diagrams", "uci", rolling_evaluations=10)
注意:
数据集中没有缺失值。原始值以每15分钟为间隔的千瓦表示,并重新采样为每小时数据。每个时间序列代表一个客户。在2011年之后创建的一些客户的用电量被视为零。所有时间标签都参考葡萄牙时间,但每天都包含96个测量值(即24*4)。每年的三月份时间改变那天(只有23个小时),凌晨1点至2点之间的值为零。每年十月份时间改变那天(有25个小时),凌晨1点至2点之间的值是两个小时的用电量总和。
下面是训练集的一个样本:
{
'start': datetime.datetime(2012, 1, 1, 0, 0),
'target': [14.0, 18.0, 21.0, 20.0, 22.0, 20.0, 20.0, 20.0, 13.0, 11.0], # <= this target array is a concatenated sample
'feat_static_cat': [0],
'item_id': '0'
}
我们有两个配置uci和lstnet,具体如下。
时间序列被重新采样为每小时频率。我们在预测长度为24的7个滚动窗口上进行测试。
因此,对于uci配置,验证集的结束时间比每个时间序列的结束时间早24*7个时间步长。训练集的结束时间比验证集的结束时间早24个时间步长。
对于lsnet配置,我们将训练窗口分割为完整时间序列长度的0.6部分,验证集占完整时间序列长度的0.8部分,并将最后0.2部分的时间窗口作为测试集,其中每个滚动窗口包含24个时间步长。最后,参照LSTNet论文的做法,我们只考虑2012年至2014年期间有活动的时间序列,这给我们留下了320个时间序列。
对于这个单变量的规则时间序列,我们有:
根据频率(freq)和开始时间(start),我们可以为目标数组中的每个条目分配一个日期时间。
| name | train | unsupervised | test |
|---|---|---|---|
| uci | 370 | 2590 | 370 |
| lstnet | 320 | 2240 | 320 |
Electricity Load Diagrams 2011–2014 数据集由Artur Trindade开发,并在UCI机器学习数据库中共享。该数据集涵盖了葡萄牙370个变电站从2011年初到2014年底的电力负荷情况,采样周期为15分钟。我们将对其进行重新采样,转换为每小时时间序列。
研究和开发负荷预测方法,特别是短期电力预测。
该数据集涵盖了葡萄牙370个变电站在2011年初到2014年底的电力负荷情况,采样周期为15分钟。
具体数据收集和规范化过程[需要更多信息]
语言制作人员是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@inproceedings{10.1145/3209978.3210006,
author = {Lai, Guokun and Chang, Wei-Cheng and Yang, Yiming and Liu, Hanxiao},
title = {Modeling Long- and Short-Term Temporal Patterns with Deep Neural Networks},
year = {2018},
isbn = {9781450356572},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
url = {https://doi.org/10.1145/3209978.3210006},
doi = {10.1145/3209978.3210006},
booktitle = {The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval},
pages = {95--104},
numpages = {10},
location = {Ann Arbor, MI, USA},
series = {SIGIR '18}
}
感谢 @kashif 添加此数据集。