数据集:
GEM/ART
语言:
计算机处理:
unknown语言创建人:
unknown批注创建人:
automatically-created源数据集:
original其他:
reasoning许可:
您可以在 GEM Website 找到主数据卡片。
推理是推断出最合理解释的过程。例如,如果珍妮回到家发现房子一团糟,而且她记得她出门时留了个窗户开着,她可以假设是有小偷闯入她的房子并造成了这一混乱局面,因为这是最合理的解释。这个数据加载器专注于NLG的因果推理:在自然语言中解释给定的观察。
您可以通过以下方式加载数据集:
import datasets
data = datasets.load_dataset('GEM/ART')
数据加载器可以在 here 找到。
网址 论文 作者Chandra Bhagavatula (AI2), Ronan Le Bras (AI2), Chaitanya Malaviya (AI2), Keisuke Sakaguchi (AI2), Ari Holtzman (AI2, UW), Hannah Rashkin (AI2, UW), Doug Downey (AI2), Wen-tau Yih (AI2), Yejin Choi (AI2, UW)
@inproceedings{
Bhagavatula2020Abductive,
title={Abductive Commonsense Reasoning},
author={Chandra Bhagavatula and Ronan Le Bras and Chaitanya Malaviya and Keisuke Sakaguchi and Ari Holtzman and Hannah Rashkin and Doug Downey and Wen-tau Yih and Yejin Choi},
booktitle={International Conference on Learning Representations},
year={2020},
url={https://openreview.net/forum?id=Byg1v1HKDB}
}
联系人姓名 Chandra Bhagavatulla
联系人邮箱chandrab@allenai.org
有排行榜吗?否
否
支持的语言英文
使用语言源头Crowdworkers 在美国、加拿大、英国和澳大利亚的亚马逊 Mechanical Turk 平台上。
许可证apache-2.0: Apache 许可证2.0
预期的使用目的研究基于语言的诱因推理的可行性。训练和评估模型,以生成一个合理的假设来解释给定的两个观察。
主要任务推理
工业
策展组织Allen AI 研究所
数据集创建者Chandra Bhagavatula (AI2), Ronan Le Bras (AI2), Chaitanya Malaviya (AI2), Keisuke Sakaguchi (AI2), Ari Holtzman (AI2, UW), Hannah Rashkin (AI2, UW), Doug Downey (AI2), Wen-tau Yih (AI2), Yejin Choi (AI2, UW)
资金支持Allen AI 研究所
谁将数据集添加到 GEM?Chandra Bhagavatula (AI2), Ronan LeBras (AI2), Aman Madaan (CMU), Nico Daheim (RWTH Aachen University)
解释是由Crowdworkers使用数据集的创建者设计的自定义模板进行创作。
示例实例{
'gem_id': 'GEM-ART-validation-0',
'observation_1': 'Stephen was at a party.',
'observation_2': 'He checked it but it was completely broken.',
'label': 'Stephen knocked over a vase while drunk.'
}
数据拆分 推理是人类的重要能力,而ART是第一个用于研究基于语言的诱因推理的数据集。
类似的数据集否
该数据集衡量的能力模型能否对给定的一对观察进行诱因推理。
否
是否有额外的划分?否
模型能否对给定的一对观察进行诱因推理。
指标BLEU,BERT-Score,ROUGE
是否有先前的结果?否
否
众包
众包地点亚马逊 Mechanical Turk
语言生产者语言生产者为美国、加拿大、英国和澳大利亚的英语使用者。
涵盖的主题否
数据验证由众包工作者进行验证
是否对数据进行了过滤?算法过滤
过滤条件在 paper 中描述的对抗性过滤算法
自动创建的
注释服务?否
注释值每个观察与一系列 COMET ( https://arxiv.org/abs/1906.05317 ) 推理相关联
是否有质量控制?无
否
没有PII
不包含PII的理由数据集包含日常事件,不包含姓名、电子邮件、地址等信息。
否
否
否
否
无
公有领域
语言数据的版权限制公有领域