数据集:
debatelab/deepa2
这是一个不断增长的、精心策划的 deepa2 数据集收集,即包含对论证性文本进行全面逻辑分析的数据集。这个收集包含以下内容:
可以使用 deepa2 serve 工具将此收集中的数据渲染为文本到文本的示例。
对于为该数据集标注任务的每个任务,简要描述标签、指标和建议的模型(如果有的话,附带到其 HuggingFace 实现的链接)。对于未包括在结构化标签集中的任务,给出类似的描述(将 task-category-tag 替换为适当的 other:other-task-name)。
英语,将来将扩展到其他语言。
此收集包含以下 deepa2 数据集:
参见: https://github.com/debatelab/deepa2/tree/main/docs
参见: https://github.com/debatelab/deepa2/tree/main/docs
| feature | esnli | enbank | aifdb | aaac | argq | argkp | 
|---|---|---|---|---|---|---|
| source_text | x | x | x | x | x | x | 
| title | x | x | ||||
| gist | x | x | x | x | ||
| source_paraphrase | x | x | x | x | ||
| context | x | x | x | |||
| reasons | x | x | x | x | x | |
| conjectures | x | x | x | x | x | |
| argdown_reconstruction | x | x | x | x | ||
| erroneous_argdown | x | x | ||||
| premises | x | x | x | x | ||
| intermediary_conclusion | x | |||||
| conclusion | x | x | x | x | ||
| premises_formalized | x | x | x | |||
| intermediary_conclusion_formalized | x | |||||
| conclusion_formalized | x | x | x | |||
| predicate_placeholders | x | |||||
| entity_placeholders | x | |||||
| misc_placeholders | x | x | x | |||
| plchd_substitutions | x | x | x | 
每个子数据集包含三个划分:训练集、验证集和测试集。
许多 NLP 数据集专注于逻辑分析和论证重构相关的任务。此收集试图将这些资源统一在一个共同的框架中。
参见:子数据集
Gregor Betz, KIT; Kyle Richardson, Allen AI
我们根据其原始许可证重新分发导入的子数据集:
| Sub-dataset | License | 
|---|---|
| esnli | MIT | 
| aifdb | free for academic use ( 12311321 ) | 
| enbank | CC BY 4.0 | 
| aaac | CC BY 4.0 | 
| argq | CC BY SA 4.0 | 
| argkp | Apache | 
@article{betz2021deepa2,
      title={DeepA2: A Modular Framework for Deep Argument Analysis with Pretrained Neural Text2Text Language Models}, 
      author={Gregor Betz and Kyle Richardson},
      year={2021},
      eprint={2110.01509},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}