数据集:
bigbio/bioasq_task_b
BioASQ语料库包含多个由生物医学专家进行注释的问答任务,包括是/否、事实型、列表型和摘要型问题。针对我们比较神经语言模型的目标,我们重点关注是/否问题(任务7b),将其他任务的包含留给未来的工作。每个问题都与一个参考文本配对,该文本包含来自PubMed摘要的多个句子以及一个是/否答案。我们使用官方的训练/开发/测试分割,共有670/75/140个问题。
请参阅《面向生物医学自然语言处理的领域特定语言模型预训练》
@article{tsatsaronis2015overview,
title = {
An overview of the BIOASQ large-scale biomedical semantic indexing and
question answering competition
},
author = {
Tsatsaronis, George and Balikas, Georgios and Malakasiotis, Prodromos
and Partalas, Ioannis and Zschunke, Matthias and Alvers, Michael R and
Weissenborn, Dirk and Krithara, Anastasia and Petridis, Sergios and
Polychronopoulos, Dimitris and others
},
year = 2015,
journal = {BMC bioinformatics},
publisher = {BioMed Central Ltd},
volume = 16,
number = 1,
pages = 138
}