数据集:

rajistics/million-headlines

语言:

en

计算机处理:

monolingual

大小:

1M<n<10M

语言创建人:

expert-generated

批注创建人:

no-annotation

源数据集:

original

许可:

cc0-1.0
英文

Million Headlines 数据集卡片

数据集概要

该数据集包含了一个周期长达十八年的新闻头条数据。数据来源于澳大利亚知名新闻机构ABC(澳大利亚广播公司)。

数据集结构

数据实例

每个实例包含一个整数用于表示日期,以及一个字符串用于表示新闻头条。

数据字段

  • 发布日期:表示日期的整数
  • 头条:新闻头条的字符串

个人和敏感信息

该数据集不包含作者或众包工作者的任何个人信息,但可能包含有关出现在头条中的人物的描述。

使用数据时的注意事项

数据的社会影响

该数据集仅代表澳大利亚的一个新闻服务,不应被视为所有新闻或头条的代表。

偏见讨论

新闻头条可能存在偏见,不应被视为中立。

许可信息

CC0: Public Domain