您可以在 GEM Website 找到主数据卡片。
sportsett数据集是一个篮球领域的英文数据到文本数据集。输入是总结NBA比赛的统计数据,输出是对比赛的高质量自然语言描述。
您可以通过以下方式加载数据集:
import datasets
data = datasets.load_dataset('GEM/sportsett_basketball')
数据加载器可以在 here 中找到。
网站 论文 作者Craig Thomson,Ashish Upadhyay
@inproceedings{thomson-etal-2020-sportsett,
title = "{S}port{S}ett:Basketball - A robust and maintainable data-set for Natural Language Generation",
author = "Thomson, Craig and
Reiter, Ehud and
Sripada, Somayajulu",
booktitle = "Proceedings of the Workshop on Intelligent Information Processing and Natural Language Generation",
month = sep,
year = "2020",
address = "Santiago de Compostela, Spain",
publisher = "Association for Computational Lingustics",
url = "https://aclanthology.org/2020.intellang-1.4",
pages = "32--40",
}
联系人姓名 Craig Thomson
联系人邮箱c.thomson@abdn.ac.uk
是否有排行榜?否
否
覆盖方言美式英语
一种方言,一种语言。
覆盖的语言英语
语言归属美国体育记者
许可证mit: MIT许可证
预期用途维护一个强大且可扩展的数据到文本生成资源,具有结构化数据和文本摘要
主要任务数据到文本
交际目标对于训练在这个数据集上的模型,应该对篮球比赛的统计和其他信息进行概括。这将侧重于单个比赛,尽管在适当的情况下可以使用以往比赛的事实或多场比赛的总计统计数据进行比较。没有单一的常见叙述,尽管摘要通常以参与比赛的球员、时间、地点和比分开始。然后提供关于比赛差异(为什么获胜者获胜)的高层次评论。接下来是显著球员的统计数据分析,获胜队先列出。最后,通常会包括双方球队的即将到来的赛程。然而,还可以包括其他类型的事实和其他叙述结构。
学术
筹划组织阿伯丁大学,罗伯特·戈登大学
数据集创作者Craig Thomson,Ashish Upadhyay
资助EPSRC
谁将数据集添加到GEM中?Craig Thomson,Ashish Upadhyay
数据集中的每个实例都有五个字段。
"sportsett_id":这是在原始SportSett数据库中使用的唯一ID。它以训练集中的第一个实例为开始,并以测试集中的最后一个实例为结束,以'1'开头,以'6150'结束。
"gem_id":这是根据GEM的要求创建的唯一ID,遵循GEM-${DATASET_NAME}-${SPLIT-NAME}-${id}模式。
"game":此字段包含关于当前游戏的信息的字典。它具有有关游戏的日期,以及游戏进行的体育馆、城市和州的信息。
"teams":此字段是多个嵌套字典的字典。在最高级别上,它具有两个键:“home”和“vis”,分别提供主队和客队的统计数据。两者都是具有相同结构的字典。每个字典都包含团队的信息,例如团队的名称、当前赛季的总胜负情况、他们的会议排名,他们当前和以前比赛的SportSett id。除了这些一般信息外,它们还在游戏中为团队提供了框和线得分。框分是团队在比赛结束时的球员统计数据,而线分以及整个比赛统计数据被分为四分之一和半场,以及加时赛(如果有的话)。在这些分数之后,还有下一场比赛的字段,其中提供了有关下一场比赛的地点和对手名称的一般信息。
"summaries":这是每场比赛的摘要列表。某些比赛可能有多个摘要,这种情况下,列表将有多个条目。列表中的每个摘要是一个可以通过空格进行标记的字符串,遵循RotoWire-FG数据集的实践( Wang, 2019 )。
结构大部分遵循RotoWire数据集( Wiseman et. al. 2017 )中定义的原始结构,但进行了一些修改(例如game和next-game键),以解决输入和输出数据之间的信息差异问题( Thomson et. al. 2020 )。
如何选择标签?与RotoWire数据集( Wiseman et. al. 2017 )类似
示例实例{
"sportsett_id": "1",
"gem_id": "GEM-sportsett_basketball-train-0",
"game": {
"day": "1",
"month": "November",
"year": "2014",
"dayname": "Saturday",
"season": "2014",
"stadium": "Wells Fargo Center",
"city": "Philadelphia",
"state": "Pennsylvania",
"attendance": "19753",
"capacity": "20478",
"game_id": "1"
},
"teams": {
"home": {
"name": "76ers",
"place": "Philadelphia",
"conference": "Eastern Conference",
"division": "Atlantic",
"wins": "0",
"losses": "3",
"conference_standing": 15,
"game_number": "3",
"previous_game_id": "42",
"next_game_id": "2",
"line_score": {
"game": {
"FG3A": "23",
"FG3M": "7",
"FG3_PCT": "30",
"FGA": "67",
"FGM": "35",
"FG_PCT": "52",
"FTA": "26",
"FTM": "19",
"FT_PCT": "73",
"DREB": "33",
"OREB": "4",
"TREB": "37",
"BLK": "10",
"AST": "28",
"STL": "9",
"TOV": "24",
"PF": "21",
"PTS": "96",
"MIN": "4"
},
"H1": {
"FG3A": "82",
"FG3M": "30",
"FG3_PCT": "37",
"FGA": "2115",
"FGM": "138",
"FG_PCT": "7",
"FTA": "212",
"FTM": "18",
"FT_PCT": "8",
"DREB": "810",
"OREB": "21",
"TREB": "831",
"BLK": "51",
"AST": "107",
"STL": "21",
"TOV": "64",
"PTS": "3024",
"MIN": "6060"
},
"H2": {
"FG3A": "85",
"FG3M": "40",
"FG3_PCT": "47",
"FGA": "1615",
"FGM": "104",
"FG_PCT": "6",
"FTA": "66",
"FTM": "55",
"FT_PCT": "83",
"DREB": "96",
"OREB": "10",
"TREB": "106",
"BLK": "22",
"AST": "92",
"STL": "24",
"TOV": "68",
"PTS": "2913",
"MIN": "6060"
},
"Q1": {
"FG3A": "8",
"FG3M": "3",
"FG3_PCT": "38",
"FGA": "21",
"FGM": "13",
"FG_PCT": "62",
"FTA": "2",
"FTM": "1",
"FT_PCT": "50",
"DREB": "8",
"OREB": "2",
"TREB": "10",
"BLK": "5",
"AST": "10",
"STL": "2",
"TOV": "6",
"PTS": "30",
"MIN": "60"
},
"Q2": {
"FG3A": "2",
"FG3M": "0",
"FG3_PCT": "0",
"FGA": "15",
"FGM": "8",
"FG_PCT": "53",
"FTA": "12",
"FTM": "8",
"FT_PCT": "67",
"DREB": "10",
"OREB": "1",
"TREB": "11",
"BLK": "1",
"AST": "7",
"STL": "1",
"TOV": "4",
"PTS": "24",
"MIN": "60"
},
"Q3": {
"FG3A": "8",
"FG3M": "4",
"FG3_PCT": "50",
"FGA": "16",
"FGM": "10",
"FG_PCT": "62",
"FTA": "6",
"FTM": "5",
"FT_PCT": "83",
"DREB": "9",
"OREB": "1",
"TREB": "10",
"BLK": "2",
"AST": "9",
"STL": "2",
"TOV": "6",
"PTS": "29",
"MIN": "60"
},
"Q4": {
"FG3A": "5",
"FG3M": "0",
"FG3_PCT": "0",
"FGA": "15",
"FGM": "4",
"FG_PCT": "27",
"FTA": "6",
"FTM": "5",
"FT_PCT": "83",
"DREB": "6",
"OREB": "0",
"TREB": "6",
"BLK": "2",
"AST": "2",
"STL": "4",
"TOV": "8",
"PTS": "13",
"MIN": "60"
},
"OT": {
"FG3A": "0",
"FG3M": "0",
"FG3_PCT": "0",
"FGA": "0",
"FGM": "0",
"FG_PCT": "0",
"FTA": "0",
"FTM": "0",
"FT_PCT": "0",
"DREB": "0",
"OREB": "0",
"TREB": "0",
"BLK": "0",
"AST": "0",
"STL": "0",
"TOV": "0",
"PTS": "0",
"MIN": "0"
}
},
"box_score": [
{
"first_name": "Tony",
"last_name": "Wroten",
"name": "Tony Wroten",
"starter": "True",
"MIN": "33",
"FGM": "6",
"FGA": "11",
"FG_PCT": "55",
"FG3M": "1",
"FG3A": "4",
"FG3_PCT": "25",
"FTM": "8",
"FTA": "11",
"FT_PCT": "73",
"OREB": "0",
"DREB": "3",
"TREB": "3",
"AST": "10",
"STL": "1",
"BLK": "1",
"TOV": "4",
"PF": "1",
"PTS": "21",
"+/-": "-11",
"DOUBLE": "double"
},
{
"first_name": "Hollis",
"last_name": "Thompson",
"name": "Hollis Thompson",
"starter": "True",
"MIN": "32",
"FGM": "4",
"FGA": "8",
"FG_PCT": "50",
"FG3M": "2",
"FG3A": "5",
"FG3_PCT": "40",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "0",
"DREB": "1",
"TREB": "1",
"AST": "2",
"STL": "0",
"BLK": "3",
"TOV": "2",
"PF": "2",
"PTS": "10",
"+/-": "-17",
"DOUBLE": "none"
},
{
"first_name": "Henry",
"last_name": "Sims",
"name": "Henry Sims",
"starter": "True",
"MIN": "27",
"FGM": "4",
"FGA": "9",
"FG_PCT": "44",
"FG3M": "0",
"FG3A": "0",
"FG3_PCT": "0",
"FTM": "1",
"FTA": "2",
"FT_PCT": "50",
"OREB": "1",
"DREB": "3",
"TREB": "4",
"AST": "2",
"STL": "0",
"BLK": "1",
"TOV": "0",
"PF": "1",
"PTS": "9",
"+/-": "-10",
"DOUBLE": "none"
},
{
"first_name": "Nerlens",
"last_name": "Noel",
"name": "Nerlens Noel",
"starter": "True",
"MIN": "25",
"FGM": "1",
"FGA": "4",
"FG_PCT": "25",
"FG3M": "0",
"FG3A": "0",
"FG3_PCT": "0",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "0",
"DREB": "5",
"TREB": "5",
"AST": "3",
"STL": "1",
"BLK": "1",
"TOV": "3",
"PF": "1",
"PTS": "2",
"+/-": "-19",
"DOUBLE": "none"
},
{
"first_name": "Luc",
"last_name": "Mbah a Moute",
"name": "Luc Mbah a Moute",
"starter": "True",
"MIN": "19",
"FGM": "4",
"FGA": "10",
"FG_PCT": "40",
"FG3M": "0",
"FG3A": "2",
"FG3_PCT": "0",
"FTM": "1",
"FTA": "2",
"FT_PCT": "50",
"OREB": "3",
"DREB": "4",
"TREB": "7",
"AST": "3",
"STL": "1",
"BLK": "0",
"TOV": "6",
"PF": "3",
"PTS": "9",
"+/-": "-12",
"DOUBLE": "none"
},
{
"first_name": "Brandon",
"last_name": "Davies",
"name": "Brandon Davies",
"starter": "False",
"MIN": "23",
"FGM": "7",
"FGA": "9",
"FG_PCT": "78",
"FG3M": "1",
"FG3A": "2",
"FG3_PCT": "50",
"FTM": "3",
"FTA": "4",
"FT_PCT": "75",
"OREB": "0",
"DREB": "3",
"TREB": "3",
"AST": "0",
"STL": "3",
"BLK": "0",
"TOV": "3",
"PF": "3",
"PTS": "18",
"+/-": "-1",
"DOUBLE": "none"
},
{
"first_name": "Chris",
"last_name": "Johnson",
"name": "Chris Johnson",
"starter": "False",
"MIN": "21",
"FGM": "2",
"FGA": "4",
"FG_PCT": "50",
"FG3M": "1",
"FG3A": "3",
"FG3_PCT": "33",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "0",
"DREB": "2",
"TREB": "2",
"AST": "0",
"STL": "3",
"BLK": "0",
"TOV": "2",
"PF": "5",
"PTS": "5",
"+/-": "3",
"DOUBLE": "none"
},
{
"first_name": "K.J.",
"last_name": "McDaniels",
"name": "K.J. McDaniels",
"starter": "False",
"MIN": "20",
"FGM": "2",
"FGA": "4",
"FG_PCT": "50",
"FG3M": "1",
"FG3A": "3",
"FG3_PCT": "33",
"FTM": "3",
"FTA": "4",
"FT_PCT": "75",
"OREB": "0",
"DREB": "1",
"TREB": "1",
"AST": "2",
"STL": "0",
"BLK": "3",
"TOV": "2",
"PF": "3",
"PTS": "8",
"+/-": "-10",
"DOUBLE": "none"
},
{
"first_name": "Malcolm",
"last_name": "Thomas",
"name": "Malcolm Thomas",
"starter": "False",
"MIN": "19",
"FGM": "4",
"FGA": "4",
"FG_PCT": "100",
"FG3M": "0",
"FG3A": "0",
"FG3_PCT": "0",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "0",
"DREB": "9",
"TREB": "9",
"AST": "0",
"STL": "0",
"BLK": "0",
"TOV": "0",
"PF": "2",
"PTS": "8",
"+/-": "-6",
"DOUBLE": "none"
},
{
"first_name": "Alexey",
"last_name": "Shved",
"name": "Alexey Shved",
"starter": "False",
"MIN": "14",
"FGM": "1",
"FGA": "4",
"FG_PCT": "25",
"FG3M": "1",
"FG3A": "4",
"FG3_PCT": "25",
"FTM": "3",
"FTA": "3",
"FT_PCT": "100",
"OREB": "0",
"DREB": "1",
"TREB": "1",
"AST": "6",
"STL": "0",
"BLK": "0",
"TOV": "2",
"PF": "0",
"PTS": "6",
"+/-": "-7",
"DOUBLE": "none"
},
{
"first_name": "JaKarr",
"last_name": "Sampson",
"name": "JaKarr Sampson",
"starter": "False",
"MIN": "2",
"FGM": "0",
"FGA": "0",
"FG_PCT": "0",
"FG3M": "0",
"FG3A": "0",
"FG3_PCT": "0",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "0",
"DREB": "1",
"TREB": "1",
"AST": "0",
"STL": "0",
"BLK": "1",
"TOV": "0",
"PF": "0",
"PTS": "0",
"+/-": "0",
"DOUBLE": "none"
},
{
"first_name": "Michael",
"last_name": "Carter-Williams",
"name": "Michael Carter-Williams",
"starter": "False",
"MIN": "0",
"FGM": "0",
"FGA": "0",
"FG_PCT": "0",
"FG3M": "0",
"FG3A": "0",
"FG3_PCT": "0",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "0",
"DREB": "0",
"TREB": "0",
"AST": "0",
"STL": "0",
"BLK": "0",
"TOV": "0",
"PF": "0",
"PTS": "0",
"+/-": "0",
"DOUBLE": "none"
}
],
"next_game": {
"day": "3",
"month": "November",
"year": "2014",
"dayname": "Monday",
"stadium": "Wells Fargo Center",
"city": "Philadelphia",
"opponent_name": "Rockets",
"opponent_place": "Houston",
"is_home": "True"
}
},
"vis": {
"name": "Heat",
"place": "Miami",
"conference": "Eastern Conference",
"division": "Southeast",
"wins": "2",
"losses": "0",
"conference_standing": 1,
"game_number": "2",
"previous_game_id": "329",
"next_game_id": "330",
"line_score": {
"game": {
"FG3A": "24",
"FG3M": "12",
"FG3_PCT": "50",
"FGA": "83",
"FGM": "41",
"FG_PCT": "49",
"FTA": "29",
"FTM": "20",
"FT_PCT": "69",
"DREB": "26",
"OREB": "9",
"TREB": "35",
"BLK": "0",
"AST": "33",
"STL": "16",
"TOV": "16",
"PF": "20",
"PTS": "114",
"MIN": "4"
},
"H1": {
"FG3A": "69",
"FG3M": "44",
"FG3_PCT": "64",
"FGA": "2321",
"FGM": "1110",
"FG_PCT": "48",
"FTA": "106",
"FTM": "64",
"FT_PCT": "60",
"DREB": "35",
"OREB": "23",
"TREB": "58",
"BLK": "00",
"AST": "88",
"STL": "53",
"TOV": "34",
"PTS": "3228",
"MIN": "6060"
},
"H2": {
"FG3A": "45",
"FG3M": "22",
"FG3_PCT": "49",
"FGA": "1920",
"FGM": "1010",
"FG_PCT": "53",
"FTA": "85",
"FTM": "55",
"FT_PCT": "65",
"DREB": "612",
"OREB": "22",
"TREB": "634",
"BLK": "00",
"AST": "98",
"STL": "35",
"TOV": "36",
"PTS": "2727",
"MIN": "6060"
},
"Q1": {
"FG3A": "6",
"FG3M": "4",
"FG3_PCT": "67",
"FGA": "23",
"FGM": "11",
"FG_PCT": "48",
"FTA": "10",
"FTM": "6",
"FT_PCT": "60",
"DREB": "3",
"OREB": "2",
"TREB": "5",
"BLK": "0",
"AST": "8",
"STL": "5",
"TOV": "3",
"PTS": "32",
"MIN": "60"
},
"Q2": {
"FG3A": "9",
"FG3M": "4",
"FG3_PCT": "44",
"FGA": "21",
"FGM": "10",
"FG_PCT": "48",
"FTA": "6",
"FTM": "4",
"FT_PCT": "67",
"DREB": "5",
"OREB": "3",
"TREB": "8",
"BLK": "0",
"AST": "8",
"STL": "3",
"TOV": "4",
"PTS": "28",
"MIN": "60"
},
"Q3": {
"FG3A": "4",
"FG3M": "2",
"FG3_PCT": "50",
"FGA": "19",
"FGM": "10",
"FG_PCT": "53",
"FTA": "8",
"FTM": "5",
"FT_PCT": "62",
"DREB": "6",
"OREB": "2",
"TREB": "8",
"BLK": "0",
"AST": "9",
"STL": "3",
"TOV": "3",
"PTS": "27",
"MIN": "60"
},
"Q4": {
"FG3A": "5",
"FG3M": "2",
"FG3_PCT": "40",
"FGA": "20",
"FGM": "10",
"FG_PCT": "50",
"FTA": "5",
"FTM": "5",
"FT_PCT": "100",
"DREB": "12",
"OREB": "2",
"TREB": "14",
"BLK": "0",
"AST": "8",
"STL": "5",
"TOV": "6",
"PTS": "27",
"MIN": "60"
},
"OT": {
"FG3A": "0",
"FG3M": "0",
"FG3_PCT": "0",
"FGA": "0",
"FGM": "0",
"FG_PCT": "0",
"FTA": "0",
"FTM": "0",
"FT_PCT": "0",
"DREB": "0",
"OREB": "0",
"TREB": "0",
"BLK": "0",
"AST": "0",
"STL": "0",
"TOV": "0",
"PTS": "0",
"MIN": "0"
}
},
"box_score": [
{
"first_name": "Chris",
"last_name": "Bosh",
"name": "Chris Bosh",
"starter": "True",
"MIN": "33",
"FGM": "9",
"FGA": "17",
"FG_PCT": "53",
"FG3M": "2",
"FG3A": "5",
"FG3_PCT": "40",
"FTM": "10",
"FTA": "11",
"FT_PCT": "91",
"OREB": "3",
"DREB": "5",
"TREB": "8",
"AST": "4",
"STL": "2",
"BLK": "0",
"TOV": "3",
"PF": "2",
"PTS": "30",
"+/-": "10",
"DOUBLE": "none"
},
{
"first_name": "Dwyane",
"last_name": "Wade",
"name": "Dwyane Wade",
"starter": "True",
"MIN": "32",
"FGM": "4",
"FGA": "18",
"FG_PCT": "22",
"FG3M": "0",
"FG3A": "1",
"FG3_PCT": "0",
"FTM": "1",
"FTA": "3",
"FT_PCT": "33",
"OREB": "1",
"DREB": "2",
"TREB": "3",
"AST": "10",
"STL": "3",
"BLK": "0",
"TOV": "6",
"PF": "1",
"PTS": "9",
"+/-": "13",
"DOUBLE": "none"
},
{
"first_name": "Luol",
"last_name": "Deng",
"name": "Luol Deng",
"starter": "True",
"MIN": "29",
"FGM": "7",
"FGA": "11",
"FG_PCT": "64",
"FG3M": "1",
"FG3A": "3",
"FG3_PCT": "33",
"FTM": "0",
"FTA": "1",
"FT_PCT": "0",
"OREB": "2",
"DREB": "2",
"TREB": "4",
"AST": "2",
"STL": "2",
"BLK": "0",
"TOV": "1",
"PF": "0",
"PTS": "15",
"+/-": "4",
"DOUBLE": "none"
},
{
"first_name": "Shawne",
"last_name": "Williams",
"name": "Shawne Williams",
"starter": "True",
"MIN": "29",
"FGM": "5",
"FGA": "9",
"FG_PCT": "56",
"FG3M": "3",
"FG3A": "5",
"FG3_PCT": "60",
"FTM": "2",
"FTA": "2",
"FT_PCT": "100",
"OREB": "0",
"DREB": "4",
"TREB": "4",
"AST": "4",
"STL": "1",
"BLK": "0",
"TOV": "1",
"PF": "4",
"PTS": "15",
"+/-": "16",
"DOUBLE": "none"
},
{
"first_name": "Norris",
"last_name": "Cole",
"name": "Norris Cole",
"starter": "True",
"MIN": "27",
"FGM": "4",
"FGA": "7",
"FG_PCT": "57",
"FG3M": "2",
"FG3A": "4",
"FG3_PCT": "50",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "0",
"DREB": "1",
"TREB": "1",
"AST": "4",
"STL": "2",
"BLK": "0",
"TOV": "0",
"PF": "1",
"PTS": "10",
"+/-": "6",
"DOUBLE": "none"
},
{
"first_name": "Mario",
"last_name": "Chalmers",
"name": "Mario Chalmers",
"starter": "False",
"MIN": "25",
"FGM": "6",
"FGA": "9",
"FG_PCT": "67",
"FG3M": "2",
"FG3A": "2",
"FG3_PCT": "100",
"FTM": "6",
"FTA": "10",
"FT_PCT": "60",
"OREB": "0",
"DREB": "2",
"TREB": "2",
"AST": "4",
"STL": "4",
"BLK": "0",
"TOV": "0",
"PF": "1",
"PTS": "20",
"+/-": "18",
"DOUBLE": "none"
},
{
"first_name": "Shabazz",
"last_name": "Napier",
"name": "Shabazz Napier",
"starter": "False",
"MIN": "20",
"FGM": "2",
"FGA": "3",
"FG_PCT": "67",
"FG3M": "1",
"FG3A": "2",
"FG3_PCT": "50",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "0",
"DREB": "3",
"TREB": "3",
"AST": "4",
"STL": "2",
"BLK": "0",
"TOV": "1",
"PF": "4",
"PTS": "5",
"+/-": "11",
"DOUBLE": "none"
},
{
"first_name": "Chris",
"last_name": "Andersen",
"name": "Chris Andersen",
"starter": "False",
"MIN": "17",
"FGM": "0",
"FGA": "2",
"FG_PCT": "0",
"FG3M": "0",
"FG3A": "0",
"FG3_PCT": "0",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "1",
"DREB": "2",
"TREB": "3",
"AST": "0",
"STL": "0",
"BLK": "0",
"TOV": "0",
"PF": "2",
"PTS": "0",
"+/-": "6",
"DOUBLE": "none"
},
{
"first_name": "Josh",
"last_name": "McRoberts",
"name": "Josh McRoberts",
"starter": "False",
"MIN": "11",
"FGM": "1",
"FGA": "3",
"FG_PCT": "33",
"FG3M": "0",
"FG3A": "1",
"FG3_PCT": "0",
"FTM": "1",
"FTA": "2",
"FT_PCT": "50",
"OREB": "0",
"DREB": "3",
"TREB": "3",
"AST": "0",
"STL": "0",
"BLK": "0",
"TOV": "2",
"PF": "3",
"PTS": "3",
"+/-": "1",
"DOUBLE": "none"
},
{
"first_name": "James",
"last_name": "Ennis",
"name": "James Ennis",
"starter": "False",
"MIN": "7",
"FGM": "2",
"FGA": "3",
"FG_PCT": "67",
"FG3M": "1",
"FG3A": "1",
"FG3_PCT": "100",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "1",
"DREB": "1",
"TREB": "2",
"AST": "1",
"STL": "0",
"BLK": "0",
"TOV": "0",
"PF": "1",
"PTS": "5",
"+/-": "2",
"DOUBLE": "none"
},
{
"first_name": "Justin",
"last_name": "Hamilton",
"name": "Justin Hamilton",
"starter": "False",
"MIN": "5",
"FGM": "1",
"FGA": "1",
"FG_PCT": "100",
"FG3M": "0",
"FG3A": "0",
"FG3_PCT": "0",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "1",
"DREB": "1",
"TREB": "2",
"AST": "0",
"STL": "0",
"BLK": "0",
"TOV": "1",
"PF": "0",
"PTS": "2",
"+/-": "3",
"DOUBLE": "none"
},
{
"first_name": "Andre",
"last_name": "Dawkins",
"name": "Andre Dawkins",
"starter": "False",
"MIN": "1",
"FGM": "0",
"FGA": "0",
"FG_PCT": "0",
"FG3M": "0",
"FG3A": "0",
"FG3_PCT": "0",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "0",
"DREB": "0",
"TREB": "0",
"AST": "0",
"STL": "0",
"BLK": "0",
"TOV": "1",
"PF": "1",
"PTS": "0",
"+/-": "0",
"DOUBLE": "none"
},
{
"first_name": "Shannon",
"last_name": "Brown",
"name": "Shannon Brown",
"starter": "False",
"MIN": "0",
"FGM": "0",
"FGA": "0",
"FG_PCT": "0",
"FG3M": "0",
"FG3A": "0",
"FG3_PCT": "0",
"FTM": "0",
"FTA": "0",
"FT_PCT": "0",
"OREB": "0",
"DREB": "0",
"TREB": "0",
"AST": "0",
"STL": "0",
"BLK": "0",
"TOV": "0",
"PF": "0",
"PTS": "0",
"+/-": "0",
"DOUBLE": "none"
}
],
"next_game": {
"day": "2",
"month": "November",
"year": "2014",
"dayname": "Sunday",
"stadium": "American Airlines Arena",
"city": "Miami",
"opponent_name": "Raptors",
"opponent_place": "Toronto",
"is_home": "True"
}
}
},
"summaries": [
"The Miami Heat ( 20 ) defeated the Philadelphia 76ers ( 0 - 3 ) 114 - 96 on Saturday . Chris Bosh scored a game - high 30 points to go with eight rebounds in 33 minutes . Josh McRoberts made his Heat debut after missing the entire preseason recovering from toe surgery . McRoberts came off the bench and played 11 minutes . Shawne Williams was once again the starter at power forward in McRoberts ' stead . Williams finished with 15 points and three three - pointers in 29 minutes . Mario Chalmers scored 18 points in 25 minutes off the bench . Luc Richard Mbah a Moute replaced Chris Johnson in the starting lineup for the Sixers on Saturday . Hollis Thompson shifted down to the starting shooting guard job to make room for Mbah a Moute . Mbah a Moute finished with nine points and seven rebounds in 19 minutes . K.J . McDaniels , who suffered a minor hip flexor injury in Friday 's game , was available and played 21 minutes off the bench , finishing with eight points and three blocks . Michael Carter-Williams is expected to be out until Nov. 13 , but Tony Wroten continues to put up impressive numbers in Carter-Williams ' absence . Wroten finished with a double - double of 21 points and 10 assists in 33 minutes . The Heat will complete a back - to - back set at home Sunday against the Tornoto Raptors . The Sixers ' next game is at home Monday against the Houston Rockets ."
]
}
数据分割 根据不同的NBA赛季创建了这些分区。数据集中添加了常规赛(非季后赛)中的所有比赛
这个数据集在经典意义上包含了一个数据分析问题( Reiter, 2007 ) that is,有大量的数据需要提取洞察力。此外,洞察力既可以来自于简单的浅层查询(例如对主题的性质进行直接转录,即球员及其统计数据的属性),也可以来自于聚合的查询(球员随时间的表现)。数据方面的内容远远超出了实现的需要,并且实际上可能无法实现。这种数据分析问题的深度在其他数据集中不存在。
相似的数据集否
数据集衡量的能力可以使用此数据集衡量数据到文本系统的许多或全部方面。它具有复杂的数据分析、有意义的文档规划(包括具有叙述结构的10-15个句子的文档)以及微观规划和实现要求。找到可以处理这种大量数据的模型,并且能够对生成结果进行有意义的评估的方法是一个非常开放的问题。
否
是否进行了其他分割?否
有关数据集讨论,请参阅 Thomson et al, 2020
对于评估,请参阅:
对于使用SportSett的关系数据库形式的系统,请参阅:
对于最近使用Rotowire数据集的系统,请参阅:
可以使用此数据集衡量数据到文本系统的许多或全部方面。它具有复杂的数据分析、有意义的文档规划(包括具有叙述结构的10-15个句子的文档)以及微观规划和实现要求。找到可以处理这种大量数据的模型,并且能够对生成结果进行有意义的评估的方法是一个非常开放的问题。
评估指标BLEU
提出的评估BLEU是唯一常用的现成度量标准。一些工作还使用了自定义指标如RG( Wiseman et al, 2017 ),最近的一个共享任务探讨了其他指标及其与人类评估的相关性( Thomson & Reiter, 2021 )。
是否有先前的结果?是
其他评估方法大多数先前的结果使用原始的Rotowire数据集,该数据集存在训练/验证/测试集污染。有关在SportSett的关系数据库格式上使用BLEU和RG的结果,请参考 Thomson et al, 2020 作为指南。
相关的先前结果对于这个数据集的结果尚未多探索,与人类判断相关的合适指标的选择也是一个未经探索的问题。有关概述,请参阅Thomson等人的2021年论文( https://aclanthology.org/2021.inlg-1.23 ),有关编写时间( https://aclanthology.org/2021.inlg-1.25 )的最佳执行度量的论文。
引用文本取自现有的RotoWire-FG数据集( Wang, 2019 ),而该数据集又基于Rotowire( Wiseman et al, 2017 )。这个数据集的理念是重新组织数据,以便包含对多个比赛的统计聚合以及即将进行的比赛安排,将数据集从单个比赛的快照转变为几乎包含在参考文本中的所有内容都可以在数据中找到的格式。
交际目标创建一个篮球比赛的摘要,包含有关比赛、团队和球员的富有洞察力的事实,既涉及比赛内部的情况,也涉及比赛期间和整个赛季/职业生涯的情况(如果适用)。这是一个经典的数据到文本问题( Reiter, 2007 ),因为它既具有困难的数据分析阶段,又需要对选择的事实进行排序和转录。
来自不同来源是
来源细节RotoWire-FG( https://www.rotowire.com )Wikipedia( https://en.wikipedia.org/wiki/Main_Page )Basketball Reference( https://www.basketball-reference.com )
找到的
找到在哪里?多个网站
语言制作人没有
覆盖的主题NBA篮球比赛的摘要。
数据验证未验证
数据预处理保留了Wang 2019采用的原始分词方案
有过滤数据吗?手动
过滤条件选择了2014年到2018年赛季的比赛。在这些赛季中,没有对比赛进行筛选,所有比赛都包含在数据集中,但这是来自原始RotoWirte-FG数据集的任意解决方案。
无
注释服务?否
否
使用数据的理由数据集由现有数据集和公开可用的事实组成。
不太可能
PII的类别通用PII
是否进行了PII识别?没有识别
否
否
否
是
分析工作的链接和摘要不知道有任何工作,但这是一个仅由男子职业篮球比赛摘要组成的数据集。它不包括该运动的不同级别或不同性别的比赛,所有代词都很可能是男性,除非训练文本中具体提到了其他代词。这使得使用可以指定性别作为属性的系统变得困难,尽管这是一个有趣且开放的问题,可以使用此数据集进行研究。
语言制片商是否代表该语言?不代表,它非常明确地来自于体育新闻领域的美式英语。
所有与个人有关的信息都是公开记录。
公共领域
语言数据上的版权限制公共领域
SportSett解决了RotoWire的主要重叠问题,尽管无法避免一些重叠。例如,尽管不可能为所有球员查找完整的职业生涯总计和其他历史数据(数据仅追溯到2014年),但对于某些球员来说是可能的。不可避免的是,某些聚合的数据以其基本形式存在于先前的分区中。然而,基于赛季的分区方案对此进行了严格限制。
不适合的应用事实的准确性仍然是一个问题,系统可能会错误地表示比赛的事实。
不建议使用的用例使用RG指标最大化生成摘要中真实事实的数量不一定是必要的。