数据集:
daekeun-ml/naver-news-summarization-ko
此数据集是作者通过爬取Naver News( https://news.naver.com )来创建的自定义数据集,用于韩国自然语言处理模型的实践。
DatasetDict({
    train: Dataset({
        features: ['date', 'category', 'press', 'title', 'document', 'link', 'summary'],
        num_rows: 22194
    })
    test: Dataset({
        features: ['date', 'category', 'press', 'title', 'document', 'link', 'summary'],
        num_rows: 2740
    })
    validation: Dataset({
        features: ['date', 'category', 'press', 'title', 'document', 'link', 'summary'],
        num_rows: 2466
    })
})