数据集:
blinoff/kinopoisk
Kinopoisk电影评论数据集(TOP250和BOTTOM100排行榜)。
总共包含36,591条评论,时间跨度从2004年7月到2012年11月。
分布如下,根据3点情感评分尺度:
每个样本包含以下字段:
import pandas as pd
df = pd.read_json('kinopoisk.jsonl', lines=True)
df.sample(5)
@article{blinov2013research,
title={Research of lexical approach and machine learning methods for sentiment analysis},
author={Blinov, PD and Klekovkina, Maria and Kotelnikov, Eugeny and Pestov, Oleg},
journal={Computational Linguistics and Intellectual Technologies},
volume={2},
number={12},
pages={48--58},
year={2013}
}