从豆瓣电影网站随机爬取了2W名用户以及2W部电影,经数据清洗后剩余数据如下
用户 | 9,625 | 用户-电影 | 2,195,882 | |
电影 | 12,385 | 电影-导演 | 30,248 | |
导演 | 6,287 | 电影-演员 | 56,421 | |
演员 | 9,598 | 电影-类型 | 42,335 | |
类型 | 35 | |||
########################################################
actorOrder.csv | directorOder.csv | genreOder.csv 顺序代表其相应id
final_kg.dat 由电影数据构成的关系图
movieinfo.txt 电影数据信息(电影id、电影名、导演、演员、类型、时间、标签、星评、评分、相关电影、豆瓣ID、海报链接)
test.txt | train.txt 用户-电影评分数据,分为测试|训练数据