The repo for ICME2019 via HuaHuaGuai.
数据头:uid, user_city, item_id, author_id, item_city, channel(作品来源), finish, like, music_id, device, time, duration_time(作品时长)
可以处理的特征工程:
- item_id: 统计好评率和完成率,计算播放量,并归一化处理;
- author_id: 统计该作者的视频数量并归一化处理,统计该作者视频的总播放量/平均播放量并归一化,统计该作者视频的平均好评率/完成率;
- user_city: 判断用户城市与作品城市是否相等,作为一个特征
- item_city: 考虑到网红城市的存在,可以用一系列指标来衡量某个城市的流行程度,统计某城市视频数量/总播放量/平均播放量/好评率/完成率;
- channel: 暂不进行特殊处理;
- finish, like: 暂时不进行处理;
- music_id: 统计bgm频次并归一化,对应视频的平均播放量/平均好评率/完成率;
- device: one-hot编码即可;
- time: 暂时不用此数据;
- duration_time: 归一化处理;
- uid: 暂时不确定。
数据头:gender, beauty, relative_position
- gender: 不进行处理;
- beauty: 不进行处理;
- relative_position: 暂不使用该特征;
数据头:title_features.txt
- 用简单神经网络做降维;
数据头:video_feature_dim_128
- 用简单神经网络做降维;
- 完全不考虑时间信息;
- 考虑时间信息做另一版;