-
题名一个有效的基于GBRT的早期电影票房预测模型
被引量:12
- 1
-
-
作者
韩忠明
原碧鸿
陈炎
赵宁
段大高
-
机构
北京工商大学计算机与信息工程学院
食品安全大数据技术北京市重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2018年第2期410-416,共7页
-
基金
国家自然科学基金资助项目(61170112)
北京市自然科学基金资助项目(4172016)
国家教育部人文社会科学研究基金资助项目(13YJC860006)
-
文摘
电影票房预测是一个具有挑战性的问题,尤其是早期预测电影票房。基于社会媒体等预测方法存在准确度低、难以早期预测等问题,提出了一种基于GBRT模型的早期电影票房预测模型。对影响电影票房的因素进行特征化处理,选择包括演员、导演、上映日期以及公司等在内的九种因素,分别采用社会网络节点影响力度量法、平均票房权重区间化等不同的特征化方法;然后,生成34个特征作为影响电影票房的因变量,对特征与电影票房建立GBRT模型。选择2000—2015年间的1 875部电影以及相应的8 203名影人和3 300家公司进行了大量实验,实验结果表明该模型具有良好的预测效果,相对准确率达到80.6%,对部分2016年新电影进行预测,其误差在10%以内。
-
关键词
梯度回归树(GBRT)
电影早期因素
电影票房预测
影响力度量
-
Keywords
gradient boosting regression tree
early factors of film
box-office prediction
influence
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-