针对现有推荐模型忽略用户兴趣的动态变化,导致推荐精度较低等问题,提出一个基于用户行为的长短期序列推荐模型(long and short term sequence recommendation model based on user behavior,UBLSR)。在序列信息挖掘部分设计一种多路空...针对现有推荐模型忽略用户兴趣的动态变化,导致推荐精度较低等问题,提出一个基于用户行为的长短期序列推荐模型(long and short term sequence recommendation model based on user behavior,UBLSR)。在序列信息挖掘部分设计一种多路空洞卷积网络,将网络扩展成多通路结构挖掘复杂的用户行为特征;将短期时间窗口内的序列行为和目标物品进行关联,通过自注意力网络动态地对用户短期兴趣进行建模;设计一种邻居用户表示方案,借助注意力机制关注邻域内有影响力的用户子集,对用户长期兴趣进行建模;将短期兴趣建模和长期兴趣建模的结果联合进行推荐预测。UBLSR模型在Gowalla、Movielens-1M两个数据集上进行实验,其结果表明,该模型优于其它基准模型,达到较为突出的性能。展开更多
微博文本特殊性的存在使得微博用户兴趣画像难以有效构建。为此,提出了一种集成算法--新词发现-双向长短期记忆网络-梯度提升算法。首先针对微博文本的非正式性,提出了一种基于支持度视角的新词发现(New Word Discovery, NWD)算法,发掘...微博文本特殊性的存在使得微博用户兴趣画像难以有效构建。为此,提出了一种集成算法--新词发现-双向长短期记忆网络-梯度提升算法。首先针对微博文本的非正式性,提出了一种基于支持度视角的新词发现(New Word Discovery, NWD)算法,发掘其中大量存在的网络用语以实现更加准确的分词及语义把握;其次,引入Simhash算法使得微博文本中的"信息过载"现象得到改观;再次,为改善微博文本的简洁性而引起的特征稀疏问题,采用双向长短期记忆网络(Bidirectional Long Short-term Memory,Bi-LSTM)模型提取博文语义特征;最后,通过融合微博用户静态特征训练梯度提升(extreme Gradient Boosting,XGBoost)模型,从而有效构建多粒度微博用户兴趣画像。实验结果表明,粗粒度(一级)兴趣标签模型NWD-Bi-LSTM和细粒度(二级)兴趣标签模型NWD-Bi-LSTM-XGBoost的宏平均F1值(Macroaverage F1 score, mF1)和受试者工作特征曲线下面积(Area Under ROC Crave, AUC)分别高达83.6%, 79.7%和70.4%,63.6%,相对于基准模型, NWD算法的集成使得模型的m F1值和AUC值均能提升3%~5%,其促进作用优于现有的新词发现方法。展开更多
文摘针对现有推荐模型忽略用户兴趣的动态变化,导致推荐精度较低等问题,提出一个基于用户行为的长短期序列推荐模型(long and short term sequence recommendation model based on user behavior,UBLSR)。在序列信息挖掘部分设计一种多路空洞卷积网络,将网络扩展成多通路结构挖掘复杂的用户行为特征;将短期时间窗口内的序列行为和目标物品进行关联,通过自注意力网络动态地对用户短期兴趣进行建模;设计一种邻居用户表示方案,借助注意力机制关注邻域内有影响力的用户子集,对用户长期兴趣进行建模;将短期兴趣建模和长期兴趣建模的结果联合进行推荐预测。UBLSR模型在Gowalla、Movielens-1M两个数据集上进行实验,其结果表明,该模型优于其它基准模型,达到较为突出的性能。
文摘微博文本特殊性的存在使得微博用户兴趣画像难以有效构建。为此,提出了一种集成算法--新词发现-双向长短期记忆网络-梯度提升算法。首先针对微博文本的非正式性,提出了一种基于支持度视角的新词发现(New Word Discovery, NWD)算法,发掘其中大量存在的网络用语以实现更加准确的分词及语义把握;其次,引入Simhash算法使得微博文本中的"信息过载"现象得到改观;再次,为改善微博文本的简洁性而引起的特征稀疏问题,采用双向长短期记忆网络(Bidirectional Long Short-term Memory,Bi-LSTM)模型提取博文语义特征;最后,通过融合微博用户静态特征训练梯度提升(extreme Gradient Boosting,XGBoost)模型,从而有效构建多粒度微博用户兴趣画像。实验结果表明,粗粒度(一级)兴趣标签模型NWD-Bi-LSTM和细粒度(二级)兴趣标签模型NWD-Bi-LSTM-XGBoost的宏平均F1值(Macroaverage F1 score, mF1)和受试者工作特征曲线下面积(Area Under ROC Crave, AUC)分别高达83.6%, 79.7%和70.4%,63.6%,相对于基准模型, NWD算法的集成使得模型的m F1值和AUC值均能提升3%~5%,其促进作用优于现有的新词发现方法。