期刊文献+

基于搜索数据的用户基本属性混合预测模型研究

下载PDF
导出
摘要 大数据时代必然会导致"信息过载(information overload)"现象,企业如何在海量的用户行为数据中准确判断用户属性,是精准营销等领域值得思考的问题。特别是在搜索领域,搜索公司几乎无法获得用户的真实属性信息,但用户的基本属性很大程度上可以影响到用户查看不同广告的可能性。基于背景,利用Doc2Vec、TF-IDF算法对搜索数据进行特征提取,并借助机器学习算法、XGBoost算法构建了用户基本属性混合预测模型,并对模型的准确性进行了检验。
作者 权甜甜 王虎
出处 《现代商贸工业》 2018年第16期202-206,共5页 Modern Business Trade Industry
  • 相关文献

参考文献3

二级参考文献35

  • 1余正涛,樊孝忠,郭剑毅,耿增民.基于潜在语义分析的汉语问答系统答案提取[J].计算机学报,2006,29(10):1889-1893. 被引量:44
  • 2Baeza-Yates R,Ribeiro-Neto B.Modern Information Retrieval[M].New York:ACM press,1999.
  • 3Manning C D,Schütze H.Foundations of Statistical NaturalLanguage Processing [M].Cambridge:MIT press,1999.
  • 4Hwang M,Choi C,Youn B,et al.Word Sense Disambiguation Based on Relation Structure[C]∥International Conference on Advanced Language Processing and Web Information Technology.2008:15-20.
  • 5Wang X,Mccallum A,Wei X.Topical N-Grams:Phrase andTopic Discovery,with an Application to Information Retrieval [C]∥IEEE International Conference on Data Mining.IEEE Computer Society,2007:697-702.
  • 6Haruechaiyasak C,Jitkrittum W,Sangkeettrakarn C,et al.Im-plementing News Article Category Browsing Based on Text Categorization Technique [C]∥2008 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology.IEEE Computer Society,2008:143-146.
  • 7Mikolov T,Sutskever I,Chen K,et al.Distributed Representations of Words and Phrases and their Compositionality [J].Advances in Neural Information Processing Systems,2013,26:3111-3119.
  • 8Mikolov T,Chen K,Corrado G,et al.Efficient Estimation of Word Representations in Vector Space [C]∥ICLR 2013.2013.
  • 9Joachims T.A Probabilistic Analysis of the Rocchio Algorithm with TFIDF for Text Categorization [M].Springer US,1997:143-151.
  • 10Hinton G E.Learning distributed representations of concepts[C]∥Proceedings of CogSci.1986:1-12.

共引文献152

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部