期刊文献+

一种网络日志属性挖掘与分析方法 被引量:3

Method for mining and analyzing network log attribute
下载PDF
导出
摘要 提出一种基于LDA模型(latent Dirichlet allocation model)与主题知识库相结合的网络日志内容属性标注方法。IP知识库的建立首先需要对采集的网络日志进行数据预处理;然后基于统计学原理标注网络日志的时间类属性,利用IP地址库映射方法提取网络日志的地域类属性;最后采用一种基于LDA模型与主题知识库相结合的标注方法对网络日志的内容类属性进行挖掘。结果表明,该方法原理正确,对网络日志属性的挖掘具有较好的效果。 This paper proposed a method for labelling the content attribute of Web log based on latent Dirichlet allocation model and the theme knowledge base of the combination. Set up the IP address knowledge base depended on the Web log data preprocessing、labelling the time attribute of Web log based on principle of statistics、labelling the region attribute of Web log according to IP address base mapping method,further more,labelling the content attribute of Web log rely on the latent dirichlet allocation model and the theme knowledge base of the combination to data mining. The experimental results indicate that the principle of the method is correct and it has a better effect in Web log attributes mining,eventually set up the IP knowledge base.
出处 《计算机应用研究》 CSCD 北大核心 2017年第5期1410-1414,共5页 Application Research of Computers
基金 国家自然科学基金资助项目(61370139) 北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519) 北京市教委专项基金资助项目(PXM2016_014224_000067)
关键词 网络日志 日志属性 活跃期 地域属性 LDA模型 Web log log attributes active period region attribute LDA model
  • 相关文献

参考文献5

二级参考文献80

  • 1郭岩.基于网络用户行为的搜索引擎系统SISI[J].计算机工程,2004,30(16):9-11. 被引量:1
  • 2郭岩,白硕,杨志峰,张凯.网络日志规模分析和用户兴趣挖掘[J].计算机学报,2005,28(9):1483-1496. 被引量:62
  • 3余慧佳,刘奕群,张敏,茹立云,马少平.基于大规模日志分析的搜索引擎用户行为分析[J].中文信息学报,2007,21(1):109-114. 被引量:117
  • 4何婷婷,戴文华,焦翠珍.基于混合并行遗传算法的文本聚类研究[J].中文信息学报,2007,21(4):55-60. 被引量:11
  • 5谭松波,王月粉.中文文本分类语料库-TanCorpv1.0[EB/OL].(2007-08-29)[2008-01-20].http://www.searehforum:org.cn/tansongbo/corpus.htm.
  • 6刘耀庭.社交网络结构研究[D].杭州:浙江大学,2008.
  • 7叶弈乾 孔克勤.个性心理学[M].上海:华东师范大学出版社,1993.349,181.
  • 8Perkowitz M., Etzioni O.. Towards adaptive Web sites: Conceptual framework and case study. Artificial Intelligence, 2000, 118: 245~275.
  • 9Schechter S., Krishnan M., Smith M.D.. Using path profiles to predict HTTP requests. In: Proceedings of the 7th International World Wide Web Conference Computer, Networks and ISDN Systems, Brisbane, Australia, 1998, 30: 457~467.
  • 10Cooley R., Mobasher B., Srivastava J.. Data preparation for mining world wide Web browsing patterns. Knowledge and Information Systems, 1999, 1(1): 5~32.

共引文献208

同被引文献18

引证文献3

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部