期刊文献+

流量内容词语相关度的网络热点话题提取 被引量:1

Internet Popular Topics Extraction of Traffic Content Words Correlation
下载PDF
导出
摘要 针对网络舆情分析的需求,给出了网络热点话题定义及其形式化描述,分析了流量肉容中热点词语与热点话题的关系,提出了流量内容中热点词语的相关度计算算法.在此基础上,采用基于高密度连接区域的密度聚类方法得到热点词语簇,结合热点词簇相关的网页标题及网站地址信息,得出网络热点话题的属性描述.实验结果表明,该算法能够有效获取当前网络中的热点话题, Aiming at the requirements of network public feeling analysis,the formal definition and description of the popular topic on Internet is presented,the relationship between hot words and popular topics is analyzed,and finally a hotpoint words correlation computing approach for extracting popular topics on Internet is introduced in traffic contents.Based on that,DBSCAN(Density-Based Spatical Clustering of Application with Noise) clustering algorithm is adopted to extract popular topics and formalized results are given.The test results show that this method has an availability of 16.7% in extracting Internet popular topics,which,compared to web mining and TDT(Topic Detection and Tracking),can provide a more suitable data source for effective recovery of Internet public opinions.
出处 《西安交通大学学报》 EI CAS CSCD 北大核心 2007年第8期888-888,共1页 Journal of Xi'an Jiaotong University
基金 国家自然科学基金资助项目(60574087) 国家高技术研究发展计划资助项目(2003AA142060)
关键词 相关度 网络 词语 流量 提取 计算算法 形式化描述 聚类方法 popular topic on Internet network traffic content Internet public opinion analysis
  • 相关文献

同被引文献59

引证文献1

二级引证文献13

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部