期刊文献+

基于情感分类的竞争企业新闻文本主题挖掘 被引量:31

Mining News on Competitors with Sentiment Classification
原文传递
导出
摘要 【目的】在竞争情报分析中,改进新闻报道信息主题识别效率,降低情报搜集成本,提升分析的即时性。【应用背景】适用于企业竞争情报人员通过新闻媒体对企业自身和竞争对手的报道抓取和主题识别,及时感知重要动态。【方法】使用情感分析API对爬取的新闻报道数据做出分类,利用LDA识别主题,并进行可视化分析。采用Python完成数据采集、清洗、分析与可视化等流程。【结果】从共享单车新闻中,识别出正负面情绪的不同主题,并且找出对应的主要特征词汇。【结论】基于情感分类的主题挖掘方法有助于企业聚焦自身与竞争对手的主要优势与问题,可以改进环境扫描与竞争情报的时效性和准确性。 [Objective] This paper aims to improve the efficiency of topic modeling from news reports, and reduce the cost of competitive intelligence analysis. [Context] The proposed method could help competitive intelligence analysts accomplish environmental scanning tasks with the help of news reports. [Methods] First, we retrieved news stories with the help of a web crawler. Then, we categorized these articles based on a sentiment analysis API. Third, we identified and visualized news topics with the help of Latent Dirichlet Allocation method. We used Python to finish the data collection, cleansing, analyzing and visualizing jobs. [Results] We identified positive and negative sentiments as well as related keywords from news reports on the bike-sharing industry. [Conclusions] The proposed topic mining method based on sentiment analysis helps enterprises identify competitive advantages. It also improves the effectiveness of environmental scanning for competitive intelligence.
作者 王树义 廖桦涛 吴查科 Wang Shuyi;Liao Huatao;Wu Chake(School of Management, Tianjin Normal University, Tianjin 300387, Chin)
出处 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第3期70-78,共9页 Data Analysis and Knowledge Discovery
基金 国家社科基金青年项目"基于信息价格动态揭示的社交媒体用户隐私保护研究"(项目编号:15CTQ017) 天津师范大学杰出青年创新团队项目"数字化时代信息用户与信息行为研究"的研究成果之一
关键词 情感分类 主题挖掘 竞争情报 Sentiment Classification Topic Mining Competitive Intelligence
  • 相关文献

参考文献6

二级参考文献123

  • 1龙文,李祥全,吴义生,任守纲,王宁生.基于OWL的制药企业本体的构建及应用[J].计算机与应用化学,2005,22(9):787-792. 被引量:3
  • 2吴金红,张玉峰,王翠波.面向主题的网络竞争情报采集系统[J].现代图书情报技术,2006(12):54-57. 被引量:18
  • 3吴晓伟,徐福缘,宋文官.社会关系态势图在竞争对手分析中的应用[J].情报学报,2007,26(1):100-105. 被引量:15
  • 4姚天昉,彭思崴.汉语主客观文本分类方法的研究[C].第三届全国信息检索与内容安全学术会议论文集.北京:清华大学出版社,2007.
  • 5吴金红,张玉峰,王翠波.基于本体的竞争情报采集模型研究[J].情报理论与实践,2007,30(5):577-580. 被引量:13
  • 6林慧恩,林世平.中文情感倾向分析中主观句子抽取方法的研究[C]//全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第l届安全关键技术与应用学术会议论文集(上册).南宁:[出版者不详],2009:379-384.
  • 7Marc Ehrig and Alexander Maedche. Ontology Co- cused Crawling of Web Documents[C]. Proceedings of the ACM symposium on Applied computing , Mel- bourne, Florida, USA, 2003:1174-1178.
  • 8Lefteris Kozanidis. An Ontology-Based Focused Crawler[C]. NLDB, 2008:376-379.
  • 9David M.Blei, Andrew Y.Ng, and Michael I.Jordan. La- tent Dirichlet Allocation [J]. Journal of Machine Learning Research, 2003, (3):993-1022.
  • 10J.T. Chien and M.S.Wu. Adaptive Bayesian latent se- mantic analysis[C]. IEEE Transactions on Audio, Speech, and Language Processing, 2008, 16(1): 198 - 207.

共引文献114

同被引文献403

引证文献31

二级引证文献194

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部