一种基于领域知识的特征提取算法被引量：2

A feature extraction algorithm based on domain knowledge

下载PDF

导出

摘要特征抽取是网络舆情分析中最重要的环节之一,优秀的特征抽取算法能够极大的提高舆情分析的效率和准确率.对旅游网络舆情进行分析和监管,能够及时发现云南旅游中的突发事件,可提供给相关部门以便迅速采取正确的应对方式,对云南的旅游业发展有很大的帮助,分析了传统特征抽取算法正确率低下、运行效率不高等方面的不足,将领域本体知识应用在旅游网络舆情分析的特征抽取算法之中,建立旅游网络舆情领域本体,根据领域本体优化特征抽取计算特征词权重,经过多次大数据量试验验证,优化后的方法显著提高了特征抽取的正确率和运行效率,证明基于领域知识的特征抽取的正确率和运行效率得到很大的提升. Feature extraction is one of the most important links in the analysis of public opinion while an excellent feature extraction algorithm can greatly improve the efficiency and accuracy of such analysis. The analysis and supervision of the public opinion on the tourism network can help the relevant departments discover the unexpected events in Yunnan and promptly adopt the correct approaches, which can help the healthy development of the tourism of Yunnan. This paper analyzes the low efficiency and inaccuracy of the traditional feature extraction algorithm, and then applies domain knowledge to the new feature extraction algorithm for the analysis of the public opinion on the tourism network. Through investigating and researching the information through inquiries and consulting with some experts, this paper builds a domain ontology for public opinion on the tourism network, and then extracts the weights of the feature words according to the domain ontology by optimizing the features. Several tests based on big data show the efficiency and accuracy of this feature extraction algorithm based on domain knowledge, which proves that domain knowledge has a very positive effect on the analysis of public opinion on the tourism network.

作者宋园园余建坤

机构地区云南财经大学信息学院

出处《云南民族大学学报（自然科学版）》 CAS 2017年第3期252-257,共6页 Journal of Yunnan Minzu University:Natural Sciences Edition

基金基金项目:云南省高校商务智能科技创新团队(42212217010)

关键词旅游网络舆情领域本体特征抽取权重 public opinion on the tourism network domain ontology feature extraction weights

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1陈瓅.领域本体构建技术概述[J].科技广场,2011(6):15-17. 被引量：3
2张天明,徐宝祥,江俞蓉,武慧娟.我国图书情报学科内领域本体的论文统计分析[J].情报科学,2013,31(8):90-93. 被引量：5
3王芙蓉.基于本体的数字图书馆语义检索模型的建立[J].河南图书馆学刊,2013,33(7):86-88. 被引量：3
4郑庆思,杨现民,余胜泉.泛在学习环境下学习资源的聚合研究[J].现代教育技术,2013,23(12):79-84. 被引量：29
5董坚峰,肖丽艳.旅游突发事件中的网络舆情预警研究[J].现代情报,2015,35(6):20-24. 被引量：24
6付业勤,郑向敏.旅游网络舆情研究体系建构研究[J].重庆工商大学学报（社会科学版）,2015,32(2):74-82. 被引量：8
7景丽萍,恽佳丽,于剑.领域知识在文本聚类应用中的机遇和挑战[J].计算机工程与科学,2010,32(6):88-91. 被引量：7

二级参考文献91

1张伟,高宏卿.RSS技术在网络远程教育中的应用[J].教育信息化,2006(17):76-77. 被引量：3
2张力.对RSS聚合个性化网络教育资源的探讨[J].中国医学教育技术,2006,20(6):512-515. 被引量：5
3Seibel J, Yu F, Foster R. Text Mining System for Web- Based Business Intelligence Applied to Web Site Server Logs: US Patent[P]. 2008.
4Salton G. Automatic Text Processing [M]. Boston: Addison- Wesley Longman Publishing Company, 1988.
5Steinbach M, Karypis G, Kumar V. A Comparison of Document Clustering Techniques[C]//Proc of the SIGKDD' 00, 2000:109-111.
6Goldszmidt M, Sahami M. A Probabilistic Approach to Full- Text Document Clustering [R]. Technical Report ITAD- 433-MS-98-044, SRI International, 1998.
7Gruber T. A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquisition, 1993,5 (2) : 199- 220.
8Hu J, Zhang X, Lu C, et al. Exploiting Wikipedia as External Knowledge for Document Clustering [C]//Proc of the ACM SIGKDD'09, 2009:389- 396.
9Huang A, Milne D, Frank E, et al. Clustering Documents Using a Wikipedia-Based Concept Representation[C]///Proc of the 13th PAKDD'09, 2009: 628-636.
10Brost W. Construction of Engineering Ontologies for Knowledge Sharing and Reuse: [Ph D Thesis][D]. Ensehede: University of Twente, 1997.

共引文献71

1孙博.昆明世博园2023年上半年网络舆情信息分析——兼谈旅游景区网络舆情的特点及工作思考[J].新媒体研究,2023,9(16):69-72.
2许土妹,李佳彤,曹慧妹.旅游突发事件中信息发布如何影响网络舆情——以海南为例[J].新媒体研究,2023,9(4):1-9.
3骆参驹.泛在学习环境下教育信息系统建设研究[J].教育观察,2021(2):106-108. 被引量：1
4董坚峰,付小琴.社交媒体时代旅游突发事件网络舆情生成机制及治理策略研究[J].传媒论坛,2023,6(19):14-17. 被引量：1
5王兰成,徐震.主题舆情分析中的语义Web文本分类研究[J].情报学报,2012,31(4):340-344. 被引量：6
6王静婷.基于语义相似度的Web文本分类研究[J].图书馆学研究,2012(9):64-69. 被引量：2
7郑宗良.基于改进DBSCAN算法的应急预案编制[J].计算机工程与科学,2012,34(9):149-153. 被引量：1
8马骏涛,黄文,宋欣,苏叶.用户情景感知——移动图书馆发展新方向[J].中华医学图书情报杂志,2013,22(5):20-24. 被引量：11
9陈晓美,王付国,吴宏伟,孙中秋.社会化网络评论观点挖掘的研究热点与应用进展[J].情报科学,2013,31(11):119-124. 被引量：9
10傅建木.财务管理领域本体的构建[J].湖北经济学院学报（人文社会科学版）,2013,10(11):61-63.

同被引文献20

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：327
2潘宇,林鸿飞.基于语义极性分析的餐馆评论挖掘[J].计算机工程,2008,34(17):208-210. 被引量：24
3陈黎飞,郭躬德,姜青山.自适应的软子空间聚类算法[J].软件学报,2010,21(10):2513-2523. 被引量：33
4张成功,刘培玉,朱振方,方明.一种基于极性词典的情感分析方法[J].山东大学学报（理学版）,2012,47(3):47-50. 被引量：52
5任海艳,陈飞翔.自适应遗传算法的改进及在曲线化简中的应用[J].计算机工程与应用,2012,48(11):152-155. 被引量：10
6毕志升,王甲海,印鉴.基于差分演化算法的软子空间聚类[J].计算机学报,2012,35(10):2116-2128. 被引量：18
7尹裴,王洪伟,郭恺强.中文产品评论的“特征观点对”识别:基于领域本体的建模方法[J].系统工程,2013,31(1):68-77. 被引量：16
8杜嘉忠,徐健,刘颖.网络商品评论的特征–情感词本体构建与情感分析方法研究[J].现代图书情报技术,2014(5):74-82. 被引量：35
9董丽丽,赵繁荣,张翔.基于领域本体、情感词典的商品评论倾向性分析[J].计算机应用与软件,2014,31(12):104-108. 被引量：19
10张莉,许鑫.产品评论中的隐式属性抽取研究[J].现代图书情报技术,2015(12):42-47. 被引量：9

引证文献2

1何有世,何述芳.基于领域本体的产品网络口碑信息多层次细粒度情感挖掘[J].数据分析与知识发现,2018,2(8):60-68. 被引量：8
2容会,沈江炎,韩珂,周祖坤,殷洪杰.一种基于海量高维数据的软子空间聚类改进算法[J].云南民族大学学报（自然科学版）,2018,27(2):125-128.

二级引证文献8

1黄茜,贺超城,李欣儒,吴江.后疫情时代下短租民宿用户购买行为研究——基于BERT衡量的网络口碑[J].知识管理论坛,2023(3):238-257.
2李吉,黄微,郭苏琳,孙悦.网络口碑舆情情感强度测度模型研究——基于PAD三维情感模型[J].情报学报,2019,38(3):277-285. 被引量：26
3邓斯予,耿骞,靳健,王锴,贾丹萍.基于产品评论分析的领域知识库构建与应用[J].情报理论与实践,2019,42(11):115-122. 被引量：4
4胡龙茂,胡学钢.基于多维相似度和情感词扩充的相同产品特征识别[J].山东大学学报（工学版）,2020,50(2):50-59. 被引量：2
5沈卓,李艳.基于PreLM-FT细粒度情感分析的餐饮业用户评论挖掘[J].数据分析与知识发现,2020,4(4):63-71. 被引量：13
6王连喜.基于“ 属性-情感词”汽车本体的文本情感分析[J].计算机技术与发展,2020,30(8):193-198.
7李磊,吴旭辉,刘继.融合关键对象识别与深层自注意力的Bi-LSTM情感分析模型[J].小型微型计算机系统,2021,42(3):504-509. 被引量：11
8徐德华,杨芷凌.在线产品评论文本情感倾向与评分相关性研究[J].图书情报导刊,2022,7(2):59-65. 被引量：1

1张学英.大数据环境下的网络舆情发展及控制分析[J].网络空间安全,2016,7(8):14-16. 被引量：2
2何忠育,王勇,王瑛,陈新,廖朝辉.基于分布式计算的网络舆情分析系统的设计[J].警察技术,2010(3):19-22. 被引量：6
3微软将对每台XP上网本收取15美元许可证费[J].电脑编程技巧与维护,2009(9):4-4.
4方玉萍,吴惠,杨立坤,罗敬,邱辉,侯昌东.遗传算法与文本特征选择方法相结合的研究[J].电脑知识与技术,2009,5(5):3489-3490.
5张明卫,张小旭,刘莹,韩春燕.面向主属性值的类标特征分析[J].东北大学学报（自然科学版）,2016,37(10):1388-1392.
6贾瑞玉,宁再早.粒子群优化覆盖算法[J].计算机工程,2011,37(21):167-169. 被引量：4
7许琦,张国庆,朱成兵,海朋洋.网络化制造环境下的信息服务平台研究[J].图书情报工作,2009,53(13):124-128. 被引量：2
8赵英男,杨静宇.一种改进的Gabor滤波器特征抽取算法及其应用[J].系统仿真学报,2005,17(9):2236-2238. 被引量：6
9“微信速度”创奇迹中国或将领跑新一代互联网[J].硅谷,2012(23).
10陈森昌,刘建华,黄树槐.挖掘专家知识[J].华中理工大学学报,1999,27(1):106-108. 被引量：4

云南民族大学学报（自然科学版）

2017年第3期

浏览历史

内容加载中请稍等...

一种基于领域知识的特征提取算法被引量：2

参考文献7

二级参考文献91

共引文献71

同被引文献20

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

一种基于领域知识的特征提取算法 被引量：2

参考文献7

二级参考文献91

共引文献71

同被引文献20

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

一种基于领域知识的特征提取算法被引量：2