基于领域识别的主题模型观点挖掘研究被引量：1

Opinion mining research on topic model based on domain identification

下载PDF

导出

摘要网络新媒体的快速发展,使得网上评论数据呈现爆炸性增长,面对数量庞大的网络文本,使用传统的人工方式来提取观点会导致效率低下、分类界限模糊、领域适应性差等问题。为解决以上问题,在对传统LDA模型进行改进的基础上,提出了一个基于领域判别的LDA主题模型来对在线评论进行观点挖掘。首先,在标准LDA模型中引入领域层,对语料库中的文档采样领域标签,利用领域化的参数来求解LDA模型;其次,考虑到句子间的情感从属关系,在主题层和单词层之间加入情感层,并引入情感转移变量进行表示,提高了情感极性分析的精度,实验结果表明了本文所提模型和理论的有效性。 With the rapid development of new network media,the quantity of online reviews has a tendency of explosive growth.Traditional manual methods for opinion mining have some problems when dealing with tremendous online texts,such as low efficiency,fuzzy classification boundary,and limited domain-adaption ability.In order to solve the above problems,we improve the traditional latent Dirichlet allocation(LDA)model,and propose a LDA topic model based on domain identification for opinion mining of online reviews.Firstly,a domain layer is added to the standard LDA model to sample the domain tags of the document,and field parameters are utilized to solve the LDA model.Secondly,given the sentimental connection between sentences,we insert a sentiment layer between the topic layer and word layer.Sentimental transition variable is introduced to denote related characters,which can increase the accuracy of sentiment polarity analysis.Experimental results verify the validity of the proposed model and theory.

作者马长林闵洁谢罗迪 MA Chang-lin;MIN Jie;XIE Luo-di(School of Computer,Central China Normal University,Wuhan 430079;School of Information Engineering,Xinyang Agriculture and Forestry University,Xinyang 464000,China)

机构地区华中师范大学计算机学院信阳农林学院信息工程学院

出处《计算机工程与科学》 CSCD 北大核心 2019年第7期1297-1302,共6页 Computer Engineering & Science

基金国家自然科学基金(61003192)

关键词 LDA模型领域识别观点挖掘情感转移变量 LDA model domain identification opinion mining sentimental transition variable

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1李俊.面向产品评论的意见挖掘研究综述[J].现代计算机,2013,19(5):11-16. 被引量：7
2徐军,丁宇新,王晓龙.使用机器学习方法进行新闻的情感自动分类[J].中文信息学报,2007,21(6):95-100. 被引量：107
3王素格,李德玉,魏英杰.基于赋权粗糙隶属度的文本情感分类方法[J].计算机研究与发展,2011,48(5):855-861. 被引量：19
4王根,赵军.基于多重冗余标记CRFs的句子情感分析研究[J].中文信息学报,2007,21(5):51-55. 被引量：32

二级参考文献44

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2Yang Y, Pedersen J O. A comparative study on feature selection in text categorization [C] //Proc of the 14th Int Conf on Machine Learning. San Francisco, CA: Morgan Kaufmann, 1997:412-420.
3Pang B, Lee L, Vaithyanathan S. Thumbs up? sentiment classification using machine learning techniques [C] //Proc of the Conf on Empirical Methods in Natural Language Processing (EMNLP). Philadelphia, PA~ Association for Computaional Linguistics, 2002:79-86.
4Wang Suge, Wei Yingjie, Li Deyu, et al. A hybrid method of feature selection for Chinese text sentiment classification[C] //Proc of the 4th Int Conf on Fuzzy Systems and Knowledge Discovery. Los Alamitos, CA: IEEE Computer Society, 2007:435-439.
5Tan Songbo, Zhang Jin. An empirical study of sentiment analysis for Chinese documents [J]. Expert Systems with Application, 2008, 34(4):2622-2629.
6Turney P D, Littman M L. Measuring praise and criticism: inference of semantic orientation from association[J]. ACM Trans on Information Systems, 2003, 21 (4) : 315-346.
7Komorowski J, Pawlak Z, Polkowski L, et al. Rough Sets: A Tutorial [M]. Rough Fuzzy Hybridization: A New Trend in Decision Making. Berlin: Springer, 1999:3-98.
8Chouchoulas A, Shen Q. Rough set-aided keyword reduction for text categorization [J]. Applied Artificial Intelligence, 2001, 15(9): 843-873.
9Bao Yongguang, Aoyama Satoshi, Yamada Kazutaka, et al. A rough set based hybrid method to text categorization [C] // Proc of WISE'01. Los Alamitos, CA: IEEE Computer Society, 2001:254-261.
10Singh S, Dey L. A new customized document categorization scheme using rough memship [J]. Applied Soft Computing, 2005 (5):373-390.

共引文献154

1杨捷,范美位,罗成臣,张思路.面向电力工单文本的服务失误识别[J].云南大学学报（自然科学版）,2020,42(S02):32-37. 被引量：1
2李高翡,张洋,杨新凯,毛颖颖.基于集成学习的文本情感分析研究[J].计算机应用研究,2020,37(S01):50-51. 被引量：2
3王伟东,余华强,赵法信.基于Web的3D虚拟人智能导诊系统设计[J].湛江师范学院学报,2012,33(6):123-126. 被引量：6
4陈锦禾,范新,沈闻,沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,19(7):120-123. 被引量：9
5王素格,杨安娜,李德玉.基于汉语情感词表的句子情感倾向分类研究[J].计算机工程与应用,2009,45(24):153-155. 被引量：34
6邓忠莹,严馨,周历生,王卫东,常彦峰.基于文本倾向性分类技术的图书评价模型[J].昆明理工大学学报（理工版）,2009,34(4):121-124. 被引量：3
7白鸽,左万利,赵乾坤,曲仁镜.使用机器学习对汉语评论进行情感分类[J].吉林大学学报（理学版）,2009,47(6):1260-1263. 被引量：4
8李培,何中市,黄永文.基于依存关系分析的网络评论极性分类研究[J].计算机工程与应用,2010,46(11):138-141. 被引量：6
9周杰,林琛,李弼程.基于机器学习的网络新闻评论情感分类研究[J].计算机应用,2010,30(4):1011-1014. 被引量：27
10李纲,程洋洋,寇广增.句子情感分析及其关键问题[J].图书情报工作,2010,54(11):104-107. 被引量：16

同被引文献14

1邱瑾,张淑楠.基于数据挖掘的互联网众筹成功进度分位数回归模型[J].统计与信息论坛,2018,33(2):36-45. 被引量：7
2郭俊霞,郭仁飞,许南山,赵瑞莲.基于Session的Web应用软件EFSM模型构建方法研究[J].计算机科学,2018,45(4):203-207. 被引量：6
3王艳洁,范存群.Hadoop平台下加权马氏距离的Web大数据分析研究[J].电视技术,2018,42(11):67-71. 被引量：2
4张祥平,刘建勋,肖巧翔,石敏,曹步清.基于LDA和模糊C均值的Web服务多功能聚类[J].中南大学学报（自然科学版）,2018,49(12):2986-2992. 被引量：4
5毛国成,陈晓斌,王晅,李扬波.基于非线性泊松比修正的邓肯-张E-ν模型及应用研究[J].铁道科学与工程学报,2019,16(1):71-78. 被引量：5
6刘东亮,王军光,张洁,赵浩宇,赵蔚.基于知识单元挖掘的网络文库信息存储模型研究[J].情报学报,2020,39(2):171-177. 被引量：8
7管皓,秦小林,饶永生,曹晟.基于Web的动态几何软件领域模型及其应用[J].计算机应用,2020,40(4):1127-1132. 被引量：3
8张红斌,蒋子良,熊其鹏,武晋鹏,邬任重,袁天,姬东鸿.基于改进的有效区域基因选择与跨模态语义挖掘的图像属性标注[J].电子学报,2020,48(4):790-799. 被引量：3
9鲁城华,寇纪淞.基于用户和服务区域信息的个性化Web服务质量预测[J].管理科学,2020,33(2):63-75. 被引量：7
10李征宇,李贵,曹科研.针对隐藏Web数据库的Skyline查询方法研究[J].计算机科学与探索,2020,14(8):1307-1314. 被引量：3

引证文献1

1刘张榕.基于E-OEM模型的Web数据精准挖掘研究[J].微型电脑应用,2021,37(10):146-149. 被引量：3

二级引证文献3

1谢怡雯.数据挖掘技术在Web预取中的应用探究[J].科技资讯,2022,20(14):16-18.
2尚小晶.基于灰靶理论与云模型的能源物联网数据精准挖掘方法[J].物联网技术,2024,14(6):131-133.
3刘晓.基于E-OEM模型的高职生学习能力监控系统的设计与建设[J].电脑知识与技术,2024,20(13):69-71.

1李爽,裴昌帅.经济政策不确定性与资本结构非线性动态调整[J].财经论丛,2019(1):43-51. 被引量：7
2李湘东,阮涛.互信息特征选择法在《中图法》内容相似类目中的运用及改进——以E271和E712.51为例[J].数字图书馆论坛,2018(1):46-52. 被引量：2
3郭云飞,干加裙,张曼曼,胡锦慧,陈幼贞.前瞻记忆后效的加工机制:对自发提取观点和抑制观点的检验[J].心理科学,2019,42(2):280-286. 被引量：2
4武敏,张昕怡.新形势下公立医院面临的财务风险与应对策略研究[J].财经界,2018(22):121-122. 被引量：7
5以项目化学习实施社会实践活动的途径[J].广西教育,2018,0(32):60-60.
6尚戌.试析新时期计算机软件开发技术的应用及发展趋势[J].幸福生活指南,2018,0(13):0254-0254.
7耿晓利,陈淋.基于情感分析与LDA模型的在线用户满意度影响因素研究[J].微型电脑应用,2019,35(6):38-41. 被引量：3
8陈泽明.基于 LDA 主题模型的景区旅游形象情感分析[J].新丝路（中旬）,2019,0(3):0020-0022. 被引量：1
9曲昭伟,吴春叶,王晓茹.半监督自训练的方面提取[J].智能系统学报,2019,14(4):635-641. 被引量：7
10曾维新,赵翔,冯滔,唐九阳.面向领域的命名实体消歧方法改进研究[J].计算机工程与应用,2018,54(17):126-134. 被引量：3

计算机工程与科学

2019年第7期

浏览历史

内容加载中请稍等...

基于领域识别的主题模型观点挖掘研究被引量：1

参考文献4

二级参考文献44

共引文献154

同被引文献14

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于领域识别的主题模型观点挖掘研究 被引量：1

参考文献4

二级参考文献44

共引文献154

同被引文献14

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于领域识别的主题模型观点挖掘研究被引量：1