网络食品安全的歧义性消解算法

Disambiguation Algorithm Design and Implementation of Food Safety Issues in Network

下载PDF

导出

摘要以网络食品安全信息为研究对象,旨在提出一个能够解决食品安全领域专有名词指代不明的歧义消解算法。文中采用的歧义消解算法是在改进的TF-IDF特征选择算法的基础上,结合了隐含马尔可夫模型(HMM)和SVM分类器,从而实现专有名词的歧义消解。提出了一个在TF-IDF的基础上增加两个加权因子的特征提取算法LN-TFIDF。实验表明,以202831条文本实验所得的准确率和召回率的调和平均值F1值为评价标准,设计的基于改进TFIDF的食品安全领域歧义消解算法的效果比基于传统TF-IDF的歧义消解算法平均提升了7.31%,且在不同时间抓取的实验数据集下,本算法的效果也相对稳定。 The article aimed to put forward a disambiguation algorithm which can correctly classify the unknown terms, based on the food safety information in network. The disambiguation algorithms used in this paper combines the hidden Markov model（HMM） and SVM classifier to achieve terminology disambiguation, based on the improved TF-IDF fea- ture selection algorithm. This paper proposed a new feature extraction algorithm LN-TF-IDF with two additional weighting factors on traditional TF-IDF. Experiments show that, the improved TF-1DF disamhiguation algorithm de- signed in the field of food safety enhances the effect of disambiguation by average 7. 31~ on the 202831 texts. It was compared with the traditional TF-IDF text feature selection algorithm, with the F-measure as evaluation criteria. At the same time, the effect of the algorithm is relatively stable on different experimental data sets obtained from different time.

作者刘金硕邓莹莹邓娟

机构地区武汉大学计算机学院武汉大学国际软件学院

出处《计算机科学》 CSCD 北大核心 2015年第B11期7-9,26,共4页 Computer Science

基金国家自然科学基金项目(61303214)资助

关键词食品安全歧义消解隐含马尔可夫模型 TF-IDF 支持向量机 Food safety, Disambiguation, HMM, TF-IDF, SVM

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1何径舟,王厚峰.基于特征选择和最大熵模型的汉语词义消歧[J].软件学报,2010,21(6):1287-1295. 被引量：37
2Pedersen T. A Decision Tree of Bigrams is an Accurate Predic- tor of Word Sense [C]//Proceedings of the Second Meeting of the North American Chapter of the Association for Computa- tional Linguistics(NAACL-01 ). Pittsburgh, PA, 2001.
3Hoffart J,Yosef M A, Bordino H, et al. Robust Disambiguation of Named Entities in Text[C] // Proceedings of the 2011 Con- ference on Empirical Methods in Natural Language Processing. Edinburgh, Scotland, UK,2011 : 782 792.
4李永亮,黄曙光,鲍蕾.一种基于PageRank算法和知网的词义消歧方法[J].计算机应用与软件,2011,28(5):213-215. 被引量：4
5Mena B H,van K M. A Hybrid Approach for Robust Multilin- gual Toponym Extraction and Disambiguation [C]//Interna- tional Conference on Language Processing and Intelligent Infor mation Systems. Warsaw, Poland, 2013.
6廖浩,李志蜀,王秋野,张意.基于词语关联的文本特征词提取方法[J].计算机应用,2007,27(12):3009-3012. 被引量：10
7平源.基于支持向量机的聚类及文本分类研究[D].北京:北京邮电大学,2012.

二级参考文献20

1赵林,胡恬,黄萱菁,吴立德.基于知网的概念特征抽取方法[J].通信学报,2004,25(7):46-54. 被引量：17
2刘明吉.基于协同演化的文本特征获取算法[J].计算机工程,2005,31(4):85-87. 被引量：3
3唐晓文.基于本体论的文本特征提取[J].电脑与信息技术,2005,13(1):36-38. 被引量：11
4王军.词表的自动丰富——从元数据中提取关键词及其定位[J].中文信息学报,2005,19(6):36-43. 被引量：40
5全昌勤,何婷婷,姬东鸿,余绍文.基于多分类器决策的词义消歧方法[J].计算机研究与发展,2006,43(5):933-939. 被引量：8
6刘风成,黄德根,姜鹏.基于AdaBoost.MH算法的汉语多义词消歧[J].中文信息学报,2006,20(3):6-13. 被引量：7
7庞景安.Web文本特征提取方法的研究与发展[J].情报理论与实践,2006,29(3):338-340. 被引量：17
8Rada Mihalcea,Paul Tarau,Elizabeth Figa.PageRank on Semantic Networks,with Application to Word Sense Disambiguatio[J].Morristown:Association for Computational Linguistics,2004.
9Li Li.Natural Language Processing utilize HowNet[D].Electrical technological university master dissertation,2004(Ch).
10Eneko Agirre,Aitor Soroa.Personalizing PageRank for WordSense Disambiguation[C] //Proceedings of the 12th Conference of the European Chapter of the ACL,2009:33-41.

共引文献54

1周婷婷,慕德俊,袁源,周菁.基于Adaboost的电子邮件分类算法[J].机电一体化,2009,15(8):92-94.
2徐建民,刘清江,付婷婷,戴旭.基于量化同义词关系的改进特征词提取方法[J].河北大学学报（自然科学版）,2010,30(1):97-101. 被引量：5
3王厚峰.计算语言学歧义消解研究——兼介绍北京大学计算语言学教育部重点实验室[J].术语标准化与信息技术,2010(3):25-28. 被引量：3
4徐建民,王金花,马伟瑜.利用本体关联度改进的TF-IDF特征词提取方法[J].情报科学,2011,29(2):279-283. 被引量：28
5申莹,徐东平,庞俊.基于概念的中文博客情感极性聚类分析[J].计算机系统应用,2011,20(8):72-75. 被引量：1
6郭剑毅,雷春雅,余正涛,苏磊,赵君,田维.基于信息熵的半监督领域实体关系抽取研究[J].山东大学学报（工学版）,2011,41(4):7-12. 被引量：3
7权文,王晓丹,王坚,张玉玺.基于SVM概率输出与证据理论的多分类方法[J].计算机工程,2012,38(5):167-169. 被引量：7
8张燕平,刘超,曲永花.WCBVSM与SACA结合的文本分类模型[J].计算机工程与应用,2012,48(11):137-142. 被引量：3
9张宜浩,金澎,孙锐.基于改进k-means算法的中文词义归纳[J].计算机应用,2012,32(5):1332-1334. 被引量：8
10吴双,张文生,徐海瑞.基于词间关系分析的文本特征选择算法[J].计算机工程与科学,2012,34(6):140-145. 被引量：3

1吴永建,袁德成,郭金玉.基于隐含马尔可夫模型的过程监视方法在TE过程中的应用[J].沈阳化工学院学报,2004,18(2):144-146. 被引量：1
2张润梅.基于影响图的Agent建模及其在Robocup中的应用[J].安徽建筑工业学院学报（自然科学版）,2004,12(2):27-29. 被引量：1
3李健,王作英.HMM转移概率的新的重估算法[J].电子学报,2001,29(z1):1833-1835. 被引量：5
4刘金硕,彭映月,章岚昕,陈煜森,邓娟.网络食品安全问题话题发现的LDA-K-means算法[J].武汉大学学报（工学版）,2017,50(2):307-310. 被引量：8
5刘万伟,周倜,李梦君,李舟军.一种基于进程代数的安全协议验证消解算法[J].计算机工程与科学,2006,28(7):14-16. 被引量：1
6杨显锋,尹亚光,袁敏.基于隐含马尔可夫模型网络的视频识别方法[J].电视技术,2007,31(10):74-75. 被引量：1
7刘显敏,李建中.高效的实体匹配结果消解算法[J].计算机研究与发展,2013,50(S1):239-247.
8成春晟.基于像素分析的轨迹异常车辆的识别法[J].电子测试,2012,23(6):29-34.
9祝常健,胡维平,叶佳宁.基于HMM语音识别技术在ARM平台的实现[J].微计算机信息,2009(35):143-145. 被引量：4
10王贺,冯谱.一种汉语语音网络搜索方法[J].山东理工大学学报（自然科学版）,2007,21(2):64-67.

计算机科学

2015年第B11期

浏览历史

内容加载中请稍等...

网络食品安全的歧义性消解算法

参考文献7

二级参考文献20

共引文献54

相关作者

相关机构

相关主题

浏览历史