信息集成中的实体识别解决方案被引量：2

Resolution of Entity Identification in Information Intigration

下载PDF

导出

摘要分析了实体识别过程中存在的问题,并在基于本体的语义信息集成中模式异构和上下文异构已经得到解决的基础上,提出一个基于两阶段特征向量处理的解决方案来提高分布环境下实体识别的效率.最后针对实体识别中比较函数主要考虑英文字符串特点导致中文字符串精度较低的特点设计了一个基于公共子串的比较函数,实验证明该函数与基于编辑距离的比较函数比较,具有更高的查全率、查准率和更低的时间复杂度. Analyzed the problems existed in entity identification processing. On the basis of the schematic and xontext heterogeneity already being resolved a resolution of two-stage feature vector processing is proposed for increase of efficiency. Finallly, aimed at the problem that most of comparison functions in entity identification consider the main characteristic of English character string which lead to low precision in comparing Chinese character string, a function based on common substring is designed. Experiment had proven that this function compared with function based on the edition distance has a higher recall, the accuracy ratio and the lower time order of complexity.

作者周建芳徐海银卢正鼎

机构地区华中科技大学计算机学院

出处《小型微型计算机系统》 CSCD 北大核心 2009年第9期1774-1780,共7页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(50305007)资助

关键词实体识别信息集成特征向量公共子串比较函数 entity identification information integration feature vector common substring comparison funtion

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1周建芳,徐海银,卢正鼎.信息集成中语义异构问题研究[J].计算机应用研究,2008,25(8):2349-2351. 被引量：7
2周建芳,徐海银,卢正鼎.基于上下文仲裁的语义异构解决方案[J].计算机工程,2008,34(20):10-12. 被引量：2

二级参考文献11

1Goh C H. Context Interchange: New Features and Formalisms for the Intelligent Integration of Information[J]. ACM Transaction on Information Systems, 1999, 17(3): 270-293.
2Cui Zhan, Jones D, Brien O P. Issues in Ontology-based Information Integration[C]//Proc. of the IJCAI-01 Workshop on Ontologies and Information Sharing. Seattle, USA:[s. n.], 2001.
3An Yuan, Borgida A, Mylopoulos J. Inferring Complex Semantic Mappings Between Relational Tables and Ontologies from Simple Correspondences[C]//Proc. of Int. Conf. on Ontologies, Databases and Applications of Semantics. Agia Napa, Cyprus: [s. n.], 2005.
4Firat A. Information Integration Using Contextual Knowledge and Ontology Merging[D]. Cambridge, Massachusetts, USA: MIT Sloan School of Management, 2003.
5Zhu Hongwei, Madnick S E. Context Interchange as a Scalable Solution to Interoperating Amongst Heterogeneous Dynamic Services[C]//Proc. of the 3rd Workshop on eBusiness. Washington, D. C., USA: [s. n.], 2004.
6WACHE H,VGELE T,VISSER U,et al.Ontology-based integration of information:a survey of existing approaches[C]// Proc of the IJCAI2001 Workshop on Ontologies and Information Sharing.New York:IEEE Press,2001:108-118.
7PARK J,RAM S.Information systems interoperability:what lies beneath?[J].ACM Trans on Information Systems,2004,22(4):595-632.
8AYKUT F.Information integration using contextual knowledge and ontology merging[D].Cambridge:Massachusetts Institute of Technology,2003.
9ZHU Hong-wei,MADNICK S E.Context interchange as a scalable solution to interoperating amongst heterogeneous dynamic services[C]// Proc of the 3rd Workshop on eBusiness.Washington DC:[s.n.],2004:150-161.
10TEJADA S,KNOBLOCK C A,MINTON S.Learning domain-independent string transformation weights for high accuracy object identification[C]// Proc of the 8th ACM SIGKDD International Corference on Knowledge Discovering and Data Mining.New York:ACM Press,2002:350-359.

共引文献7

1周建芳,徐海银,卢正鼎.语义信息集成中基于等价类的上下文转换[J].小型微型计算机系统,2010,31(10):1937-1941. 被引量：3
2周建芳,丰洪才,李禹生.语义信息集成中格式异构解决方案[J].计算机工程与科学,2010,32(12):117-121. 被引量：2
3田雷.电子文件交换平台规范化设计研究[J].北京档案,2013(2):22-24. 被引量：6
4李伟,赵庆展,韩峰.需求驱动兵团空间数据本体语义的描述[J].测绘科学,2013,38(2):119-121. 被引量：1
5魏伟.基于REST的个性化数据重用方法[J].计算机与现代化,2013(5):215-218. 被引量：1
6晋芳华,刘鹏,钱兴华.语义级互操作的关键技术研究[J].舰船电子工程,2016,36(7):95-99. 被引量：6
7高明,陈正鸣,吕嘉.以用户为中心的异构数据集成方法[J].微处理机,2014,35(3):25-29.

同被引文献29

1赵作鹏,尹志民,王潜平,许新征,江海峰.一种改进的编辑距离算法及其在数据处理中的应用[J].计算机应用,2009,29(2):424-426. 被引量：51
2曹犟,邬晓钧,夏云庆,郑方.基于拼音索引的中文模糊匹配算法[J].清华大学学报（自然科学版）,2009(S1):1328-1332. 被引量：14
3车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：64
4陈迪,张森,李悛.基于模型的数据挖掘系统在大坝监控中的应用[J].微机发展,2005,15(11):84-86. 被引量：1
5宋小刚,李德仁,华锡生,黄红女.基于数据仓库技术的大坝资料分析与安全决策系统研究[J].河海大学学报（自然科学版）,2006,34(3):280-284. 被引量：7
6范立新.改进的中文近似字符串匹配算法[J].计算机工程与应用,2006,42(34):172-174. 被引量：8
7于国卿,王宗敏,何丽.ZPT水库大坝安全监测系统开发及应用[J].工程地球物理学报,2006,3(6):452-455. 被引量：4
8金永强,包腾飞.基于决策树的大坝安全监测数据挖掘[J].人民黄河,2007,29(2):72-73. 被引量：4
9韩秋明,李微,李华峰.数据挖掘技术应用实例[M].北京:机械工业出版社,2009.
10HanJ,KamberM数据挖掘:概念与技术[M].北京:机械工业出版社,2007.

引证文献2

1于国卿,汪自力,顾列亚.水闸安全监测数据挖掘中的数据预处理方法[J].南水北调与水利科技,2010,8(4):115-118. 被引量：6
2邵清,叶琨.基于编辑距离和相似度改进的汉字字符串匹配[J].电子科技,2016,29(9):7-11. 被引量：17

二级引证文献23

1李方平,吴楠,郭运华,胡艺川,王旭一,李新平.水电工程智能安全监测体系特征及发展趋势[J].人民长江,2021,52(S02):259-264. 被引量：7
2林日成,黄华丽,徐波.分析桥梁结构监测数据预处理方法及其应用[J].湖南交通科技,2014,40(4):105-107.
3关阳,金力,朱李凡.数据挖掘中的数据预处理问题分析[J].数字技术与应用,2015,33(8):200-200. 被引量：2
4戴翊飞,徐建良.一种基于过滤技术的字符串模糊匹配方法研究[J].电脑编程技巧与维护,2018(1):40-42. 被引量：2
5藏润强,孙红光,杨凤芹,冯国忠,尹良亮.基于Levenshtein和TFRSF的文本相似度计算方法[J].计算机与现代化,2018(4):84-89. 被引量：6
6李梁,谭薇,陈彦萍.电子医疗下支持数据持有性验证检索方案[J].计算机工程与应用,2018,54(16):93-100.
7张培根,黄树成.一种用于中文数据清洗的近邻排序算法[J].计算机应用与软件,2018,35(8):286-288. 被引量：8
8张衡,陈良育.Levenshtein算法优化及在题库判重中的应用[J].华东师范大学学报（自然科学版）,2018(5):154-163. 被引量：1
9李巧君,梁俊娟.农业机器人路径规划与实时定位系统——基于数据挖掘技术[J].农机化研究,2019,41(6):214-218. 被引量：3
10李凤生,钱名开,齐传富.大数据技术在水闸安全评价中的应用研究[J].水利信息化,2019(5):30-33. 被引量：5

1蔡维璇.时滞系统的指数稳定性问题[J].厦门大学学报（自然科学版）,1989,28(4):349-352.
2唐静笑,吕学强,柳成洋,李涵.用户查询意图的层次化识别方法[J].现代图书情报技术,2014(1):36-42. 被引量：1
3周建芳,徐海银,卢正鼎.信息集成中语义异构问题研究[J].计算机应用研究,2008,25(8):2349-2351. 被引量：7
4周建芳,徐海银,卢正鼎.语义信息集成中基于星型模型的上下文转换[J].小型微型计算机系统,2009,30(6):1038-1042. 被引量：3
5周建芳.语义信息集成中上下文仲裁器的设计与实现[J].小型微型计算机系统,2011,32(7):1418-1423.
6周建芳,徐海银,卢正鼎.信息集成中上下文知识的描述与推理[J].计算机工程与科学,2010,32(1):132-135. 被引量：1
7方勇,郑诚,姜磊.一种基于模糊技术的分类方法[J].计算机与现代化,2008(8):29-31.
8周建芳,丰洪才,李禹生.语义信息集成中格式异构解决方案[J].计算机工程与科学,2010,32(12):117-121. 被引量：2
9杨平,刘在英.基于相对链码和改进LCS算法的图形匹配实现[J].计算机与现代化,2013(12):106-109. 被引量：1
10周建芳.利用语义信息集成技术解决企业内部信息孤岛问题[J].武汉工业学院学报,2007,26(4):64-68. 被引量：1

小型微型计算机系统

2009年第9期

浏览历史

内容加载中请稍等...

信息集成中的实体识别解决方案被引量：2

参考文献2

二级参考文献11

共引文献7

同被引文献29

引证文献2

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

信息集成中的实体识别解决方案 被引量：2

参考文献2

二级参考文献11

共引文献7

同被引文献29

引证文献2

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

信息集成中的实体识别解决方案被引量：2