期刊文献+

一种实体模式匹配算法 被引量:1

An Entity Schema Matching Algorithm
下载PDF
导出
摘要 提出了一种异构数据源的实体模式匹配算法.算法从中英双语的环境出发,利用基于中文wordnet的中英文词义相似度算法和中文分词工具,从列名距离、数据类型、数据内容的词性成份等角度来建立同类实体不同模式之间的映射关系.该算法可用于分析数据空间中不同数据源实体之间的关联,以及其他研究领域中的中英文语义信息相关性分析和实体模式匹配. An entity schema matching algorithm for heterogeneous data sources was proposed.Considering the Chinese-English bilingual environment,the algorithm used a semantic similarity algorithm based on Chinese wordnet and the Chinese lexical analysis system.And it established the mapping between different schema of similar entities by the factor of the distance from the column names,data types and the data content such as POS tagging.The algorithm was able to discover relationship between entities in different data resources of dataspace and other research for Chinese-English data semantic analysis and entity schema matching.
出处 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期50-56,共7页 Journal of Zhengzhou University:Natural Science Edition
基金 福建省科技计划重点项目 编号2008I0021 福建省自然科学基金资助项目 编号2009J01289
关键词 模式匹配 映射 相似度 schema matching mapping similarity
  • 相关文献

参考文献12

  • 1Erhard R, Philip A B. A survey of approaches to automatic schema matching[J]. VLDB Journal, 2001, 10(4) :334-350.
  • 2钱颖.发掘数据库模式间的复杂语义匹配[J].小型微型计算机系统,2008,29(5):817-824. 被引量:2
  • 3姜芳艽,孟小峰,贾琳琳.Deep Web集成服务的不确定模式匹配[J].计算机学报,2008,31(8):1412-1421. 被引量:14
  • 4Shvaiko P, Euzenat J. A survey of schema based matching approaches[J]. Journal on Data Semantics IV, 2005, 3730: 146-171.
  • 5Madhavan J, Bernstein P A, Rahm E. Generic schema matching with cupid[C]//Proc 27th Intl Conference on Very Large Databases (VLDB). Rome, 2001:49-58.
  • 6Melnik S, Garcia M H, Rahm E. Similarity flooding: a versatile graph matching algorithm[C]//Proceedings of the 18th International Conference on Data Engineering (ICDE). San Jose: C A, 2002 : 117-128.
  • 7Doan A, Domingos P, Halevy P. Reconciling schemas of disparate data sources: a machine learning approaeh[C]//Proceedings of the ACM SIGMOD Conference. California, 2001:509-520.
  • 8Do H H, Rahm E. COMA-A system for flexible combination of schema matching approaches[C]//Proceedings of the Very Large Data Bases Conference (VLDB). Hong Kong, 2001:610-621.
  • 9荀恩东,颜伟.基于语义网计算英语词语相似度[J].情报学报,2006,25(1):43-48. 被引量:41
  • 10吴思颖,吴扬扬.基于中文WordNet的中英文词语相似度计算[J].郑州大学学报(理学版),2010,42(2):66-69. 被引量:21

二级参考文献53

  • 1俞士汶.网上的基础语言信息资源[J].术语标准化与信息技术,2001(4):19-23. 被引量:2
  • 2俞士汶,段慧明,朱学锋.汉语词的概率语法属性描述[J].语言文字应用,2001(3):21-26. 被引量:6
  • 3荀恩东,颜伟.基于语义网计算英语词语相似度[J].情报学报,2006,25(1):43-48. 被引量:41
  • 4张承立,陈剑波,齐开悦.基于语义网的语义相似度算法改进[J].计算机工程与应用,2006,42(17):165-166. 被引量:38
  • 5周强 陈力为 等.一个人机互助的汉语语料库多级加工处理系统CCMP.计算语言学进展与应用[M].北京:清华大学出版社,1995.50.
  • 6Sebti A, Barfrous A A. A new word sense similarity measure in WordNet[C] //Proceedings of the International Multiconference on Computer Science and Information Technology. Washinton D C:IEEE Computer Society, 2008: 369-373.
  • 7Hirst G, St-Onge D. Lexical chains as representations of context for the detection and correction of malapropisms[M]// WordNet: an Electronic Lexical Database. Cambridge M A: MIT Press, 1998.
  • 8Resnik P. Using information content to evaluate semantic similarity in a taxonomy[C]//Proceedings of the 14th International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann Publishers Inc,1995: 448-453.
  • 9刘群 李素建.基《知网》的词汇语义相似度计算.计算语言学及中文信息处理,2002,7(2):59-59.
  • 10George A.Miller,Richard Beckwith,Christiane Fellbaum,Derek Gross,and Katherine Miller.Introduction to WordNet:An On-line Lexical Database[EB].Cognitive Science Laboratory,Princeton University,1993.51 ~ 57

共引文献204

同被引文献10

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部