期刊文献+

基于序列比对方法的藏语人名实体消重研究

下载PDF
导出
摘要 在对网络藏语文本做信息抽取时,往往由于有很多藏族人具有同一个名字,使研究人员得不到期望的结果。为了解决这种"信息丢失问题",本论述在分析其产生原因的基础上,提出可采用生物学中序列比对的方法与社会网络分析方法中的图聚类算法相结合,对藏语人名进行消重。将人名实体的各个属性抽象成各个序列,进而通过各个序列的对比来统计出每两个相同人名的相似度,在通过社会网络分析方法中图聚类算法的决定该两个人名所表示的是否为同一个人,将表示同一个人的相同人名忽略,进而达到消重。
作者 于槐 于洪志
出处 《甘肃科技纵横》 2011年第1期108-109,共2页 Scientific & Technical Information of Gansu
  • 相关文献

参考文献6

  • 1Scott Miller,Michael Crystal,Heidi Fox,Lance Ramshaw,Richard Schwartz.ALGORITHMS THAT LEARN TO EXTRACT INFORMATIONBBN:DESCRIPtion OF THE SIFT SYSTEM AS USED FOR MUC-7.
  • 2Charles L.Wayne.Multilingual Topic Detection and Tracking:Successful Research Enabled by Corpora and Evaluation.
  • 3陈俊彬.Web信息抽取策略及其实现方法研究[J].科技情报开发与经济,2008,18(23):169-170. 被引量:4
  • 4侯丕勋.藏族风俗对甘肃洮西汉族地区的影响[J].中国藏学,1997(3):108-114. 被引量:3
  • 5张永 王瑞.生物信息学中的序列比对算法.电脑知识与技术,2008,(1):181-184.
  • 6Bagga A.Evaluation of coreferences and coreference resolu2tion systems//Rubio A,Gallardo N,Castro R,Tejada Aeds.Proceedings of the 1st International Conference on Lan2guage Resources and Evaluation.Granada:European Language Resources Association,1998:7892793.

二级参考文献2

  • 1HTMLparser [EB/OL].(2007-06-15). http://htmlparser.sourceforge. net/.
  • 2Heritrix Home Page [EB/OL]. (2007-06-10). http://erawler. archive.org/.

共引文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部