期刊文献+

基于Bootstrap的领域命名实体标注方法设计

下载PDF
导出
摘要 针对领域命名实体识别过程中标注语料少、手工标注工作量大的问题,提出了一种基于Bootstrap的领域命名实体半监督标注方法,从少量种子实体出发,抽取上下文规则和词性特征,通过构建特征模板匹配符合规则的新实体,以最长匹配原则对无标注文本进行实体反标获得自动化标注的语料库,最后利用人工校验方法实现标注数据的检查和纠正。实验表明,该方法能够有效提高领域命名实体标注的效率,具有良好的适用性。
机构地区 中国人民解放军
出处 《信息系统工程》 2021年第10期78-80,共3页
  • 相关文献

参考文献5

二级参考文献96

  • 1韩京宇,胡孔法,徐立臻,董逸生.一种在线数据清洗方法[J].应用科学学报,2005,23(3):292-296. 被引量:2
  • 2刘奕群,张敏,马少平.面向信息检索需要的网络数据清理研究[J].中文信息学报,2006,20(3):70-77. 被引量:5
  • 3唐杰,梁邦勇,李涓子,王克宏.语义Web中的本体自动映射[J].计算机学报,2006,29(11):1956-1976. 被引量:98
  • 4Hon D B, Dewi V J.Duplicate record elimination in large data files[J].ACM Transactions on Database Sys- tem, 1995.
  • 5Lee M L, Lu H, Ling T W, et al.Cleaning data for mining and warehousing[C]//DEXA'99,1999.
  • 6Fan Wenfei.Extending dependencies with conditions for data cleaning[C]//8th IEEE International Conference on Computer and Information Technology, 2008 :185-190.
  • 7Eckerson W W.Data quality and the bottom line:achiev- ing business success through a commitment to high quality data[R].The Data Warehousing Institute,2002.
  • 8English L.Plain English on data quality: information quality management:the next frontier[J].DM Review Magazine, 2000.
  • 9Eppler M J, Algesheimer R, Dimpfel M.Quality criteria of content-driven websites and their influence on cus- tomer satisfaction and loyalty: an empirical test of an information quality framework[C]//Sth International Con- ference on Information Quality(IQ 2003 ), 2003 : 108-120.
  • 10Shilakes C C'Tylman J.Enterprise information portals[Z]. 1998.

共引文献101

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部