期刊文献+

篇章知识与逐级分类相结合的人物属性抽取方法研究 被引量:1

On the Method of Personal Attributes Extraction Based on Textual Knowledge and Hierarchical Classification
下载PDF
导出
摘要 人物属性抽取主要包括两个问题:属性识别和属性归属判定。属性识别主要是命名实体的识别,本文通过对分词软件的调整来完成;在属性归属判定中,本文突破目前主要在句子范围内进行统计操作的方式,提出以篇章知识为指导,从文本到句子逐级分类的人物属性抽取方法,该方法在CIPS-SIGHAN2014评测中F1值宽、严结果分别为0. 51与0. 49,为本次评测最好成绩。事实证明了该方法的有效性。 Personal attributes extraction mainly involves two aspects, attribute recognition and decision making on whether this attribute belongs to the extracted person.Personal attributes generally involve named entities recognition,which are realized by adjusting word segmentation software. Statistical analysis of attributes is currently made at the sentence level. By using the textual knowledge,we propose a personal attribute extraction method aiming at hierarchical classification from the text to the sentence. This method achieves 0.51 in the lenient evaluation results and 0.49 in the strict evaluation results of F1 Value in the CIPS-SIGHAN2014 Bakeoff respectively,which turns out to be the best. Therefore,it is proved that the method is effective.
作者 程南昌 邹煜 滕永林 侯敏 CHENG Nanchang;ZOU Yu;TENG Yonglin;HOU Min
机构地区 中国传媒大学
出处 《语言文字应用》 CSSCI 北大核心 2019年第1期125-134,共10页 Applied Linguistics
基金 国家语委十三五重点项目(ZDI135-4) 国家社科基金项目(16BXW023) 国家社科基金教育学重点招标项目(AFA170005)的阶段成果
关键词 篇章知识 逐级分类 命名实体识别 属性归属判定 指代消解 textual knowledge hierarchical classification named entity recognition attribute ownership decision anaphora resolution
  • 相关文献

参考文献5

二级参考文献105

  • 1李红亮,杨燕,尹红风,贾真.基于规则的百科人物属性抽取[J].集成技术,2013,2(3):1-4. 被引量:3
  • 2车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量:117
  • 3孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量:87
  • 4李向阳,戴江山,张亚非.一种Web信息抽取规则的优化方法[J].兰州理工大学学报,2006,32(1):90-93. 被引量:3
  • 5蒋龙,周明,简立峰.利用音译和网络挖掘翻译命名实体[J].中文信息学报,2007,21(1):23-29. 被引量:11
  • 6NIST. The ACE 2007 (ACE07) Evaluation Plan: Evaluation of the Detection and Recognition of ACE Entities, Values, Temporal Expressions, Relations, and Events [EB/OL]. [-2007]. http://www, hist. gov/ speech/tests/ace/2OOT/doc/aceOT-evalplan, vl. 3a. pdf.
  • 7Nancy A. Chinchor. Overview of MUC-7/MET-2[C]//Proceedings of the Seventh Message Under- standing Conference (MUC-7), Fairfax, Virginia, 1998.
  • 8Gina Anne Levow. The Third International Chinese Language Processing Bakeoff: Word Segmentation and Named Entity Recognition[C]//Proceedings of the Fifth SigHAN Workshop on Chinese Language Processing, Sydney: Association for Computational Lin- guistics, 2006:108 117.
  • 9A. Mikheev, C. Grover, Moens M. Description of the LTG System Used for MUC-7[C]//Proceedings of 7th Message Understanding Conference ( MUC-7 ), Fairfax, Virginia, 1998.
  • 10863计划中文信息处理与智能人机接口技术评测组.2004年度863计划中文信息处理与智能人机交互技术评测:命名实体评测结果报告[R].北京:863计划中文信息处理与智能人机接口技术评测组,2004.

共引文献183

同被引文献11

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部