期刊文献+

服务于内容侧面发现的框架识别

Frame Identification for Aspect Recognition
下载PDF
导出
摘要 文本内容通常包含多个侧面,全面地识别这些内容侧面对自然语言处理有重要地意义。传统的统计方法使用简单特征难以识别出所有的内容侧面。以自动摘要为例,传统的抽取式方法多以词频为主要特征,一些重要的句子常因重复度不高被舍弃。要想全面地覆盖原始文本的重要信息,就要识别出文本描述的内容侧面。该文以框架语义学为指导,使用FrameNet语料库作为知识库,综合多种特征来标注文本描述的框架,在此基础上识别文本所包含的内容侧面。该方法在新闻语料上取得了较好地结果,达到了61%的正确率。 Texts usually contain various aspects of information.In natural language processing,many tasks would benefit from the recognition of these aspects.For example,in the summarization task,traditional method of extracting sentences is mainly bases on features of words frequency.Those sentences of great importance would be ignored if they appear infrequently.Aspect recognition can remedy this understanding defect..In this paper,we use FrameNet corpus as ontology to annotate sentences based on lexical and syntactical features.The frame of the annotated sentence explains its aspect information.This method works well when tested on the news corpus and the precision of aspect recognition based on frame information can reach 61%.
出处 《中文信息学报》 CSCD 北大核心 2012年第2期51-55,61,共6页 Journal of Chinese Information Processing
基金 国家自然科学基金资助项目(60875042 90920011) 国家社会科学基金资助项目(10CYY023)
关键词 FrameNet语料库 内容侧面发现 框架识别 FrameNet aspect recognition frame identification
  • 相关文献

参考文献9

  • 1刘挺,吴岩,王开铸.自动文摘综述[J].情报科学,1998,16(1):63-69. 被引量:10
  • 2秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量:51
  • 3A.Nenkova,L. Vanderwende. The Impact of Frequency on Summarization[R]. Microsoft Research Technical Report.2005,MSR-TR-2005-101.
  • 4TAC 2010 Guided Summarization Task.
  • 5Jaime Carbonell,Jade Goldstein.The use of MMR,diversity-based reranking for reordering documents and producing summaries[C]//Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval(SIGIR '98).ACM,New York,NY,USA,1998,335-336.
  • 6Baker,Collin F.,Charles J. Fillmore,et al. The Structure of the Framenet Database[J].International Journal of Lexicography,2003,16(3):281-296.
  • 7Charles J.Fillmore.Frame semantics and the nature of language[J].Annals of the New York Academy of Sciences:Conference on the Origin and Development of Language and Speech,1976,280:20-32.
  • 8Charles J.Fillmore.Frames and the semantics of understanding[J].Quaderni di Semantica,1985,6 (2):222-254.
  • 9Boas,Hans C..A frame-semantic approach to identifying syntactically relevant elements of meaning[C]//Steiner,Petra, Boas, Hans C., Stefan Schierholz (eds.),Contrastive Studies and Valency. Studies in Honor of Hans Ulrich Boas. Frankfurt/New York:Peter Lang,2006:119-149.

二级参考文献33

  • 1穗志方 俞士汶.基于骨架依存树的语句相似度计算模型[A]..中文信息处理国际会议论文集(ICCIP''98)[C].北京:清华大学出版社,1998.458-465.
  • 2姚天顺,自然语言理解.一种让机器懂得人类语言的研究,1995年
  • 3李俊杰,博士学位论文,1995年
  • 4王建波,博士学位论文,1992年
  • 5李小滨,软件学报,1991年,4期
  • 6哈罗德 博科,文摘的概念与方法,1991年
  • 7刘开瑛,自然语言处理,1991年
  • 8徐越,第一届中国人工智能联合学术会议论文集,1990年
  • 9苏海菊,情报学报,1989年,6期
  • 10Over, P and J. Yen. 2003. An Introduction to DUC 2003 - Intrinstic Evaluation of Generic News Text Summatization Systems. http :/www. nlpir, nist. gov/projeets/due/pubs/2003 slides/due2003 intro, pdf.

共引文献59

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部