期刊文献+

汉语句群领域的自动抽取研究 被引量:4

Research on extracting conceptual domain of sentence group in Chinese
下载PDF
导出
摘要 句群是介于句子和段落之间的一个处理单位。在语言概念空间句群有三个要素:领域、情景和背景,领域是最根本的。获取了句群领域,就能够确定情景框架,这对信息抽取和文本分类都是非常重要的。一些词语的概念符号中蕴含了领域信息,通过分析词语在句子中的语义角色以及词语位置、频次等可以得到句子的领域。根据领域关系可以合并领域相同或相似的句子,得到句群及其领域。实验表明,常见的四种领域关系能够很好地被处理,但在动态词处理、复合领域的识别等方面还需要改进。 Sentence group is a processing unit between sentence and paragraph.It is composed of three elements:domain,situation and background,but domain is the most essential.Once the domain of sentence group is obtained,the situation will be exposed.This is very important for information retrieval and text classification.The symbols of domain are contained in some words.The domain of a sentence can be analyzed by the semantic role,position and frequency of words.Sentence group and its domain can be extracted by combining sentences with the same or similar domain.The experiment shows that the four kinds of relationships between two domains are processed well.However,the process of dynamic words and the recognition of complex domain should be improved.
出处 《计算机工程与应用》 CSCD 北大核心 2009年第4期11-15,共5页 Computer Engineering and Applications
基金 国家重点基础研究发展规划(973)No.2004CB318104 国家科技支撑计划课题No.2007BAH05B02-05 中科院声学所知识创新工程项目No.O654091431 中国科学院声学研究所"所长择优基金"No.GS13SJJ04 中国科学院青年人才领域前沿项目No.O754021432~~
关键词 句群 领域 概念层次网络理论 信息抽取 文本分类 sentence group domain the theory of Hierarchical Network of Concepts information extraction text classification
  • 相关文献

参考文献5

  • 1黎锦熙,刘世儒.汉语语法教材[M].北京:商务印书馆,1962.
  • 2吴为章,田小琳.汉语句群[M].北京:商务印书馆,1984.
  • 3王缃.复句·旬群·篇章[M].西安:陕西人民出版社,1991.
  • 4徐赳赳.篇章语言学[M].北京:中国社会科学出版社,2002.
  • 5黄曾阳.句类分析的20项难点[M/OL].(2001-09-21)[2008-10-06].http://www.hnenlp.com.

共引文献5

同被引文献29

引证文献4

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部