期刊文献+

三个层面的中文文本主题自动提取研究 被引量:13

Extract Subject from Chinese Text with Three Different Levels
下载PDF
导出
摘要 为适应Internet时代和大规模文献处理的需要 ,以中文文本为处理对象 ,研究了从主题词、主题概念和主题句三个不同层面自动抽取文本主题的方法 ,着重讨论了加权体系和一些经验值的获取方法。对新闻类文献做了实验 。 To meet the requirement of Internet and large scale text processing,this paper introduces how to automatically extract subject from Chinese texts. We extract the subject from three different levels: subject word,subject concept and subject sentence. We put the emphasis on how to form the weighting system and acquire the experience coefficient values. Based on the experimental results of news articles,we briefly analyze the performance.
机构地区 上海交通大学
出处 《中文信息学报》 CSCD 北大核心 2001年第4期20-27,共8页 Journal of Chinese Information Processing
基金 8 6 3计划资助项目!(86 3 - 30 6 -ZD0 3- 0 4- 1)
关键词 主题词 主题概念 主题句 加权 中文文本 主题提取 文本处理 subject word subject concept subject sentence weighting
  • 相关文献

参考文献7

二级参考文献27

共引文献84

同被引文献99

引证文献13

二级引证文献103

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部