期刊文献+

基于概念的文本结构分析方法 被引量:35

TEXT STRUCTURE ANALYSIS BASED ON CONCEPT
下载PDF
导出
摘要 文本结构分析是文本处理领域中的重要内容,它可以有效地改进文本摘要、文本检索以及文本过滤的精度.文中简要描述了文本的物理结构和逻辑结构以及文本分析的背景,提出了文本结构分析中的层次分析方法.该方法保证了层次划分的有序性,可操作性强,便于解释,不依赖于具体领域.其基本思想是对于输入文本,首先识别出文本的物理结构;然后在概念映射、概念密度和概念消歧的基础上,将文本依据主题划分为若干层次;最终获得文本的逻辑结构. In this paper, a hierarchical analysis approach in text structure analysis is put forward. The main idea is shown as follows: Firstly, the physical structure of text is obtained from the input text; Secondly, based on concept mapping, concept density, and concept disambiguation, text hierarchical analysis is automatically performed; Finally, as a result, the logical structure of text is gained, and text structure tree is created which consists of text theme, hierarchies, and paragraphs. The approach enables the hierarchies to keep paragraphs in a natural order,and it can be applied to the broad fields.
出处 《计算机研究与发展》 EI CSCD 北大核心 2000年第3期324-328,共5页 Journal of Computer Research and Development
基金 国家自然科学基金!项目编号69675019 国家教委博士点基金
关键词 文本结构分析 概念 信息处理 文本处理 计算机 vector space model, text structure analysis, text hierarchical analysis, concept mapping, concept density, concept disambiguation
  • 相关文献

参考文献5

二级参考文献71

共引文献43

同被引文献279

引证文献35

二级引证文献229

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部