期刊文献+

基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验 被引量:18

Automatic Indexing Based on Multi-vocabularies
下载PDF
导出
摘要 避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。 The paper proposed a technique of automatic word-extracting based on multiple vocabularties so as to avoid the technical difficulties of word-segmenting in Chinese.These vocabularies are as follows:stop-list,synonymous list,keyword list,thesaurus,concordance of keyword string VS class number,etc.,their function,construction and application are detailed.The paper introduces and evaluates the automatic indexing system of economic news of Xinhua News Agency.
出处 《情报学报》 CSSCI 北大核心 2002年第3期273-277,共5页 Journal of the China Society for Scientific and Technical Information
基金 国家社科基金资助 课题编号 :98BTQ0 0 7
关键词 新闻标引 自动标引 自动分类 词表技术 自然语言标引 词表构建 自动抽词 中文信息处理 news database automatic indexing,automatic classifying,word-extracting,vocabulary construction.
  • 相关文献

参考文献9

二级参考文献7

共引文献37

同被引文献121

引证文献18

二级引证文献64

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部