-
题名基于篇章结构的文本自动标引算法
被引量:9
- 1
-
-
作者
张美娜
迟呈英
战学刚
亓超
-
机构
辽宁科技大学计算机科学与工程学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第9期122-124,共3页
-
基金
辽宁省教育厅高等学校科学研究项目(2004D110)资助
-
文摘
通过对输入文本分析,划分文本的篇章结构,分为依次存在包含关系的全文章节、段落、复句、分句五个层次,用文本结构树来表示。给出了标记方法,并在此基础上讨论并实现了文本篇章结构的自动标引,提出了两个标引算法并给出了比较结果,为自动文摘后续工作给予了很大帮助。
-
关键词
篇章结构
文本结构树
标引算法
-
Keywords
Discourse structure Text structure tree Indexing algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
G254.361
[文化科学—图书馆学]
-
-
题名电子政务主题词表应用系统中主题标引算法研究
被引量:4
- 2
-
-
作者
倪静
赵新力
李惠安
-
机构
中国科学技术信息研究所
中华人民共和国科学技术部
-
出处
《高技术通讯》
EI
CAS
CSCD
2003年第10期15-19,共5页
-
基金
86 3计划 (2 0 0 2AA1Z6 711)资助项目
-
文摘
从政务文献主题标引的需求出发 ,面向《电子政务主题词表》的网络应用 ,探讨政务文献主题标引的方法和技术 ,提出了词典法和N gram提取技术相结合的实用算法。这一算法可以弥补传统的词典法由于政务文献涉及层面广泛和新词出现频繁所带来的词汇不足的问题。同时 ,讨论了利用该词表进行赋词标引的有关问题。
-
关键词
电子政务
主题词表应用系统
主题标引算法
汉语
中国
政务文献
-
Keywords
are also discussed. Key words: e government, Subject indexing, Dictionary based segment, N gram based feature catching
-
分类号
D630.1
[政治法律—中外政治制度]
-
-
题名汉语文本形式结构分析及其标引算法
被引量:5
- 3
-
-
作者
单永明
-
机构
山西大学计算机科学系
-
出处
《中文信息学报》
CSCD
北大核心
2002年第2期14-19,26,共7页
-
文摘
本文从形式化的角度讨论了汉语文本的形式结构及有关的基本概念 ,给出了文本的标题、子标题、段落及其层次结构的一种划分与标记方法 ,提出了规范的与准规范的文本等概念 ,并以此为基础讨论了文本形式结构的标引问题 ,给出了两个标引算法。
-
关键词
中文信息处理
文本结构分析
标引树
自动标引算法
汉语文本分析
文本形式结构
-
Keywords
Chinese information processing
text structure analyses
indexing tree
automatic indexing algorithm
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名档案主题标引实用算法
被引量:6
- 4
-
-
作者
苏新宁
徐进鸿
-
机构
南京大学信息管理系
-
出处
《情报学报》
CSSCI
北大核心
1995年第6期417-422,共6页
-
基金
国家教委社科基金
-
文摘
本文介绍了档案文献主题词自动标引算法,该算法合理地构造了主题词切分词典,并将切分关键词和标引主题词的实现过程融为一体,使标引与检索算法变得简单清晰。本文还给出了主题词切分词典的维护算法,以及自动扩缩检算法。利用本算法思路编制的软件已用于实际的档案管理系统中。
-
关键词
档案文献
主题标引
自动标引算法
-
Keywords
nd indexing descriptors,and is a very simple and clear method.The paper still gives the method of safeguarding thesaurus and the algorithm of enlarging and narrowing retrieval.The software of the algorithm has come into use.Keywords
-
分类号
G272.5
[文化科学—档案学]
-