-
题名基于后缀数组改进的全文索引结构研究
- 1
-
-
作者
刘畅
张猛
-
机构
吉林工商学院信息工程学院
吉林大学网络中心
-
出处
《吉林大学学报(信息科学版)》
CAS
2013年第2期183-186,共4页
-
基金
吉林省教育厅科技发展规划基金资助项目(2012373)
-
文摘
为在网络数据中搜索到所需相关数据,通过对基于后缀数组的全文索引结构的改进研究,设计和实现一种降低空间占用率并有效提高索引速度的全文索引结构———加权有向词图。通过实验证明,加权有向词图在相同问题规模下能降低存储空间,同时不影响检索的效率,是一种更为高效的全文索引结构。
-
关键词
后缀自动机
全文索引结构
加权有向词图
-
Keywords
suffix automaton
full-text index structure
weighted directed word graph(wdwg)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
G354
[文化科学—情报学]
-
-
题名一种基于TextRank的单文本关键字提取算法
被引量:20
- 2
-
-
作者
柳林青
余瀚
费宁
陈春玲
-
机构
南京邮电大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2018年第3期705-710,共6页
-
基金
国家自然科学基金资助项目(11501302)
-
文摘
作为一种经典的文本关键字提取和摘要自动生成算法,TextRank将文本看做若干单词组成的集合,并通过对单词节点图的节点权值进行迭代计算,挖掘单词之间的潜在语义关系。在TextRank节点图模型的基础上,将马尔可夫状态转移模型与节点图相结合,提出节点间边权为条件概率的新模型生成算法TextRank_Revised。通过对有标记和无标记的验证集进行验证,证明新的算法在不提升时间复杂度的前提下,通过计算单文本得出的单词排序结果相较于原TextRank算法更加吻合人工对文档的关键字提取结果。
-
关键词
TextRank
单文本关键字
提取算法
有向带权图
马尔可夫状态转移模型
-
Keywords
TextRank
key word of single text
extracting algorithm
weighted directed graph
Markov state transform model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP301.6
[自动化与计算机技术—计算机系统结构]
-