期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进TextRank的关键词抽取算法
被引量:
14
1
作者
张莉婧
李业丽
+2 位作者
曾庆涛
雷嘉丽
杨鹏
《北京印刷学院学报》
2016年第4期51-55,共5页
为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法——TextRank-CM算法。将T...
为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法——TextRank-CM算法。将TextRank-CM算法、TextRank+TF-IDF算法和TextRank算法分别应用于中文关键词的抽取,结果表明:TextRank-CM算法在中文关键词抽取中的准确率和召回率明显优于另两种算法。
展开更多
关键词
textrank
-CM算法
textrank
算法
G1赋权法
关键词抽取
下载PDF
职称材料
基于改进的TextRank的自动摘要提取方法
被引量:
41
2
作者
余珊珊
苏锦钿
李鹏飞
《计算机科学》
CSCD
北大核心
2016年第6期240-247,共8页
经典的TextRank算法在文档的自动摘要提取时往往只考虑了句子节点间的相似性,而忽略了文档的篇章结构及句子的上下文信息。针对这些问题,结合中文文本的结构特点,提出一种改进后的iTextRank算法,通过将标题、段落、特殊句子、句子位置...
经典的TextRank算法在文档的自动摘要提取时往往只考虑了句子节点间的相似性,而忽略了文档的篇章结构及句子的上下文信息。针对这些问题,结合中文文本的结构特点,提出一种改进后的iTextRank算法,通过将标题、段落、特殊句子、句子位置和长度等信息引入到TextRank网络图的构造中,给出改进后的句子相似度计算方法及权重调整因子,并将其应用于中文文本的自动摘要提取,同时分析了算法的时间复杂度。最后,实验证明iTextRank比经典的TextRank方法具有更高的准确率和更低的召回率。
展开更多
关键词
中文文本
自动摘要提取
textrank
篇章结构
无监督学习方法
下载PDF
职称材料
融合语义特征的TextRank关键词抽取方法
被引量:
12
3
作者
杨延娇
赵国涛
+1 位作者
袁振强
韩家臣
《计算机工程》
CAS
CSCD
北大核心
2021年第10期82-88,共7页
TextRank使用共现窗口代替PageRank网页超链接以判断词语关系,但共现窗口机制下的词汇图是无向图,且实际中文文本中词语与其共现窗口内的词语之间在多数情况下没有认知上的指向性链接关系,导致共现窗口机制下的词语关系与PageRank网页...
TextRank使用共现窗口代替PageRank网页超链接以判断词语关系,但共现窗口机制下的词汇图是无向图,且实际中文文本中词语与其共现窗口内的词语之间在多数情况下没有认知上的指向性链接关系,导致共现窗口机制下的词语关系与PageRank网页超链接关系存在较大差别。为此,提出一种融合语义特征的关键词抽取方法S-TextRank。在TextRank方法的基础上以依存关系代替共现窗口判断词语关系,以模拟PageRank网页指向性超链接。对不同词性词语赋予相应的权重系数,从而模拟不同性质网页的重要程度。在此基础上,使用IDF方法结合汉语语法规则构建非关键词表,排除无关词语以降低其对抽取结果的影响。实验结果表明,S-TextRank方法在测试集上的准确率达到74%,比TextRank方法高19.4个百分点。
展开更多
关键词
textrank
方法
关键词抽取
依存关系
词性重要度
IDF方法
PageRank方法
下载PDF
职称材料
基于TextRank的关键词提取改进方法研究
被引量:
6
4
作者
孟彩霞
张琰
李楠楠
《计算机与数字工程》
2020年第12期3022-3026,共5页
基于TextRank的关键词提取方法主要考虑文档的语义信息,没有考虑到文本的结构信息,导致关键词提取的准确率较低。为了得到更好的关键词提取效果,论文对新闻语料库关键词提取方法进行了研究,提出将文本的结构信息和语义信息相结合。基于T...
基于TextRank的关键词提取方法主要考虑文档的语义信息,没有考虑到文本的结构信息,导致关键词提取的准确率较低。为了得到更好的关键词提取效果,论文对新闻语料库关键词提取方法进行了研究,提出将文本的结构信息和语义信息相结合。基于TextRank算法,利用文本的结构信息(词语位置、词语跨度)和词语相似度改变词语权重计算方式,进而提取文本关键词。将论文提出的算法与TF-IDF、TextRank、Word2vec+TextRank进行了对比实验,结果表明,从准确率P、召回率R、测量值F三个方面都取得了良好的实验效果。具体表现为当关键词个数相同K=3时,TextRank算法评价指标准确率P、召回率R、测量值F分别为22.21%、19.78%、20.92%;加入文档的词语位置信息和词语跨度信息以后评价指标准确率P、召回率R、测量值F分别为29.83%、31.34%、30.56%。
展开更多
关键词
textrank
Word2Vec
关键词提取
词向量
无监督学习方法
下载PDF
职称材料
基于LDA和Word2Vec模型的学位论文评阅意见主题挖掘与分析
被引量:
1
5
作者
王孟
苏进城
陈志德
《福建师范大学学报(自然科学版)》
CAS
北大核心
2024年第5期41-51,共11页
选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将...
选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将评阅意见转化为主题分布向量;其次,结合Word2Vec模型将评阅意见的关键词转化为向量表达;最后,采用TextRank方法提取关键词,以揭示评阅专家的关注核心主题。实验结果表明,所提方法能为高校管理人员提供切实有效的分析工具,有助于他们更好地分析总结评阅意见,同时也为硕士研究生撰写高质量学位论文提供有益借鉴。
展开更多
关键词
硕士学位论文
自然语言处理
LDA模型
Word2Vec模型
textrank
方法
下载PDF
职称材料
基于用户标签的微博推荐算法
被引量:
8
6
作者
王宁宁
鲁燃
+1 位作者
王智昊
刘承运
《计算机应用研究》
CSCD
北大核心
2017年第1期58-61,共4页
为了解决推荐算法中用户标签稀疏、推荐准确度不高的问题,提出了一种基于用户标签的微博推荐算法。利用TextRank排序方法提取用户发布微博中的关键词,并对该关键词进行扩展,将其作为表示用户兴趣的标签;再根据微博的效应函数和生命周期...
为了解决推荐算法中用户标签稀疏、推荐准确度不高的问题,提出了一种基于用户标签的微博推荐算法。利用TextRank排序方法提取用户发布微博中的关键词,并对该关键词进行扩展,将其作为表示用户兴趣的标签;再根据微博的效应函数和生命周期形成待推荐的微博列表,计算用户标签及其同义词在待推荐微博列表中出现的次数,将出现次数较多的TOP-k条微博推荐给用户。通过实验验证,该算法能够有效地解决用户标签的稀疏性问题,并能提高推荐算法的准确性。
展开更多
关键词
微博推荐算法
用户标签
textrank
排序方法
微博列表
效应函数
生命周期
下载PDF
职称材料
融合BERT语义加权与网络图的关键词抽取方法
被引量:
12
7
作者
李俊
吕学强
《计算机工程》
CAS
CSCD
北大核心
2020年第9期89-94,共6页
结合文档本身的结构信息与外部词语的语义信息,提出一种融合BERT词向量与TextRank的关键词抽取方法。在基于网络图的TextRank方法基础上,引入语义差异性并利用BERT词向量加权方式优化TextRank转移概率矩阵计算过程,同时通过迭代运算对...
结合文档本身的结构信息与外部词语的语义信息,提出一种融合BERT词向量与TextRank的关键词抽取方法。在基于网络图的TextRank方法基础上,引入语义差异性并利用BERT词向量加权方式优化TextRank转移概率矩阵计算过程,同时通过迭代运算对文档中的词语进行综合影响力得分排序,最终提取得分最高的Top N个词语作为关键词。实验结果表明,当选取Top3、Top5、Top7和Top10个关键词时,与基于词向量聚类质心与TextRank加权的关键词抽取方法相比,该方法的平均F值提升了2.5%,关键词抽取效率更高。
展开更多
关键词
关键词抽取
语义关系
词向量
textrank
方法
基于Transformer的双向编码器表示
下载PDF
职称材料
目前大学生就业难问题的解决方案探讨
8
作者
吉朝瑜
梁奕宁
宋甲行
《科技创业月刊》
2019年第3期55-59,共5页
近年来,我国毕业生就业形势严峻,毕业生自身能力与岗位要求存在差距,导致企业人才短缺与大学生就业困难的双重问题。为解决上述问题,将从职位供给方的人才偏好分析入手,为在校学生指明学习与发展方向,进一步分析供给方人才需求信息与社...
近年来,我国毕业生就业形势严峻,毕业生自身能力与岗位要求存在差距,导致企业人才短缺与大学生就业困难的双重问题。为解决上述问题,将从职位供给方的人才偏好分析入手,为在校学生指明学习与发展方向,进一步分析供给方人才需求信息与社会职位需求变动趋势,给予在校生理想职位的就业前景分析与职业规划建议,并为在校生提供理想职位与公司的实习机会,建立学生与企业双向评价机制,为后期招聘的职位供需双方了解彼此情况提供有价值的参考信息,同时也为毕业生提供企业招聘信息。为实现以上目标,构建了下述四个模型:首先,通过TextRank方法建立关键词提取模型,用于提取学生建立中的关键信息和了解企业用人偏好;其次,通过共词分析、聚类分析的方法和构建聚类分析谱系图建立匹配与储存优化模型,将学生与适合的企业配对;第三,通过BP神经网络的思想建立就业率预测模型,为学生就业指导;第四,通过PageRank模型思想建立学生企业双向评价选择模型,实现学生与企业的双向评价目标。
展开更多
关键词
初始阶段
textrank
法
聚类分析
BP神经网络
PageRank法
下载PDF
职称材料
题名
基于改进TextRank的关键词抽取算法
被引量:
14
1
作者
张莉婧
李业丽
曾庆涛
雷嘉丽
杨鹏
机构
北京印刷学院
出处
《北京印刷学院学报》
2016年第4期51-55,共5页
基金
北京市教育委员会(PXM2016_014223_000025)
北京印刷学院重点项目(r1512000570)
文摘
为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法——TextRank-CM算法。将TextRank-CM算法、TextRank+TF-IDF算法和TextRank算法分别应用于中文关键词的抽取,结果表明:TextRank-CM算法在中文关键词抽取中的准确率和召回率明显优于另两种算法。
关键词
textrank
-CM算法
textrank
算法
G1赋权法
关键词抽取
Keywords
textrank
-CMalgorithm
textrank
algorithm
G1
method
keyword extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于改进的TextRank的自动摘要提取方法
被引量:
41
2
作者
余珊珊
苏锦钿
李鹏飞
机构
广东药科大学医药信息工程学院
华南理工大学计算机科学与工程学院
出处
《计算机科学》
CSCD
北大核心
2016年第6期240-247,共8页
基金
广东省自然科学基金(2015A030310318)
广东省医学科学技术研究基金项目(A2015065)
国家自然科学基金资助项目(61103038)资助
文摘
经典的TextRank算法在文档的自动摘要提取时往往只考虑了句子节点间的相似性,而忽略了文档的篇章结构及句子的上下文信息。针对这些问题,结合中文文本的结构特点,提出一种改进后的iTextRank算法,通过将标题、段落、特殊句子、句子位置和长度等信息引入到TextRank网络图的构造中,给出改进后的句子相似度计算方法及权重调整因子,并将其应用于中文文本的自动摘要提取,同时分析了算法的时间复杂度。最后,实验证明iTextRank比经典的TextRank方法具有更高的准确率和更低的召回率。
关键词
中文文本
自动摘要提取
textrank
篇章结构
无监督学习方法
Keywords
Chinese texts, Automatic summarization extraction,
textrank
, Article discourse, Unsupervised learning
method
s
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
融合语义特征的TextRank关键词抽取方法
被引量:
12
3
作者
杨延娇
赵国涛
袁振强
韩家臣
机构
西北师范大学计算机科学与工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第10期82-88,共7页
基金
国家自然科学基金(61662068)
甘肃省高等学校创新能力提升项目(2019A-006)。
文摘
TextRank使用共现窗口代替PageRank网页超链接以判断词语关系,但共现窗口机制下的词汇图是无向图,且实际中文文本中词语与其共现窗口内的词语之间在多数情况下没有认知上的指向性链接关系,导致共现窗口机制下的词语关系与PageRank网页超链接关系存在较大差别。为此,提出一种融合语义特征的关键词抽取方法S-TextRank。在TextRank方法的基础上以依存关系代替共现窗口判断词语关系,以模拟PageRank网页指向性超链接。对不同词性词语赋予相应的权重系数,从而模拟不同性质网页的重要程度。在此基础上,使用IDF方法结合汉语语法规则构建非关键词表,排除无关词语以降低其对抽取结果的影响。实验结果表明,S-TextRank方法在测试集上的准确率达到74%,比TextRank方法高19.4个百分点。
关键词
textrank
方法
关键词抽取
依存关系
词性重要度
IDF方法
PageRank方法
Keywords
textrank method
keyword extraction
dependency relationship
part-of-speech importance
IDF
method
PageRank
method
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于TextRank的关键词提取改进方法研究
被引量:
6
4
作者
孟彩霞
张琰
李楠楠
机构
西安邮电大学计算机学院
出处
《计算机与数字工程》
2020年第12期3022-3026,共5页
基金
陕西省自然科学基金项目(编号:2014JM8303)
西安邮电大学研究生创新基金项目(编号:CXL2016-40)资助。
文摘
基于TextRank的关键词提取方法主要考虑文档的语义信息,没有考虑到文本的结构信息,导致关键词提取的准确率较低。为了得到更好的关键词提取效果,论文对新闻语料库关键词提取方法进行了研究,提出将文本的结构信息和语义信息相结合。基于TextRank算法,利用文本的结构信息(词语位置、词语跨度)和词语相似度改变词语权重计算方式,进而提取文本关键词。将论文提出的算法与TF-IDF、TextRank、Word2vec+TextRank进行了对比实验,结果表明,从准确率P、召回率R、测量值F三个方面都取得了良好的实验效果。具体表现为当关键词个数相同K=3时,TextRank算法评价指标准确率P、召回率R、测量值F分别为22.21%、19.78%、20.92%;加入文档的词语位置信息和词语跨度信息以后评价指标准确率P、召回率R、测量值F分别为29.83%、31.34%、30.56%。
关键词
textrank
Word2Vec
关键词提取
词向量
无监督学习方法
Keywords
textrank
Word2Vec
keyword extraction
word vector
unsupervised learning
method
分类号
G254.23 [文化科学—图书馆学]
下载PDF
职称材料
题名
基于LDA和Word2Vec模型的学位论文评阅意见主题挖掘与分析
被引量:
1
5
作者
王孟
苏进城
陈志德
机构
福建师范大学研究生院
福建师范大学计算机与网络空间安全学院
出处
《福建师范大学学报(自然科学版)》
CAS
北大核心
2024年第5期41-51,共11页
基金
国家自然科学基金资助项目(61841701、62277010)。
文摘
选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将评阅意见转化为主题分布向量;其次,结合Word2Vec模型将评阅意见的关键词转化为向量表达;最后,采用TextRank方法提取关键词,以揭示评阅专家的关注核心主题。实验结果表明,所提方法能为高校管理人员提供切实有效的分析工具,有助于他们更好地分析总结评阅意见,同时也为硕士研究生撰写高质量学位论文提供有益借鉴。
关键词
硕士学位论文
自然语言处理
LDA模型
Word2Vec模型
textrank
方法
Keywords
master s thesis
natural language processing
LDA model
Word2Vec model
textrank method
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于用户标签的微博推荐算法
被引量:
8
6
作者
王宁宁
鲁燃
王智昊
刘承运
机构
山东师范大学信息科学与工程学院
山东师范大学山东省分布式计算机软件新技术重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2017年第1期58-61,共4页
基金
国家自然科学基金资助项目(61373148)
国家社科基金资助项目(12BXW040)
+3 种基金
山东省自然科学基金资助项目(ZR2012FM038)
山东省优秀中青年科学家奖励基金资助项目(BS2013DX033)
国家教育部人文社科基金资助项目(14YJC860042)
山东省社科规划项目(2012BXWJ01)
文摘
为了解决推荐算法中用户标签稀疏、推荐准确度不高的问题,提出了一种基于用户标签的微博推荐算法。利用TextRank排序方法提取用户发布微博中的关键词,并对该关键词进行扩展,将其作为表示用户兴趣的标签;再根据微博的效应函数和生命周期形成待推荐的微博列表,计算用户标签及其同义词在待推荐微博列表中出现的次数,将出现次数较多的TOP-k条微博推荐给用户。通过实验验证,该算法能够有效地解决用户标签的稀疏性问题,并能提高推荐算法的准确性。
关键词
微博推荐算法
用户标签
textrank
排序方法
微博列表
效应函数
生命周期
Keywords
microblog recommendation algorithm
user' s tag
textrank
sorting
method
microblog list
effect function
life cycle
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
融合BERT语义加权与网络图的关键词抽取方法
被引量:
12
7
作者
李俊
吕学强
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第9期89-94,共6页
基金
国家自然科学基金(61671070)
国家语委重点科研项目(ZDI135-53)。
文摘
结合文档本身的结构信息与外部词语的语义信息,提出一种融合BERT词向量与TextRank的关键词抽取方法。在基于网络图的TextRank方法基础上,引入语义差异性并利用BERT词向量加权方式优化TextRank转移概率矩阵计算过程,同时通过迭代运算对文档中的词语进行综合影响力得分排序,最终提取得分最高的Top N个词语作为关键词。实验结果表明,当选取Top3、Top5、Top7和Top10个关键词时,与基于词向量聚类质心与TextRank加权的关键词抽取方法相比,该方法的平均F值提升了2.5%,关键词抽取效率更高。
关键词
关键词抽取
语义关系
词向量
textrank
方法
基于Transformer的双向编码器表示
Keywords
extraction
semantic relation
word vector
textrank method
Bidirectional Encoder Representation from Transformer(BERT)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
目前大学生就业难问题的解决方案探讨
8
作者
吉朝瑜
梁奕宁
宋甲行
机构
西北大学
出处
《科技创业月刊》
2019年第3期55-59,共5页
文摘
近年来,我国毕业生就业形势严峻,毕业生自身能力与岗位要求存在差距,导致企业人才短缺与大学生就业困难的双重问题。为解决上述问题,将从职位供给方的人才偏好分析入手,为在校学生指明学习与发展方向,进一步分析供给方人才需求信息与社会职位需求变动趋势,给予在校生理想职位的就业前景分析与职业规划建议,并为在校生提供理想职位与公司的实习机会,建立学生与企业双向评价机制,为后期招聘的职位供需双方了解彼此情况提供有价值的参考信息,同时也为毕业生提供企业招聘信息。为实现以上目标,构建了下述四个模型:首先,通过TextRank方法建立关键词提取模型,用于提取学生建立中的关键信息和了解企业用人偏好;其次,通过共词分析、聚类分析的方法和构建聚类分析谱系图建立匹配与储存优化模型,将学生与适合的企业配对;第三,通过BP神经网络的思想建立就业率预测模型,为学生就业指导;第四,通过PageRank模型思想建立学生企业双向评价选择模型,实现学生与企业的双向评价目标。
关键词
初始阶段
textrank
法
聚类分析
BP神经网络
PageRank法
Keywords
initial stage
textrank method
clustering analysis
BP neural network
PageRank
method
分类号
G647.38 [文化科学—高等教育学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进TextRank的关键词抽取算法
张莉婧
李业丽
曾庆涛
雷嘉丽
杨鹏
《北京印刷学院学报》
2016
14
下载PDF
职称材料
2
基于改进的TextRank的自动摘要提取方法
余珊珊
苏锦钿
李鹏飞
《计算机科学》
CSCD
北大核心
2016
41
下载PDF
职称材料
3
融合语义特征的TextRank关键词抽取方法
杨延娇
赵国涛
袁振强
韩家臣
《计算机工程》
CAS
CSCD
北大核心
2021
12
下载PDF
职称材料
4
基于TextRank的关键词提取改进方法研究
孟彩霞
张琰
李楠楠
《计算机与数字工程》
2020
6
下载PDF
职称材料
5
基于LDA和Word2Vec模型的学位论文评阅意见主题挖掘与分析
王孟
苏进城
陈志德
《福建师范大学学报(自然科学版)》
CAS
北大核心
2024
1
下载PDF
职称材料
6
基于用户标签的微博推荐算法
王宁宁
鲁燃
王智昊
刘承运
《计算机应用研究》
CSCD
北大核心
2017
8
下载PDF
职称材料
7
融合BERT语义加权与网络图的关键词抽取方法
李俊
吕学强
《计算机工程》
CAS
CSCD
北大核心
2020
12
下载PDF
职称材料
8
目前大学生就业难问题的解决方案探讨
吉朝瑜
梁奕宁
宋甲行
《科技创业月刊》
2019
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部