期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于TAKE的中文关键短语提取算法研究
被引量:
1
1
作者
刘晨晖
张德生
胡钢
《计算机工程与应用》
CSCD
北大核心
2020年第10期115-121,共7页
针对传统的中文关键短语提取算法所提取关键短语准确率低、歧义性强和涵盖信息量少等问题,在英文关键短语提取算法TAKE(Totally Automated Keyword Extraction)的启发下,加入基于多领域特异性的新词识别技术,并改进了原有算法的文本分...
针对传统的中文关键短语提取算法所提取关键短语准确率低、歧义性强和涵盖信息量少等问题,在英文关键短语提取算法TAKE(Totally Automated Keyword Extraction)的启发下,加入基于多领域特异性的新词识别技术,并改进了原有算法的文本分词、词语过滤和特征计算方法,提出了一种改进的TAKE算法,并应用于中文文本关键短语挖掘中。与多种传统关键短语提取算法的对比实验结果表明,该算法提取的精确率、召回率和F值指标的量化结果相比于传统算法有比较明显的提升。
展开更多
关键词
文本挖掘
分词
词语过滤
特征计算
关键短语提取
下载PDF
职称材料
EntropyRank:基于主题熵的关键短语提取算法
被引量:
1
2
作者
尹红
陈雁
李平
《中文信息学报》
CSCD
北大核心
2019年第11期107-114,共8页
关键短语提取是自然语言处理领域的一个重要子任务,其目的是自动识别出文本中的重要短语,现有方法主要强调词语间相关关系和词语自身影响力会影响关键短语提取效果。考虑到关键短语应准确地表示文档主题这一特点,该文提出一种基于主题...
关键短语提取是自然语言处理领域的一个重要子任务,其目的是自动识别出文本中的重要短语,现有方法主要强调词语间相关关系和词语自身影响力会影响关键短语提取效果。考虑到关键短语应准确地表示文档主题这一特点,该文提出一种基于主题熵的关键短语提取算法。该算法利用隐含狄利克雷分布训练文档和词的主题分布,并结合两个主题分布来表示特定文档下的词主题分布,然后计算词主题分布的信息熵即主题熵来表示词语自身影响力,最后在词共现网络上使用随机游走方法计算每个候选短语的得分。在6个公开数据集上的实验结果表明,与现有的无监督关键短语提取算法相比,该算法在F1指标上能提高2.61%~6.98%。
展开更多
关键词
关键短语提取
随机游走
主题模型
词语影响力
下载PDF
职称材料
基于知识图谱的中文关键短语提取算法
被引量:
1
3
作者
徐远威
李劲华
《计算机应用与软件》
北大核心
2023年第6期250-256,265,共8页
针对传统的中文关键短语算法没有充分考虑到语义关系、涵盖信息量少和准确率低等问题,提出一种基于知识图谱来提取关键短语的算法。该算法运用知识图谱的语义网络结构来挖掘文本中两个词之间的潜在关系,通过赋予边权值具体量化潜在关系...
针对传统的中文关键短语算法没有充分考虑到语义关系、涵盖信息量少和准确率低等问题,提出一种基于知识图谱来提取关键短语的算法。该算法运用知识图谱的语义网络结构来挖掘文本中两个词之间的潜在关系,通过赋予边权值具体量化潜在关系,构建集成近邻传播(Affinity Propagation,AP)聚类和图的中心性算法来提取关键短语的框架。实验表明,与多种传统关键短语提取算法相比,该算法在准确率、召回率和F1值上有较明显的提升。
展开更多
关键词
关键短语提取
知识图谱
近邻传播聚类
中心性算法
下载PDF
职称材料
中文关键短语自动提取方法研究
被引量:
3
4
作者
荣垂田
李银银
王琰
《计算机科学与探索》
CSCD
北大核心
2019年第9期1481-1492,共12页
SegPhrase算法是当前提取关键短语最新的技术,其提取关键短语的结果比传统方法具有更高的准确率和召回率。但是SegPhrase算法在关键短语的提取和质量评估方面还存在一些缺陷。为了提高关键短语提取的质量,实现对中文关键短语的有效提取,...
SegPhrase算法是当前提取关键短语最新的技术,其提取关键短语的结果比传统方法具有更高的准确率和召回率。但是SegPhrase算法在关键短语的提取和质量评估方面还存在一些缺陷。为了提高关键短语提取的质量,实现对中文关键短语的有效提取,对SegPhrase算法进行了改进。在短语产生阶段,通过利用词串之间的互信息特征保留部分低频但关键的短语;在短语质量评估阶段,通过赋予不同特征不同的权重来对短语进行综合评估,选择更符合实际应用语境的短语。最后,为了验证提取的关键短语的质量,将提取的关键短语应用于文档主题分析。通过实验证明,改进的SegPhrase算法比原方法具有更高的召回率和准确率,该方法提取的关键短语的主题分析比基于关键词的主题分析更能够清晰准确地表达文档主题信息。
展开更多
关键词
关键短语提取
文本特征
互信息
主题分析
下载PDF
职称材料
图关键词提取中的短语评分方法
被引量:
1
5
作者
苏超
张宇翔
《计算机工程与设计》
北大核心
2020年第11期3175-3180,共6页
基于图的关键词提取中,关键短语提取阶段候选短语的评分方法易受单词的评分结果与短语长度的影响,为此提出一种结合短语频率信息与位置信息的评分方法。使用候选短语内含单词评分之和的平均值消除短语长度的影响,利用候选短语出现的次...
基于图的关键词提取中,关键短语提取阶段候选短语的评分方法易受单词的评分结果与短语长度的影响,为此提出一种结合短语频率信息与位置信息的评分方法。使用候选短语内含单词评分之和的平均值消除短语长度的影响,利用候选短语出现的次数与位置计算频率权重和位置权重,增强候选短语的最终得分。实验结果表明,提出方法在KDD、WWW、SIGIR数据集上的各项评估指标相对于传统的方法有明显的提升,验证了模型的有效性。
展开更多
关键词
提取
关键短语提取
候选
短语
评分
频率信息
位置信息
下载PDF
职称材料
题名
基于TAKE的中文关键短语提取算法研究
被引量:
1
1
作者
刘晨晖
张德生
胡钢
机构
西安理工大学理学院
出处
《计算机工程与应用》
CSCD
北大核心
2020年第10期115-121,共7页
基金
国家自然科学基金(No.51875454)
陕西省自然科学基础研究规划(No.2017JM5048)。
文摘
针对传统的中文关键短语提取算法所提取关键短语准确率低、歧义性强和涵盖信息量少等问题,在英文关键短语提取算法TAKE(Totally Automated Keyword Extraction)的启发下,加入基于多领域特异性的新词识别技术,并改进了原有算法的文本分词、词语过滤和特征计算方法,提出了一种改进的TAKE算法,并应用于中文文本关键短语挖掘中。与多种传统关键短语提取算法的对比实验结果表明,该算法提取的精确率、召回率和F值指标的量化结果相比于传统算法有比较明显的提升。
关键词
文本挖掘
分词
词语过滤
特征计算
关键短语提取
Keywords
text mining
word segmentation
word filtering
feature calculation
key phrase extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
EntropyRank:基于主题熵的关键短语提取算法
被引量:
1
2
作者
尹红
陈雁
李平
机构
西南石油大学计算机科学学院智能与网络化系统研究中心
出处
《中文信息学报》
CSCD
北大核心
2019年第11期107-114,共8页
基金
国家自然科学青年基金(61503312)
文摘
关键短语提取是自然语言处理领域的一个重要子任务,其目的是自动识别出文本中的重要短语,现有方法主要强调词语间相关关系和词语自身影响力会影响关键短语提取效果。考虑到关键短语应准确地表示文档主题这一特点,该文提出一种基于主题熵的关键短语提取算法。该算法利用隐含狄利克雷分布训练文档和词的主题分布,并结合两个主题分布来表示特定文档下的词主题分布,然后计算词主题分布的信息熵即主题熵来表示词语自身影响力,最后在词共现网络上使用随机游走方法计算每个候选短语的得分。在6个公开数据集上的实验结果表明,与现有的无监督关键短语提取算法相比,该算法在F1指标上能提高2.61%~6.98%。
关键词
关键短语提取
随机游走
主题模型
词语影响力
Keywords
keyphrase extraction
random walk
topic model
word influence
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于知识图谱的中文关键短语提取算法
被引量:
1
3
作者
徐远威
李劲华
机构
青岛大学数据科学与软件工程学院
出处
《计算机应用与软件》
北大核心
2023年第6期250-256,265,共8页
基金
山东省重大科技创新工程项目(2019JZZY020101)。
文摘
针对传统的中文关键短语算法没有充分考虑到语义关系、涵盖信息量少和准确率低等问题,提出一种基于知识图谱来提取关键短语的算法。该算法运用知识图谱的语义网络结构来挖掘文本中两个词之间的潜在关系,通过赋予边权值具体量化潜在关系,构建集成近邻传播(Affinity Propagation,AP)聚类和图的中心性算法来提取关键短语的框架。实验表明,与多种传统关键短语提取算法相比,该算法在准确率、召回率和F1值上有较明显的提升。
关键词
关键短语提取
知识图谱
近邻传播聚类
中心性算法
Keywords
Key phrase extraction
Knowledge graph
Affinity propagation clustering
Centrality algorithm
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文关键短语自动提取方法研究
被引量:
3
4
作者
荣垂田
李银银
王琰
机构
天津工业大学计算机科学与技术学院
厦门理工学院计算机与信息工程学院
出处
《计算机科学与探索》
CSCD
北大核心
2019年第9期1481-1492,共12页
基金
国家自然科学基金
福建省中青年教师教育科研项目~~
文摘
SegPhrase算法是当前提取关键短语最新的技术,其提取关键短语的结果比传统方法具有更高的准确率和召回率。但是SegPhrase算法在关键短语的提取和质量评估方面还存在一些缺陷。为了提高关键短语提取的质量,实现对中文关键短语的有效提取,对SegPhrase算法进行了改进。在短语产生阶段,通过利用词串之间的互信息特征保留部分低频但关键的短语;在短语质量评估阶段,通过赋予不同特征不同的权重来对短语进行综合评估,选择更符合实际应用语境的短语。最后,为了验证提取的关键短语的质量,将提取的关键短语应用于文档主题分析。通过实验证明,改进的SegPhrase算法比原方法具有更高的召回率和准确率,该方法提取的关键短语的主题分析比基于关键词的主题分析更能够清晰准确地表达文档主题信息。
关键词
关键短语提取
文本特征
互信息
主题分析
Keywords
key phrase extraction
text feature
mutual information
topic analysis
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
图关键词提取中的短语评分方法
被引量:
1
5
作者
苏超
张宇翔
机构
中国民航大学计算机科学与技术学院
出处
《计算机工程与设计》
北大核心
2020年第11期3175-3180,共6页
基金
国家自然科学基金项目(U1533104)。
文摘
基于图的关键词提取中,关键短语提取阶段候选短语的评分方法易受单词的评分结果与短语长度的影响,为此提出一种结合短语频率信息与位置信息的评分方法。使用候选短语内含单词评分之和的平均值消除短语长度的影响,利用候选短语出现的次数与位置计算频率权重和位置权重,增强候选短语的最终得分。实验结果表明,提出方法在KDD、WWW、SIGIR数据集上的各项评估指标相对于传统的方法有明显的提升,验证了模型的有效性。
关键词
提取
关键短语提取
候选
短语
评分
频率信息
位置信息
Keywords
graph-based keyword extraction
keyphrase extraction
candidate phrase scores
frequency information
location information
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于TAKE的中文关键短语提取算法研究
刘晨晖
张德生
胡钢
《计算机工程与应用》
CSCD
北大核心
2020
1
下载PDF
职称材料
2
EntropyRank:基于主题熵的关键短语提取算法
尹红
陈雁
李平
《中文信息学报》
CSCD
北大核心
2019
1
下载PDF
职称材料
3
基于知识图谱的中文关键短语提取算法
徐远威
李劲华
《计算机应用与软件》
北大核心
2023
1
下载PDF
职称材料
4
中文关键短语自动提取方法研究
荣垂田
李银银
王琰
《计算机科学与探索》
CSCD
北大核心
2019
3
下载PDF
职称材料
5
图关键词提取中的短语评分方法
苏超
张宇翔
《计算机工程与设计》
北大核心
2020
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部