期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
TextRank在多模态教学资源关键词提取中应用
1
作者 李章民 杨明月 《福建电脑》 2024年第11期25-30,共6页
为提高多模态教学资源的利用率,本文提出一种利用TextRank算法提取多模态教学资源关键词的方法。首先从非文本模态中提取合适的特征,将其转化为可以计算的文本单元,然后采用TextRank算法将多模态教学资源进行归类,并利用三方工具把多模... 为提高多模态教学资源的利用率,本文提出一种利用TextRank算法提取多模态教学资源关键词的方法。首先从非文本模态中提取合适的特征,将其转化为可以计算的文本单元,然后采用TextRank算法将多模态教学资源进行归类,并利用三方工具把多模态资源转化为文本资源。实验结果表明,TextRank算法能有效地从多模态教学资源中提取关键词,具有较高的有效性和准确性。 展开更多
关键词 多模态教学资源 textrank算法 关键词提取
下载PDF
基于多特征融合的TextRank新闻自动摘要模型
2
作者 徐飞 彭佳佳 +1 位作者 刘军 杨博 《计算机系统应用》 2023年第2期242-249,共8页
随着互联网的发展,如何快速地从海量新闻中获取核心信息,减少浏览负担,是信息部门目前急需解决的问题.现有的TextRank及其改进算法在新闻摘要抽取任务中,考虑文本特征不全面.在摘要句选择时,只考虑到摘要的冗余度,忽略了摘要的多样性及... 随着互联网的发展,如何快速地从海量新闻中获取核心信息,减少浏览负担,是信息部门目前急需解决的问题.现有的TextRank及其改进算法在新闻摘要抽取任务中,考虑文本特征不全面.在摘要句选择时,只考虑到摘要的冗余度,忽略了摘要的多样性及可读性.针对上述问题,本文提出了融合多特征的文本自动摘要方法MF-Text Rank(multi-feature TextRank).根据新闻的结构、句子和单词总结了更全面的文本特征信息用于改进TextRank算法的权重转移矩阵,使句子权重计算更准确.采用MMR算法更新句子权重,通过集束搜索得到候选摘要集,在MMR得分的基础上选择内聚性最高的候选摘要集作为最终的摘要输出.实验结果表明,MF-TextRank算法在摘要抽取任务中摘要Rouge得分优于现有改进的TexRank算法,有效提高了摘要抽取的准确性. 展开更多
关键词 textrank MMR Word2Vec 新闻摘要 多特征融合 自动摘要
下载PDF
基于元易创新和TextRank-RFM的技术创新路径识别与评价研究--以工业机器人为例
3
作者 武兰芬 郑静 廖文和 《情报探索》 2023年第8期38-45,共8页
[目的/意义]旨在精准识别技术创新路径,为企业进行研发创新和攻克关键部件的技术问题提供科学参考。[方法/过程]基于元易创新理论,通过创新维度与创新法则耦合进行技术创新路径识别,提出TextRank-RFM算法对技术创新路径进行评价,根据专... [目的/意义]旨在精准识别技术创新路径,为企业进行研发创新和攻克关键部件的技术问题提供科学参考。[方法/过程]基于元易创新理论,通过创新维度与创新法则耦合进行技术创新路径识别,提出TextRank-RFM算法对技术创新路径进行评价,根据专利创新要素的新颖性、出现频度与组合能力三个指标衡量潜在技术创新路径的实用价值,并以工业机器人领域为例验证该技术创新路径识别与评价模型的可行性。[结果/结论]构建的技术创新路径识别与评价模型可为企业创新发展提供一定的理论指导,且具有较强的实践意义。 展开更多
关键词 元易创新理论 textrank-RFM算法 技术创新路径识别 技术创新路径评价
下载PDF
基于改进TextRank的关键句提取方法 被引量:2
4
作者 陈梦彤 谷晓燕 刘甜甜 《郑州大学学报(理学版)》 CAS 北大核心 2023年第1期15-20,共6页
在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性。TextRank算法是提取关键词或者摘要的主要方法,该算法基于网络图考虑了句子间相似性,但是忽略了词语的特征。基于此,提出了一种改进T... 在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性。TextRank算法是提取关键词或者摘要的主要方法,该算法基于网络图考虑了句子间相似性,但是忽略了词语的特征。基于此,提出了一种改进TextRank算法,将相似语句合并后,考虑多种词特征进行关键句选取。首先,计算语句相似度,并且去除文中相似性较高的语句;然后,根据词频、词义、词位置对词语打分,构建有向图;最后,计算语句平均得分进行排序,选出关键句。实验结果表明,改进后的算法准确性优于其他算法,算法的时间复杂度降低,并且解决了关键词对文本描述片面和摘要烦琐的问题。 展开更多
关键词 关键句提取 改进textrank算法 相似句合并 词特征
下载PDF
基于TextRank的空管特情案例特征提取技术 被引量:1
5
作者 彭珂 王华伟 +1 位作者 倪晓梅 刘伟伟 《航空计算技术》 2023年第4期56-60,共5页
针对目前空管特情处置过程中案例记录利用不足的问题,提出了空管特情案例利用框架,并重点研究了其中的案例特征提取方法。基于TextRank算法提出了融合空管特情领域知识与数据分析的特情案例特征提取算法(Special Situation Case TextRan... 针对目前空管特情处置过程中案例记录利用不足的问题,提出了空管特情案例利用框架,并重点研究了其中的案例特征提取方法。基于TextRank算法提出了融合空管特情领域知识与数据分析的特情案例特征提取算法(Special Situation Case TextRank,SSC TextRank)。所提方法利用空管特情领域知识构建领域词典,以提升分词效果,依据风险知识及文本数据分析结果,同时结合层次分析法赋权原理对文本中的特征词进行赋权,以优化各词的初始重要度以及词语重要度权重的计算方法。利用某地区空管局提供的2000年—2019年特情案例验证算法的有效性。结果表明:模型较传统自然语言处理中的关键词提取算法准确率提高了约40%,体现了所提方法在特情案例特征提取方面的有效性和优越性。 展开更多
关键词 空管特情案例 案例利用 textrank算法 特征提取 领域知识
下载PDF
融合新词发现和改进TextRank算法的农业领域关键词提取算法 被引量:1
6
作者 邸小康 张辉 +3 位作者 秦晓婧 齐世杰 王彩虹 程旭 《农业工程》 2023年第6期21-25,共5页
针对农业领域文本中专业术语类关键词提取困难的问题,提出了一种融合新词发现和改进TextRank算法的农业领域关键词提取方法。该算法利用信息熵对文本中的词进行成词概率计算,以此发现领域专有名词和新词,通过人工审核扩充分词字典;在分... 针对农业领域文本中专业术语类关键词提取困难的问题,提出了一种融合新词发现和改进TextRank算法的农业领域关键词提取方法。该算法利用信息熵对文本中的词进行成词概率计算,以此发现领域专有名词和新词,通过人工审核扩充分词字典;在分词字典基础上,改进TextRank算法在词图构建中节点值的计算方法,添加词语位置和词性权重,利用词语综合权重提取文本关键词。对比结果表明,该算法的F值比传统的TF-IDF算法平均提高7.5%,比TextRank算法平均提高9.8%,具有一定的实用性。 展开更多
关键词 提取 新词发现 信息熵 textrank算法
下载PDF
一种基于共现关键词的TextRank文摘自动生成算法 被引量:3
7
作者 阎红灿 李铂初 谷建涛 《计算机工程与科学》 CSCD 北大核心 2023年第11期2060-2069,共10页
传统TextRank算法在生成摘要时只考虑句子间的相似度,忽略了文章本身间的相似度,且生成的摘要往往包含重复的信息表达。为此,提出一种基于共现关键词的TextRank算法,用word2vec模型将文章表示为句向量,考虑到文章的类别,将该类文章的共... 传统TextRank算法在生成摘要时只考虑句子间的相似度,忽略了文章本身间的相似度,且生成的摘要往往包含重复的信息表达。为此,提出一种基于共现关键词的TextRank算法,用word2vec模型将文章表示为句向量,考虑到文章的类别,将该类文章的共现关键词作为参数参与句子权值的迭代计算,然后,通过句子长度、关键词数量等信息对迭代得到的句子权重加以修正。实验结果表明,所提算法能够提高生成摘要的全面性和准确性。同时,所提算法使用MMR对抽取得到的摘要进行去除冗余处理,改善了摘要的重复表达情况。 展开更多
关键词 自动摘要生成 textrank 共现关键词 MMR算法 word2vec模型
下载PDF
一种改进的TextRank多文档文摘自动抽取模型
8
作者 王楠 曾曼玲 《软件导刊》 2023年第5期1-6,共6页
多文档自动文摘通过自然语言处理技术从多篇同主题的文档中提取概述性信息,可有效缓解信息负载问题,有助于用户迅速准确获取原文核心内容。针对中文文本特点,构建一种基于TextRank算法改进的多文档文摘自动抽取模型。首先通过预训练Word... 多文档自动文摘通过自然语言处理技术从多篇同主题的文档中提取概述性信息,可有效缓解信息负载问题,有助于用户迅速准确获取原文核心内容。针对中文文本特点,构建一种基于TextRank算法改进的多文档文摘自动抽取模型。首先通过预训练Word2Vec词向量模型与SIF方法融合,在中文维基百科语料库上进行预训练,获取文档中所有句子的句向量;然后借助余弦相似度构造TextRank句子间的边关系;最后使用MMR算法对文摘句进行冗余处理,得到全面又多样的文摘。通过ROUGE-N评价指标对模型进行性能评价,实验结果表明,所提模型的ROUGE-1、ROUGE-2、ROUGE-L指标值分别为0.549、0.322、0.357,均优于传统TextRank方法和Word2vec(实验样本语料)+TextRank+MMR模型,文摘质量更高。 展开更多
关键词 多文档文摘 抽取式文摘 textrank算法 Word2Vec SIF
下载PDF
基于Word2Vec及TextRank算法的长文档摘要自动生成研究 被引量:1
9
作者 朱玉婷 刘乐 +2 位作者 辛晓乐 陈珑慧 康亮河 《现代信息科技》 2023年第4期36-38,42,共4页
近年来,如何从大量信息中提取关键信息已成为一个急需解决的问题。针对中文专利长文档,提出一种结合Word2Vec和TextRank的专利生成算法。首先利用Python Jieba技术对中文专利文档进行分词,利用停用词典去除无意义的词;其次利用Word2Vec... 近年来,如何从大量信息中提取关键信息已成为一个急需解决的问题。针对中文专利长文档,提出一种结合Word2Vec和TextRank的专利生成算法。首先利用Python Jieba技术对中文专利文档进行分词,利用停用词典去除无意义的词;其次利用Word2Vec算法进行特征提取,并利用WordCloud对提取的关键词进行可视化展示;最后利用TextRank算法计算语句间的相似度,生成摘要候选句,根据候选句的权重生成该专利文档的摘要信息。实验表明,采用Word2Vec和TextRank生成的专利摘要质量高,概括性也强。 展开更多
关键词 Jieba分词 关键词提取 Word2Vec算法 textrank算法
下载PDF
基于AI算法的自然语言信息提取-翻译-校对系统设计 被引量:1
10
作者 崔丹 李舒淇 《现代电子技术》 北大核心 2024年第10期111-116,共6页
自20世纪90年代起,随着人工智能(AI)的飞速发展及其与深度学习等机器学习方法的广泛融合,自然语言处理(NLP)作为人工智能的核心,也取得了令人瞩目的进步。而随着国际学术交流、世界文化交融愈加频繁,人们搜寻、阅读他国网络信息的现实... 自20世纪90年代起,随着人工智能(AI)的飞速发展及其与深度学习等机器学习方法的广泛融合,自然语言处理(NLP)作为人工智能的核心,也取得了令人瞩目的进步。而随着国际学术交流、世界文化交融愈加频繁,人们搜寻、阅读他国网络信息的现实需求也随之增多。当信息搜寻者在搜寻非母语信息时,不仅会出现语言障碍问题,还会因错综复杂、层次不齐的各色信息而产生诸多不便。为了便于信息搜寻者快速高效地获取有用信息,文中基于人工智能算法(PageRank/TextRank)设计一种信息提取-翻译-校对(ETP)系统。系统通过AI自动搜索阅读页面上的重要信息和文本摘取,生成摘要,并基于机器翻译API模块完成翻译;其次,采用智能校对系统完成校对审核后,将信息呈现给搜寻者,以供其对全部信息高效且准确地进行预筛选,从而节省阅读时间和精力。最后对系统算法所实现的功能进行实验测试,结果达到预期。 展开更多
关键词 AI算法 自然语言处理 信息提取 机器翻译 翻译校对 PAGERANK算法 textrank算法
下载PDF
基于改进TextRank算法的大数据语义智能分析
11
作者 宋静静 宁玉富 张岳 《科技风》 2023年第20期62-64,共3页
随着时代的发展,信息也变得与时俱进,我们进入了一个信息爆炸的新时代。从浩瀚的信息中快速准确地获取自身最需要的信息变得非常困难。由此本项目基于文本分析做相关的研究,采用改进的TextRank算法,研究大数据语义智能分析来解决人工对... 随着时代的发展,信息也变得与时俱进,我们进入了一个信息爆炸的新时代。从浩瀚的信息中快速准确地获取自身最需要的信息变得非常困难。由此本项目基于文本分析做相关的研究,采用改进的TextRank算法,研究大数据语义智能分析来解决人工对关键信息摘要出现的一系列问题。 展开更多
关键词 textrank算法 文本抽取 语义分析
下载PDF
融合多特征的TextRank关键词抽取方法 被引量:33
12
作者 李航 唐超兰 +1 位作者 杨贤 沈婉婷 《情报杂志》 CSSCI 北大核心 2017年第8期183-187,共5页
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档... [目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模型词汇节点的初始权重以及概率转移矩阵,再通过迭代法实现关键词的抽取。[结果 /结论]该研究方法结合了文档集整体信息和单文档自身信息,其关键词提取的准确率较传统TextRank方法、TFIDF-TextRank方法有了明显的提高。 展开更多
关键词 textrank算法 关键词抽取 神经网络 平均信息熵
下载PDF
基于加权TextRank的新闻关键事件主题句提取 被引量:11
13
作者 蒲梅 周枫 +2 位作者 周晶晶 严馨 周兰江 《计算机工程》 CAS CSCD 北大核心 2017年第8期219-224,共6页
为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息。通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句。基于TextR... 为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息。通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句。基于TextRank算法的思想,构建一个事件句有向图,引入句子位置、句子相似度和关键词覆盖频率3个影响因子,以此计算句子之间的影响权重,利用TextRank模型对图中的每个点计算权重,并选取排序最靠前的句子作为关键事件的主题句。实验结果表明,该方法的抽取效果优于基于词频-逆文档概率和新闻标题的主题句抽取方法。 展开更多
关键词 textrank算法 句子相似度 关键事件 主题句提取 影响权重
下载PDF
面向风电机组运维的知识图谱构建研究与应用 被引量:2
14
作者 黄简 杨程 +4 位作者 冯天波 孙宁 李嘉文 余恒文 崔昊杨 《电力系统保护与控制》 EI CSCD 北大核心 2024年第8期167-177,共11页
规模化风机高频运维信息愈发呈现数据高维、类间互联、规模攀升的特点,传统人工孤岛式故障检修运维模式难以适应人机料法环一体式发展进程。针对风机全环节、全要素的主动运维要求,提出知识规则、主从设备、规范条例一体融合的风电机组... 规模化风机高频运维信息愈发呈现数据高维、类间互联、规模攀升的特点,传统人工孤岛式故障检修运维模式难以适应人机料法环一体式发展进程。针对风机全环节、全要素的主动运维要求,提出知识规则、主从设备、规范条例一体融合的风电机组运维知识图谱构建方法。利用图论文本关键词提取算法(TextRank)完成对风电专业运维文本的实体识别与关系抽取,用以提高特征词的提取精度。采用Neo4j图数据库构建风电安全管理规程图谱及风电设备运维图谱,实现多元数据的互联与可视,进而实现风电运维信息的智能化查询。应用上述方法构建了629个实体、742条关系类型的风机知识图谱。数据查询试验表明:该方法的精确率及召回率等主要指标均在89%以上,较传统数据库方法平均提升了6.5%。该方法建立了运维要求可视表达和类间任务关联。运维大数据的有效查询,将有助于节省双碳战略风电运维力量,提高运维智能化水平。 展开更多
关键词 风电机组运维 知识图谱 textrank算法 Neo4j图数据库
下载PDF
基于改进TextRank的关键词抽取算法 被引量:14
15
作者 张莉婧 李业丽 +2 位作者 曾庆涛 雷嘉丽 杨鹏 《北京印刷学院学报》 2016年第4期51-55,共5页
为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法——TextRank-CM算法。将T... 为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法——TextRank-CM算法。将TextRank-CM算法、TextRank+TF-IDF算法和TextRank算法分别应用于中文关键词的抽取,结果表明:TextRank-CM算法在中文关键词抽取中的准确率和召回率明显优于另两种算法。 展开更多
关键词 textrank-CM算法 textrank算法 G1赋权法 关键词抽取
下载PDF
融合语义特征的无监督关键词提取算法
16
作者 赵长路 刘军 +1 位作者 胡佳 胡宝权 《计算机与数字工程》 2024年第7期1909-1915,1926,共8页
针对传统的词图模型的关键词提取算法缺乏文本语义理解的不足,提出一种融合语义特征的无监督关键词提取算法,该方法结合词嵌入技术与词图模型的思想,将文本语义信息和语序信息同时融入到传统的词图模型算法中。首先利用Word2vec和Doc2ve... 针对传统的词图模型的关键词提取算法缺乏文本语义理解的不足,提出一种融合语义特征的无监督关键词提取算法,该方法结合词嵌入技术与词图模型的思想,将文本语义信息和语序信息同时融入到传统的词图模型算法中。首先利用Word2vec和Doc2vec模型分别对词和文本进行向量表征,获取文本的语序信息,然后通过词向量计算出候选词与文本之间的语义相似度,进而改进TextRank算法,重新对候选关键词之间的边权值和初始值进行分配,并构建对应的重启概率矩阵和转移概率矩阵用于词图模型迭代计算候选词的分值以及关键词的提取。实验结果表明,有效地融合文本的语义信息和语序信息能够提升关键词提取的准确性。 展开更多
关键词 提取 语义信息 语序信息 向量表征 textrank算法
下载PDF
基于TextRank算法的未知网络协议帧定位方法 被引量:1
17
作者 刘治国 宋广跃 +1 位作者 蔡文珠 刘庆利 《计算机工程》 CAS CSCD 北大核心 2020年第7期179-184,共6页
针对未知网络环境下比特流形式的通信数据难以进行帧定界的问题,提出一种基于TextRank算法的帧定位方法。通过统计数据中的序列出现频率获得比特流中的节点权重,利用基于TextRank的BitstreamRank算法确定未知协议数据中的关键序列,并根... 针对未知网络环境下比特流形式的通信数据难以进行帧定界的问题,提出一种基于TextRank算法的帧定位方法。通过统计数据中的序列出现频率获得比特流中的节点权重,利用基于TextRank的BitstreamRank算法确定未知协议数据中的关键序列,并根据关键序列对比特流进行切分并计算得到各段比特流间的序列相似度,从而定位未知协议数据的帧头位置。仿真结果表明,该方法能实现未知网络协议数据的快速分析,准确定位出比特流数据中各帧的位置,并且帧定位准确率高于90%。 展开更多
关键词 帧定位 textrank算法 序列统计 序列相似度 模式匹配
下载PDF
Title加TextRank抽取关键句的情感分类研究 被引量:6
18
作者 郑诚 钱改林 章金平 《计算机工程与应用》 CSCD 北大核心 2019年第20期95-100,共6页
考虑到不同句子对判断文档情感倾向的重要程度不同,因而区分文档的关键句和细节句将有助于提高情感分类的性能。同时,考虑到Title 和上下文信息,提出了一种基于Title 和加权TextRank 抽取关键句的情感分析方法SKTT,实现了高效的情感分... 考虑到不同句子对判断文档情感倾向的重要程度不同,因而区分文档的关键句和细节句将有助于提高情感分类的性能。同时,考虑到Title 和上下文信息,提出了一种基于Title 和加权TextRank 抽取关键句的情感分析方法SKTT,实现了高效的情感分析。根据文档Title 的情感权重计算Title 贡献度,考虑到标点和语义规则对情感倾向的影响;根据加权TextRank 算法思想,在文档正文中构建了一个情感句有向图来提取关键句;计算所有关键句的情感倾向进行情感分类。在4 个领域上进行实验,实验结果表明,该SKTT方法性能明显优于Baseline,具有高效性。 展开更多
关键词 TITLE textrank 算法 关键句 情感分类 语义规则
下载PDF
基于主题的SE-TextRank情感摘要方法 被引量:8
19
作者 刘志明 于波 +3 位作者 欧阳纯萍 余颖 阳小华 翟云 《情报工程》 2017年第3期97-104,共8页
技术的目的是以简洁的形式准确表达文章的核心情感内容。为解决不同的文档结构及内容特征等问题对摘要结果的影响,提出了一种基于主题的SE-TextRank情感摘要方法。通过LDA模型自动获取收敛后的文本主题,利用余弦距离算法进行主题句子分... 技术的目的是以简洁的形式准确表达文章的核心情感内容。为解决不同的文档结构及内容特征等问题对摘要结果的影响,提出了一种基于主题的SE-TextRank情感摘要方法。通过LDA模型自动获取收敛后的文本主题,利用余弦距离算法进行主题句子分组,使用传统多特征融合以及SE-TextRank情感摘要算法对组内中心句抽取,最终获取目的摘要。实验表明,采用此方法能够更为高效的获取新闻文本摘要结果。 展开更多
关键词 文本摘要 LDA模型 余弦距离 SE-textrank 特征融合
下载PDF
一种改进的TextRank关键词提取算法 被引量:9
20
作者 李志强 潘苏含 +1 位作者 戴娟 胡佳佳 《计算机技术与发展》 2020年第3期77-81,共5页
关键词提取在自然语言处理领域有着广泛的应用,如何准确、快速地从文本中获取关键词信息已经成为文本处理的关键性问题。现有的关键词提取方法很多,但是这些关键词提取方法的准确率和通用性有待提高。因此,提出了一种改进的TextRank关... 关键词提取在自然语言处理领域有着广泛的应用,如何准确、快速地从文本中获取关键词信息已经成为文本处理的关键性问题。现有的关键词提取方法很多,但是这些关键词提取方法的准确率和通用性有待提高。因此,提出了一种改进的TextRank关键词提取方法,该方法使用TF-IDF方法与平均信息熵方法计算文本中词语的重要性,然后根据计算结果得到词语的综合权重。利用词语的综合权重改进TextRank算法的节点初始值以及节点概率转移矩阵,通过迭代的方式计算各个节点的权重,直至收敛,从而得到词语的权重信息,选择top N个词语作为关键词输出,实现关键词的提取功能。实验结果表明,相较于传统的TF-IDF方法和TextRank方法,提出的改进后的TextRank关键词提取方法有更好的通用性,提取的关键词的准确率更高。 展开更多
关键词 提取 TF-IDF算法 textrank算法 平均信息熵 自然语言处理
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部