期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于TextRank和簇过滤的林业文本关键信息抽取研究 被引量:13
1
作者 陈志泊 李钰曼 +3 位作者 许福 冯国明 师栋瑜 崔晓晖 《农业机械学报》 EI CAS CSCD 北大核心 2020年第5期207-214,172,共9页
目前,获取林业文本关键信息存在2个问题:关键信息获取主要从关键词角度考虑,忽略了词语的信息类型;网络上的林业文本没有统一的记述结构,词语信息类型提取困难。为此,本文提出了基于改进TextRank和簇过滤的林业文本关键信息抽取方法,以... 目前,获取林业文本关键信息存在2个问题:关键信息获取主要从关键词角度考虑,忽略了词语的信息类型;网络上的林业文本没有统一的记述结构,词语信息类型提取困难。为此,本文提出了基于改进TextRank和簇过滤的林业文本关键信息抽取方法,以“关键词+信息类型”两部分表示文本关键信息。首先,抽取关键词并进行Word2Vec向量化,然后通过构建融合词语特征值、边权值的图模型对TextRank进行改进,对经迭代收敛得到的稳定图进行归并聚类形成簇;然后,设计簇品质评价公式进行簇过滤,再次应用TextRank形成最终簇集合;最后,对簇进行信息类型标注。对于测试文本,通过比较关键词向量和簇心向量的距离获得词语的信息类型,将信息类型与关键词结合得到文本的关键信息。基于2000篇与林业政策新闻相关的林业文本进行实验,最终簇集合的紧密度为0.9680,间隔度为0.0572,综合评价指标为0.8871;对其中400篇文本进行关键词人工标注,将本文关键词抽取方法与TextRank、TF IDF等6种算法进行比较,结果表明,本文方法在MRR、Bpref、准确率和综合评价指标上均获得了较好的效果,说明本文方法在提取林业文本关键词方面具有优势。 展开更多
关键词 林业文本 关键词抽取 TextRank 簇过滤 信息类型
下载PDF
改进的PSO-RBF神经网络在联合制碱中的应用
2
作者 李永伟 李钰曼 +1 位作者 王红飞 李丽铭 《河北科技大学学报》 CAS 2017年第6期578-584,共7页
联合制碱过程是一类典型的复杂工业过程,具有时变、非线性、不确定性等特征,在线控制模型难以建立。针对联合制碱复杂工业过程控制精度不高、鲁棒性差等问题,提出一种改进的PSO-RBF神经网络控制算法。将粒子群优化算法和径向基神经网络... 联合制碱过程是一类典型的复杂工业过程,具有时变、非线性、不确定性等特征,在线控制模型难以建立。针对联合制碱复杂工业过程控制精度不高、鲁棒性差等问题,提出一种改进的PSO-RBF神经网络控制算法。将粒子群优化算法和径向基神经网络相结合,使用改良的粒子群优化算法对RBF神经网络的隐含层基函数中心、宽度和输出层的连接权值进行寻优,建立基于改进的PSO算法优化后的RBF神经网络模型。将改进的PSO-RBF神经网络控制模型应用到联合制碱的关键工序碳化过程中,并与先前应用的模糊神经网络控制模型进行比较,经仿真研究验证表明,在联合制碱碳化过程中应用改进的PSO-RBF神经网络控制算法,其控制精度和系统鲁棒性得到了有效的提高,为解决一类复杂工业过程的建模与优化控制方法研究提供了有效的技术途径。 展开更多
关键词 自动化技术应用 联合制碱 粒子群优化算法 RBF神经网络 优化控制
下载PDF
基于KACC模型的文本分类研究 被引量:4
3
作者 李钰曼 陈志泊 许福 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第10期89-97,共9页
【目的】通过提高文本内容表示的数据质量,关联文本内容和文本标签向量,从而提高文本分类的效果。【方法】改进关键词的抽取方法,并使用关键词向量表示文本,提出类别标签表示算法对文本类别进行向量化表示,提出基于注意力机制的胶囊网... 【目的】通过提高文本内容表示的数据质量,关联文本内容和文本标签向量,从而提高文本分类的效果。【方法】改进关键词的抽取方法,并使用关键词向量表示文本,提出类别标签表示算法对文本类别进行向量化表示,提出基于注意力机制的胶囊网络作为分类器,构建KACC模型,并进行文本分类的对比实验。【结果】KACC模型有效提高了数据质量;实验结果表明,KACC模型在准确率、召回率、F值三方面均优于现有模型,分类准确率达97.4%。【局限】实验数据规模受限,未对类别区分度在其他语料上的代表性进行探究。【结论】KACC模型在文本分类方面与现有分类方法相比具有更好的分类效率和效果。 展开更多
关键词 文本分类 关键词抽取 注意力机制 胶囊网络 类别标签表示
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部