期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于词-主题-文本异质网络的短文本分类方法
1
作者 徐涛 赵星甲 卢敏 《计算机应用与软件》 北大核心 2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学... 针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。 展开更多
关键词 词-主题-文本异质网络 共现 文本-主题分布 文本分类
下载PDF
基于“文本-主题”双层次分析的网络虚假评论检测法研究——以电子商务网站为例 被引量:2
2
作者 赵衍 《数字图书馆论坛》 CSSCI 2015年第9期53-60,共8页
首先从"重复度"和"主题相关度"两个维度对网络虚假评论进行了详细的分类;基于此,结合现有技术,提出一种较为系统且成本较低的"文本-主题"双层次网络虚假评论检测方法;将该方法应用于国内某电子商务网站... 首先从"重复度"和"主题相关度"两个维度对网络虚假评论进行了详细的分类;基于此,结合现有技术,提出一种较为系统且成本较低的"文本-主题"双层次网络虚假评论检测方法;将该方法应用于国内某电子商务网站的虚假评论检测,获得了较理想的效果。 展开更多
关键词 网络虚假评论 网络评论 评论检测 文本-主题”双层次分析
下载PDF
基于组合-卷积神经网络的中文新闻文本分类 被引量:24
3
作者 张昱 刘开峰 +2 位作者 张全新 王艳歌 高凯龙 《电子学报》 EI CAS CSCD 北大核心 2021年第6期1059-1067,共9页
目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec... 目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec预训练词向量进行文本特征构建.为了解决特征提取不完善的问题,通过改进经典卷积神经网络模型结构,研究不同的卷积和池化操作对分类结果的影响.为提高新闻文本分类的精确率,本文提出并实现了一种组合-卷积神经网络模型,设计了有效的模型正则化和优化方法.实验结果表明,组合-卷积神经网络模型对中文新闻文本分类的精确率达到93.69%,相比最优的传统机器学习方法和经典卷积神经网络模型精确率分别提升6.34%和1.19%,并在召回率和F值两项指标上均优于对比模型. 展开更多
关键词 自然语言处理 向量 组合-卷积神经网络 中文新闻 文本分类
下载PDF
基于联合主题特征的网络新闻文本蕴含环境污染事件检测 被引量:5
4
作者 黄宗财 仇培元 +1 位作者 陆锋 吴升 《地球信息科学学报》 CSCD 北大核心 2019年第10期1510-1517,共8页
网络新闻文本在环境污染事件感知方面具有重要的应用价值。然而,由于环境污染事件的"多米诺效应",网络新闻文本往往存在对多类型污染事件的混合描述,现有事件检测方法容易导致文本分类错误。本文提出一种基于联合主题特征的... 网络新闻文本在环境污染事件感知方面具有重要的应用价值。然而,由于环境污染事件的"多米诺效应",网络新闻文本往往存在对多类型污染事件的混合描述,现有事件检测方法容易导致文本分类错误。本文提出一种基于联合主题特征的网络新闻文本蕴含环境污染事件检测方法,通过兼顾环境网络新闻文本的全局特征和主题分布特征来改善检测分类效果。该方法采用词频-逆文档频率向量对文档进行全局特征表示,并结合文档的主题分布特征向量,构建联合主题特征向量作为监督分类模型的输入,实现环境污染事件检测。实验结果表明,使用联合主题特征的支持向量机方法进行事件类别检测平均F1值相较于全局特征提高15%,相较于主题特征提高36%。本文提出的网络新闻文本蕴含环境污染事件检测方法可支持污染事件类型检测和影响信息抽取,有助于环境污染事件的时空统计与变化趋势预测。 展开更多
关键词 网络新闻文本 事件检测 环境污染事件 联合主题特征向量 -逆文档频率向量 支持向量机
原文传递
基于改进卷积神经网络的多标签文本自动化分类研究 被引量:2
5
作者 刘影 余进 陈莉 《自动化与仪器仪表》 2023年第11期62-66,共5页
为实现多标签文本自动分类,有效管理与检索文本信息,为后续的数据挖掘作好准备,提出基于改进卷积神经网络的多标签文本自动化分类方法。在卷积神经网络卷积层前、后分别加入注意力机制,使网络的注意力集中在多标签文本重要特征上,达到... 为实现多标签文本自动分类,有效管理与检索文本信息,为后续的数据挖掘作好准备,提出基于改进卷积神经网络的多标签文本自动化分类方法。在卷积神经网络卷积层前、后分别加入注意力机制,使网络的注意力集中在多标签文本重要特征上,达到改进卷积神经网络的目的,利用改进后的网络提取多标签文本的文本特征;通过附加类别标签的LDA模型获得词-标签概率数据,将其输入至双向长短期记忆网络模型中,得到多标签文本各个标签间的相关性,并结合改进卷积神经网络提取多标签文本词-标签特征;将两种特征实施拼接操作后,输入至训练好的全连接神经网络中,完成多标签文本的分类与输出。实验证明:该方法可以有效实现多标签文本自动化分类,应用的网络模型较为合理,面对不同语言的多标签文本也能够较好地完成自动化分类。 展开更多
关键词 卷积神经网络 多标签文本 文本特征 自动分类 注意力机制 -标签特征
原文传递
基于LDA的数字图书馆知识组合分析
6
作者 周娜 李秀霞 《内蒙古科技与经济》 2018年第17期135-138,共4页
为了更为全面地探索和发现研究领域的热点主题和受欢迎的"主题-方法"对,文章提出了基于分类视角的LDA主题抽取方法;以数字图书馆领域为研究对象,利用LDA主题模型对文献集进行主题抽取,得到25个热点主题,将主题分为两类:主题... 为了更为全面地探索和发现研究领域的热点主题和受欢迎的"主题-方法"对,文章提出了基于分类视角的LDA主题抽取方法;以数字图书馆领域为研究对象,利用LDA主题模型对文献集进行主题抽取,得到25个热点主题,将主题分为两类:主题与方法,通过深入分析各"主题-方法"对,发现热点主题所揭示的知识点;结果表明:基于分类视角的LDA主题抽取方法能够较为全面、细致地挖掘研究领域的学科主题和研究热点,所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献分析出的传播学领域研究热点进行对照。 展开更多
关键词 数字图书馆 主题-方法”网络 Gephi-0.8.2 LDA模型 文本挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部