期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于词-主题-文本异质网络的短文本分类方法
1
作者
徐涛
赵星甲
卢敏
《计算机应用与软件》
北大核心
2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学...
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。
展开更多
关键词
词-主题-文本异质网络
词
共现
文本
-
主题
分布
短
文本
分类
下载PDF
职称材料
基于“文本-主题”双层次分析的网络虚假评论检测法研究——以电子商务网站为例
被引量:
2
2
作者
赵衍
《数字图书馆论坛》
CSSCI
2015年第9期53-60,共8页
首先从"重复度"和"主题相关度"两个维度对网络虚假评论进行了详细的分类;基于此,结合现有技术,提出一种较为系统且成本较低的"文本-主题"双层次网络虚假评论检测方法;将该方法应用于国内某电子商务网站...
首先从"重复度"和"主题相关度"两个维度对网络虚假评论进行了详细的分类;基于此,结合现有技术,提出一种较为系统且成本较低的"文本-主题"双层次网络虚假评论检测方法;将该方法应用于国内某电子商务网站的虚假评论检测,获得了较理想的效果。
展开更多
关键词
网络
虚假评论
网络
评论
评论检测
“
文本
-
主题
”双层次分析
下载PDF
职称材料
基于组合-卷积神经网络的中文新闻文本分类
被引量:
24
3
作者
张昱
刘开峰
+2 位作者
张全新
王艳歌
高凯龙
《电子学报》
EI
CAS
CSCD
北大核心
2021年第6期1059-1067,共9页
目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec...
目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec预训练词向量进行文本特征构建.为了解决特征提取不完善的问题,通过改进经典卷积神经网络模型结构,研究不同的卷积和池化操作对分类结果的影响.为提高新闻文本分类的精确率,本文提出并实现了一种组合-卷积神经网络模型,设计了有效的模型正则化和优化方法.实验结果表明,组合-卷积神经网络模型对中文新闻文本分类的精确率达到93.69%,相比最优的传统机器学习方法和经典卷积神经网络模型精确率分别提升6.34%和1.19%,并在召回率和F值两项指标上均优于对比模型.
展开更多
关键词
自然语言处理
词
向量
组合
-
卷积神经
网络
中文新闻
文本
分类
下载PDF
职称材料
基于联合主题特征的网络新闻文本蕴含环境污染事件检测
被引量:
5
4
作者
黄宗财
仇培元
+1 位作者
陆锋
吴升
《地球信息科学学报》
CSCD
北大核心
2019年第10期1510-1517,共8页
网络新闻文本在环境污染事件感知方面具有重要的应用价值。然而,由于环境污染事件的"多米诺效应",网络新闻文本往往存在对多类型污染事件的混合描述,现有事件检测方法容易导致文本分类错误。本文提出一种基于联合主题特征的...
网络新闻文本在环境污染事件感知方面具有重要的应用价值。然而,由于环境污染事件的"多米诺效应",网络新闻文本往往存在对多类型污染事件的混合描述,现有事件检测方法容易导致文本分类错误。本文提出一种基于联合主题特征的网络新闻文本蕴含环境污染事件检测方法,通过兼顾环境网络新闻文本的全局特征和主题分布特征来改善检测分类效果。该方法采用词频-逆文档频率向量对文档进行全局特征表示,并结合文档的主题分布特征向量,构建联合主题特征向量作为监督分类模型的输入,实现环境污染事件检测。实验结果表明,使用联合主题特征的支持向量机方法进行事件类别检测平均F1值相较于全局特征提高15%,相较于主题特征提高36%。本文提出的网络新闻文本蕴含环境污染事件检测方法可支持污染事件类型检测和影响信息抽取,有助于环境污染事件的时空统计与变化趋势预测。
展开更多
关键词
网络
新闻
文本
事件检测
环境污染事件
联合
主题
特征向量
词
频
-
逆文档频率向量
支持向量机
原文传递
基于改进卷积神经网络的多标签文本自动化分类研究
被引量:
2
5
作者
刘影
余进
陈莉
《自动化与仪器仪表》
2023年第11期62-66,共5页
为实现多标签文本自动分类,有效管理与检索文本信息,为后续的数据挖掘作好准备,提出基于改进卷积神经网络的多标签文本自动化分类方法。在卷积神经网络卷积层前、后分别加入注意力机制,使网络的注意力集中在多标签文本重要特征上,达到...
为实现多标签文本自动分类,有效管理与检索文本信息,为后续的数据挖掘作好准备,提出基于改进卷积神经网络的多标签文本自动化分类方法。在卷积神经网络卷积层前、后分别加入注意力机制,使网络的注意力集中在多标签文本重要特征上,达到改进卷积神经网络的目的,利用改进后的网络提取多标签文本的文本特征;通过附加类别标签的LDA模型获得词-标签概率数据,将其输入至双向长短期记忆网络模型中,得到多标签文本各个标签间的相关性,并结合改进卷积神经网络提取多标签文本词-标签特征;将两种特征实施拼接操作后,输入至训练好的全连接神经网络中,完成多标签文本的分类与输出。实验证明:该方法可以有效实现多标签文本自动化分类,应用的网络模型较为合理,面对不同语言的多标签文本也能够较好地完成自动化分类。
展开更多
关键词
卷积神经
网络
多标签
文本
文本
特征
自动分类
注意力机制
词
-
标签特征
原文传递
基于LDA的数字图书馆知识组合分析
6
作者
周娜
李秀霞
《内蒙古科技与经济》
2018年第17期135-138,共4页
为了更为全面地探索和发现研究领域的热点主题和受欢迎的"主题-方法"对,文章提出了基于分类视角的LDA主题抽取方法;以数字图书馆领域为研究对象,利用LDA主题模型对文献集进行主题抽取,得到25个热点主题,将主题分为两类:主题...
为了更为全面地探索和发现研究领域的热点主题和受欢迎的"主题-方法"对,文章提出了基于分类视角的LDA主题抽取方法;以数字图书馆领域为研究对象,利用LDA主题模型对文献集进行主题抽取,得到25个热点主题,将主题分为两类:主题与方法,通过深入分析各"主题-方法"对,发现热点主题所揭示的知识点;结果表明:基于分类视角的LDA主题抽取方法能够较为全面、细致地挖掘研究领域的学科主题和研究热点,所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献分析出的传播学领域研究热点进行对照。
展开更多
关键词
数字图书馆
“
主题
-
方法”
网络
Gephi
-
0.8.2
LDA模型
文本
挖掘
下载PDF
职称材料
题名
基于词-主题-文本异质网络的短文本分类方法
1
作者
徐涛
赵星甲
卢敏
机构
中国民航大学计算机科学与技术学院
中国民航信息技术科研基地
航空公司人工智能民航局重点实验室
出处
《计算机应用与软件》
北大核心
2024年第1期146-152,182,共8页
基金
天津市自然科学基金项目(18JCYBJC85100)
中央高校基本科研业务费专项资金项目(3122014D032)
航空公司人工智能民航局重点实验室项目。
文摘
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。
关键词
词-主题-文本异质网络
词
共现
文本
-
主题
分布
短
文本
分类
Keywords
Word
-
topic
-
document heterogeneous network
Word co
-
occurrence
Document
-
topic distribution
Short text classification
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于“文本-主题”双层次分析的网络虚假评论检测法研究——以电子商务网站为例
被引量:
2
2
作者
赵衍
机构
上海外国语大学信息技术中心
上海外国语大学电子政务国际化研究中心
出处
《数字图书馆论坛》
CSSCI
2015年第9期53-60,共8页
基金
2013年上海市哲学社会科学规划课题(编号:2013ETQ001)
上海市教育委员会2014年科研创新项目(编号:14ZS070)
+2 种基金
上海外国语大学"2013教学科研团队"项目
上海外国语大学"2014青年教师创新团队"项目(编号:QJTD14ZY001)
上海外国语大学高层次人才发展计划(编号:KX171260)资助
文摘
首先从"重复度"和"主题相关度"两个维度对网络虚假评论进行了详细的分类;基于此,结合现有技术,提出一种较为系统且成本较低的"文本-主题"双层次网络虚假评论检测方法;将该方法应用于国内某电子商务网站的虚假评论检测,获得了较理想的效果。
关键词
网络
虚假评论
网络
评论
评论检测
“
文本
-
主题
”双层次分析
Keywords
Web Review
Fake Web Review
Fake Review Detecting
'Text
-
theme'Double
-
Level Analysis
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
G350 [文化科学—情报学]
下载PDF
职称材料
题名
基于组合-卷积神经网络的中文新闻文本分类
被引量:
24
3
作者
张昱
刘开峰
张全新
王艳歌
高凯龙
机构
北京建筑大学电气与信息工程学院&建筑大数据智能处理方法研究北京市重点实验室
中国矿业大学深部岩土力学与地下工程国家重点实验室
北京理工大学计算机科学与技术学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2021年第6期1059-1067,共9页
基金
北京建筑大学优秀主讲教师培育计划(No.21082718041)
国家重点研发计划(No.2016YFC0600901)
+2 种基金
教育部2018产学合作协同育人项目(No.201801113001)
市属高校基本科研业务费(No.30850919027)
北京建筑大学研究生创新项目(No.PG2020051)。
文摘
目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec预训练词向量进行文本特征构建.为了解决特征提取不完善的问题,通过改进经典卷积神经网络模型结构,研究不同的卷积和池化操作对分类结果的影响.为提高新闻文本分类的精确率,本文提出并实现了一种组合-卷积神经网络模型,设计了有效的模型正则化和优化方法.实验结果表明,组合-卷积神经网络模型对中文新闻文本分类的精确率达到93.69%,相比最优的传统机器学习方法和经典卷积神经网络模型精确率分别提升6.34%和1.19%,并在召回率和F值两项指标上均优于对比模型.
关键词
自然语言处理
词
向量
组合
-
卷积神经
网络
中文新闻
文本
分类
Keywords
natural language processing
word vector
combined
-
convolutional neural network
Chinese news
text classification
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于联合主题特征的网络新闻文本蕴含环境污染事件检测
被引量:
5
4
作者
黄宗财
仇培元
陆锋
吴升
机构
福州大学数字中国研究院(福州)
海西政务大数据应用协同创新中心
中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室
出处
《地球信息科学学报》
CSCD
北大核心
2019年第10期1510-1517,共8页
基金
国家自然科学基金重点项目(41631177)
数字福建建设项目(闽发改网数字函[2014]191号、[2016]23号、[2016]77号)
福建省科技创新平台项目(2015H2001)~~
文摘
网络新闻文本在环境污染事件感知方面具有重要的应用价值。然而,由于环境污染事件的"多米诺效应",网络新闻文本往往存在对多类型污染事件的混合描述,现有事件检测方法容易导致文本分类错误。本文提出一种基于联合主题特征的网络新闻文本蕴含环境污染事件检测方法,通过兼顾环境网络新闻文本的全局特征和主题分布特征来改善检测分类效果。该方法采用词频-逆文档频率向量对文档进行全局特征表示,并结合文档的主题分布特征向量,构建联合主题特征向量作为监督分类模型的输入,实现环境污染事件检测。实验结果表明,使用联合主题特征的支持向量机方法进行事件类别检测平均F1值相较于全局特征提高15%,相较于主题特征提高36%。本文提出的网络新闻文本蕴含环境污染事件检测方法可支持污染事件类型检测和影响信息抽取,有助于环境污染事件的时空统计与变化趋势预测。
关键词
网络
新闻
文本
事件检测
环境污染事件
联合
主题
特征向量
词
频
-
逆文档频率向量
支持向量机
Keywords
news corpora
event detection
environmental pollution event
joint thematic features vector
TF
-
IDF
SVM
分类号
G21 [文化科学—新闻学]
原文传递
题名
基于改进卷积神经网络的多标签文本自动化分类研究
被引量:
2
5
作者
刘影
余进
陈莉
机构
武汉问道信息技术有限公司
出处
《自动化与仪器仪表》
2023年第11期62-66,共5页
文摘
为实现多标签文本自动分类,有效管理与检索文本信息,为后续的数据挖掘作好准备,提出基于改进卷积神经网络的多标签文本自动化分类方法。在卷积神经网络卷积层前、后分别加入注意力机制,使网络的注意力集中在多标签文本重要特征上,达到改进卷积神经网络的目的,利用改进后的网络提取多标签文本的文本特征;通过附加类别标签的LDA模型获得词-标签概率数据,将其输入至双向长短期记忆网络模型中,得到多标签文本各个标签间的相关性,并结合改进卷积神经网络提取多标签文本词-标签特征;将两种特征实施拼接操作后,输入至训练好的全连接神经网络中,完成多标签文本的分类与输出。实验证明:该方法可以有效实现多标签文本自动化分类,应用的网络模型较为合理,面对不同语言的多标签文本也能够较好地完成自动化分类。
关键词
卷积神经
网络
多标签
文本
文本
特征
自动分类
注意力机制
词
-
标签特征
Keywords
convolutional neural network
multi
-
label text
text features
automatic classification
attention mechanism
word
-
tag characteristics
分类号
TP389.1 [自动化与计算机技术—计算机系统结构]
原文传递
题名
基于LDA的数字图书馆知识组合分析
6
作者
周娜
李秀霞
机构
曲阜师范大学传媒学院
出处
《内蒙古科技与经济》
2018年第17期135-138,共4页
文摘
为了更为全面地探索和发现研究领域的热点主题和受欢迎的"主题-方法"对,文章提出了基于分类视角的LDA主题抽取方法;以数字图书馆领域为研究对象,利用LDA主题模型对文献集进行主题抽取,得到25个热点主题,将主题分为两类:主题与方法,通过深入分析各"主题-方法"对,发现热点主题所揭示的知识点;结果表明:基于分类视角的LDA主题抽取方法能够较为全面、细致地挖掘研究领域的学科主题和研究热点,所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献分析出的传播学领域研究热点进行对照。
关键词
数字图书馆
“
主题
-
方法”
网络
Gephi
-
0.8.2
LDA模型
文本
挖掘
分类号
G250.76 [文化科学—图书馆学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于词-主题-文本异质网络的短文本分类方法
徐涛
赵星甲
卢敏
《计算机应用与软件》
北大核心
2024
0
下载PDF
职称材料
2
基于“文本-主题”双层次分析的网络虚假评论检测法研究——以电子商务网站为例
赵衍
《数字图书馆论坛》
CSSCI
2015
2
下载PDF
职称材料
3
基于组合-卷积神经网络的中文新闻文本分类
张昱
刘开峰
张全新
王艳歌
高凯龙
《电子学报》
EI
CAS
CSCD
北大核心
2021
24
下载PDF
职称材料
4
基于联合主题特征的网络新闻文本蕴含环境污染事件检测
黄宗财
仇培元
陆锋
吴升
《地球信息科学学报》
CSCD
北大核心
2019
5
原文传递
5
基于改进卷积神经网络的多标签文本自动化分类研究
刘影
余进
陈莉
《自动化与仪器仪表》
2023
2
原文传递
6
基于LDA的数字图书馆知识组合分析
周娜
李秀霞
《内蒙古科技与经济》
2018
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部