期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于预训练模型融合深层特征词向量的中文文本分类
被引量:
1
1
作者
汤英杰
刘媛华
《上海理工大学学报》
CAS
CSCD
北大核心
2023年第2期189-197,204,共10页
为解决传统模型表示出的词向量存在序列、上下文、语法、语义以及深层次的信息表示不明的情况,提出一种基于预训练模型(Roberta)融合深层特征词向量的深度神经网络模型,处理中文文本分类的问题。通过Roberta模型生成含有上下文语义、语...
为解决传统模型表示出的词向量存在序列、上下文、语法、语义以及深层次的信息表示不明的情况,提出一种基于预训练模型(Roberta)融合深层特征词向量的深度神经网络模型,处理中文文本分类的问题。通过Roberta模型生成含有上下文语义、语法信息的句子向量和含有句子结构特征的词向量,使用DPCNN模型和改进门控模型(RGRU)对词向量进行特征提取和融合,得到含有深层结构和局部信息的特征词向量,将句子向量与特征词向量融合在一起得到新向量。最后,新向量经过softmax激活层后,输出结果。在实验结果中,以F1值、准确率、召回率为评价标准,在THUCNews长文本中,这些指标分别达到了98.41%,98.44%,98.41%。同时,该模型在短文本分类中也取得了很好的成绩。
展开更多
关键词
预训练模型
Roberta模型
DPCNN模型
特征词向量
中文文本分类
下载PDF
职称材料
基于中文学术期刊人工标引的自动分类新算法
被引量:
1
2
作者
王洪
贾惠波
徐端颐
《现代图书情报技术》
CSSCI
北大核心
2002年第S1期59-62,共4页
为了解决中文学术期刊电子化过程中出现的自动分类问题,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间,并考虑到人工标引在分类中的关键作用,得到综合了特征词IF和IDF权重的...
为了解决中文学术期刊电子化过程中出现的自动分类问题,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间,并考虑到人工标引在分类中的关键作用,得到综合了特征词IF和IDF权重的分类准则。通过适当训练建立分类库,计算待分类样本与已知分类的相似性,判别各分类。实验表明,该分类算法可以获得85%以上的分类识别率。
展开更多
关键词
自动分类
人工标引
特征词向量
空间
【分类号】
TP391
下载PDF
职称材料
基于人工标引的中文学术期刊文献自动分类算法
被引量:
6
3
作者
王洪
贾惠波
徐端颐
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2002年第6期787-790,共4页
为了解决期刊电子化的自动分类问题 ,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间 ,并考虑到人工标引在分类中的关键作用 ,得到综合了特征词 TF和 IDF权重的分类准则。通...
为了解决期刊电子化的自动分类问题 ,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间 ,并考虑到人工标引在分类中的关键作用 ,得到综合了特征词 TF和 IDF权重的分类准则。通过适当训练建立分类库 ,计算待分类样本与已知分类的相似性 ,判别各分类。实验表明 :该分类算法可以获得 85
展开更多
关键词
人工标引
中文学术期刊
文献
自动分类算法
特征词向量
空间
原文传递
题名
基于预训练模型融合深层特征词向量的中文文本分类
被引量:
1
1
作者
汤英杰
刘媛华
机构
上海理工大学管理学院
出处
《上海理工大学学报》
CAS
CSCD
北大核心
2023年第2期189-197,204,共10页
基金
国家自然科学基金资助项目(71771152)。
文摘
为解决传统模型表示出的词向量存在序列、上下文、语法、语义以及深层次的信息表示不明的情况,提出一种基于预训练模型(Roberta)融合深层特征词向量的深度神经网络模型,处理中文文本分类的问题。通过Roberta模型生成含有上下文语义、语法信息的句子向量和含有句子结构特征的词向量,使用DPCNN模型和改进门控模型(RGRU)对词向量进行特征提取和融合,得到含有深层结构和局部信息的特征词向量,将句子向量与特征词向量融合在一起得到新向量。最后,新向量经过softmax激活层后,输出结果。在实验结果中,以F1值、准确率、召回率为评价标准,在THUCNews长文本中,这些指标分别达到了98.41%,98.44%,98.41%。同时,该模型在短文本分类中也取得了很好的成绩。
关键词
预训练模型
Roberta模型
DPCNN模型
特征词向量
中文文本分类
Keywords
pre-training model
Roberta model
DPCNN model
feature word vector
Chinese text classification
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于中文学术期刊人工标引的自动分类新算法
被引量:
1
2
作者
王洪
贾惠波
徐端颐
机构
清华大学光盘国家工程研究中心
出处
《现代图书情报技术》
CSSCI
北大核心
2002年第S1期59-62,共4页
基金
国家重点基础研究973项目(G19990330)
文摘
为了解决中文学术期刊电子化过程中出现的自动分类问题,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间,并考虑到人工标引在分类中的关键作用,得到综合了特征词IF和IDF权重的分类准则。通过适当训练建立分类库,计算待分类样本与已知分类的相似性,判别各分类。实验表明,该分类算法可以获得85%以上的分类识别率。
关键词
自动分类
人工标引
特征词向量
空间
【分类号】
TP391
分类号
G254.1 [文化科学—图书馆学]
下载PDF
职称材料
题名
基于人工标引的中文学术期刊文献自动分类算法
被引量:
6
3
作者
王洪
贾惠波
徐端颐
机构
清华大学精密仪器与机械学系
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2002年第6期787-790,共4页
基金
国家"九七三"重点基础研究项目 ( G19990 330 )
文摘
为了解决期刊电子化的自动分类问题 ,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间 ,并考虑到人工标引在分类中的关键作用 ,得到综合了特征词 TF和 IDF权重的分类准则。通过适当训练建立分类库 ,计算待分类样本与已知分类的相似性 ,判别各分类。实验表明 :该分类算法可以获得 85
关键词
人工标引
中文学术期刊
文献
自动分类算法
特征词向量
空间
Keywords
automatic categorization
manual labeling
term vector space
literatures
Chinese text
分类号
G254.11 [文化科学—图书馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于预训练模型融合深层特征词向量的中文文本分类
汤英杰
刘媛华
《上海理工大学学报》
CAS
CSCD
北大核心
2023
1
下载PDF
职称材料
2
基于中文学术期刊人工标引的自动分类新算法
王洪
贾惠波
徐端颐
《现代图书情报技术》
CSSCI
北大核心
2002
1
下载PDF
职称材料
3
基于人工标引的中文学术期刊文献自动分类算法
王洪
贾惠波
徐端颐
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2002
6
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部