期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于预训练模型融合深层特征词向量的中文文本分类 被引量:1
1
作者 汤英杰 刘媛华 《上海理工大学学报》 CAS CSCD 北大核心 2023年第2期189-197,204,共10页
为解决传统模型表示出的词向量存在序列、上下文、语法、语义以及深层次的信息表示不明的情况,提出一种基于预训练模型(Roberta)融合深层特征词向量的深度神经网络模型,处理中文文本分类的问题。通过Roberta模型生成含有上下文语义、语... 为解决传统模型表示出的词向量存在序列、上下文、语法、语义以及深层次的信息表示不明的情况,提出一种基于预训练模型(Roberta)融合深层特征词向量的深度神经网络模型,处理中文文本分类的问题。通过Roberta模型生成含有上下文语义、语法信息的句子向量和含有句子结构特征的词向量,使用DPCNN模型和改进门控模型(RGRU)对词向量进行特征提取和融合,得到含有深层结构和局部信息的特征词向量,将句子向量与特征词向量融合在一起得到新向量。最后,新向量经过softmax激活层后,输出结果。在实验结果中,以F1值、准确率、召回率为评价标准,在THUCNews长文本中,这些指标分别达到了98.41%,98.44%,98.41%。同时,该模型在短文本分类中也取得了很好的成绩。 展开更多
关键词 预训练模型 Roberta模型 DPCNN模型 特征词向量 中文文本分类
下载PDF
基于中文学术期刊人工标引的自动分类新算法 被引量:1
2
作者 王洪 贾惠波 徐端颐 《现代图书情报技术》 CSSCI 北大核心 2002年第S1期59-62,共4页
为了解决中文学术期刊电子化过程中出现的自动分类问题,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间,并考虑到人工标引在分类中的关键作用,得到综合了特征词IF和IDF权重的... 为了解决中文学术期刊电子化过程中出现的自动分类问题,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间,并考虑到人工标引在分类中的关键作用,得到综合了特征词IF和IDF权重的分类准则。通过适当训练建立分类库,计算待分类样本与已知分类的相似性,判别各分类。实验表明,该分类算法可以获得85%以上的分类识别率。 展开更多
关键词 自动分类 人工标引 特征词向量空间 【分类号】 TP391
下载PDF
基于人工标引的中文学术期刊文献自动分类算法 被引量:6
3
作者 王洪 贾惠波 徐端颐 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第6期787-790,共4页
为了解决期刊电子化的自动分类问题 ,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间 ,并考虑到人工标引在分类中的关键作用 ,得到综合了特征词 TF和 IDF权重的分类准则。通... 为了解决期刊电子化的自动分类问题 ,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间 ,并考虑到人工标引在分类中的关键作用 ,得到综合了特征词 TF和 IDF权重的分类准则。通过适当训练建立分类库 ,计算待分类样本与已知分类的相似性 ,判别各分类。实验表明 :该分类算法可以获得 85 展开更多
关键词 人工标引 中文学术期刊 文献 自动分类算法 特征词向量空间
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部