期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于孪生网络和字词向量结合的文本相似度匹配
被引量:
2
1
作者
李奕霖
周艳平
《计算机系统应用》
2022年第10期295-302,共8页
文本相似度匹配是许多自然语言处理任务的基础,本文提出一种基于孪生网络和字词向量结合的文本相似度匹配方法,采用孪生网络的思想对文本整体建模,实现两个文本的相似性判断.首先,在提取文本特征向量时,使用BERT和WoBERT模型分别提取字...
文本相似度匹配是许多自然语言处理任务的基础,本文提出一种基于孪生网络和字词向量结合的文本相似度匹配方法,采用孪生网络的思想对文本整体建模,实现两个文本的相似性判断.首先,在提取文本特征向量时,使用BERT和WoBERT模型分别提取字和词级别的句向量,将二者结合使句向量具有更丰富的文本语义信息;其次,针对特征信息融合过程中出现的维度过大问题,加入PCA算法对高维向量进行降维,去除冗余信息和噪声干扰;最后,通过Softmax分类器得到相似度匹配结果.通过在LCQMC数据集上的实验表明,本文模型的准确率和F1值分别达到了89.92%和88.52%,可以更好地提取文本语义信息,更适合文本相似度匹配任务.
展开更多
关键词
文本相似度匹配
字词
向量
结合
孪生网络
PCA算法
BERT
下载PDF
职称材料
基于Bert融合词汇的中文命名实体识别
2
作者
宋煜
李可丰
《上海第二工业大学学报》
2024年第2期203-207,共5页
命名实体识别是自然语言处理中一项非常重要的任务,一句话中可以正确理解其中的实体,对于是否能正确理解这句话至关重要,而中文的命名实体识别相比英文更有难度,原因在于中文没有英文中类似空格的边界标示词,且存在复杂的嵌套现象。针...
命名实体识别是自然语言处理中一项非常重要的任务,一句话中可以正确理解其中的实体,对于是否能正确理解这句话至关重要,而中文的命名实体识别相比英文更有难度,原因在于中文没有英文中类似空格的边界标示词,且存在复杂的嵌套现象。针对现有的中文命名实体识别方法中大多只利用单一层次的特征这一问题,利用Bert中文预训练集和额外的词汇数据集的融合模型增强词意和中文上下文联系,采用BiGRU网络获取序列特征矩阵,通过条件随机场模型生成全局最优序列,从而提升实体识别准确率。实验结果表明该方法在公开数据集上的效果优于现有模型。
展开更多
关键词
自然语言处理
命名实体识别
字词结合
深度学习
下载PDF
职称材料
多特征融合的中文短文本分类模型
被引量:
12
3
作者
杨朝强
邵党国
+2 位作者
杨志豪
相艳
马磊
《小型微型计算机系统》
CSCD
北大核心
2020年第7期1421-1426,共6页
针对中文短文本的特征提取中存在特征稀疏的局限性,本文提出了一种基于多特征融合的短文本分类模型(Multi-feature fusion model,M FFM).首先,通过字词向量结合的方式构建新的文本表示;其次,通过BILSTM(Bi-directional Long ShortTerm M...
针对中文短文本的特征提取中存在特征稀疏的局限性,本文提出了一种基于多特征融合的短文本分类模型(Multi-feature fusion model,M FFM).首先,通过字词向量结合的方式构建新的文本表示;其次,通过BILSTM(Bi-directional Long ShortTerm Memory)、CNN(Convolutional Neural Networks)和CAPSNET(Capsule Network)模型对短文本进行不同层面的特征提取,并使用Self-attention模型动态调节各模型特征在最终特征构建中的权重系数.在实验部分,本文用MFFM方法与四个短文本分类经典模型(CNN、BILSTM、CAPSNET和CNN-BILSTM)在三个中文短文本数据集上进行验证,为了进一步验证数据融合(将三个中文短文本数据正负样本融合)对MFFM的影响,实验结果表明MFFM模型性能在四个评价指标(F1、Recall、Precision、Accuracy)下优于对比模型.总之,这可表明M FFM是短文本分类模型的一个有用框架.
展开更多
关键词
中文短文本分类
字词
向量
结合
特征融合
Self-attention模型
下载PDF
职称材料
融合本体特征的BiLSTM-CRF军事实体识别模型
被引量:
6
4
作者
齐玉东
丁海强
+1 位作者
吴晋豫
司维超
《兵器装备工程学报》
CAS
北大核心
2020年第5期118-123,共6页
针对军事实体识别依赖领域知识的特点,提出了融合本体特征的BiLSTM-CRF军事实体识别模型。通过构建军事领域本体,将分词的本体特征作为领域知识融入到词向量中,有效弥补了传统命名实体识别方法的领域知识缺乏问题,且模型加入字向量描述...
针对军事实体识别依赖领域知识的特点,提出了融合本体特征的BiLSTM-CRF军事实体识别模型。通过构建军事领域本体,将分词的本体特征作为领域知识融入到词向量中,有效弥补了传统命名实体识别方法的领域知识缺乏问题,且模型加入字向量描述分词的内部形态学特征,避免了分词不准确与未登录词对军事命名实体识别造成的影响,最后采用BiLSTM-CRF模型实现军事命名实体识别工作。实验证明,该军事实体识别模型的准确率达到91.08%,能够有效识别军事实体。
展开更多
关键词
本体
Bi-LSTM
军事文本
命名实体识别
字词
向量
结合
下载PDF
职称材料
题名
基于孪生网络和字词向量结合的文本相似度匹配
被引量:
2
1
作者
李奕霖
周艳平
机构
青岛科技大学信息科学技术学院
出处
《计算机系统应用》
2022年第10期295-302,共8页
文摘
文本相似度匹配是许多自然语言处理任务的基础,本文提出一种基于孪生网络和字词向量结合的文本相似度匹配方法,采用孪生网络的思想对文本整体建模,实现两个文本的相似性判断.首先,在提取文本特征向量时,使用BERT和WoBERT模型分别提取字和词级别的句向量,将二者结合使句向量具有更丰富的文本语义信息;其次,针对特征信息融合过程中出现的维度过大问题,加入PCA算法对高维向量进行降维,去除冗余信息和噪声干扰;最后,通过Softmax分类器得到相似度匹配结果.通过在LCQMC数据集上的实验表明,本文模型的准确率和F1值分别达到了89.92%和88.52%,可以更好地提取文本语义信息,更适合文本相似度匹配任务.
关键词
文本相似度匹配
字词
向量
结合
孪生网络
PCA算法
BERT
Keywords
text similarity matching
char-word vector combination
Siamese network
principal component analysis(PCA)algorithm
BERT
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Bert融合词汇的中文命名实体识别
2
作者
宋煜
李可丰
机构
上海第二工业大学计算机与信息工程学院
出处
《上海第二工业大学学报》
2024年第2期203-207,共5页
文摘
命名实体识别是自然语言处理中一项非常重要的任务,一句话中可以正确理解其中的实体,对于是否能正确理解这句话至关重要,而中文的命名实体识别相比英文更有难度,原因在于中文没有英文中类似空格的边界标示词,且存在复杂的嵌套现象。针对现有的中文命名实体识别方法中大多只利用单一层次的特征这一问题,利用Bert中文预训练集和额外的词汇数据集的融合模型增强词意和中文上下文联系,采用BiGRU网络获取序列特征矩阵,通过条件随机场模型生成全局最优序列,从而提升实体识别准确率。实验结果表明该方法在公开数据集上的效果优于现有模型。
关键词
自然语言处理
命名实体识别
字词结合
深度学习
Keywords
natural language processing
named entity recognition
word combination
deep learning
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
多特征融合的中文短文本分类模型
被引量:
12
3
作者
杨朝强
邵党国
杨志豪
相艳
马磊
机构
昆明理工大学信息工程与自动化学院
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第7期1421-1426,共6页
基金
国家自然科学基金项目(61462054,61732005,61672271,61741112)资助
云南省自然科学基金项目(2017FB098)资助
+1 种基金
国家博士后面上科学基金项目(2016M592894XB)资助
云南省重大科技项目(2018ZF017)资助。
文摘
针对中文短文本的特征提取中存在特征稀疏的局限性,本文提出了一种基于多特征融合的短文本分类模型(Multi-feature fusion model,M FFM).首先,通过字词向量结合的方式构建新的文本表示;其次,通过BILSTM(Bi-directional Long ShortTerm Memory)、CNN(Convolutional Neural Networks)和CAPSNET(Capsule Network)模型对短文本进行不同层面的特征提取,并使用Self-attention模型动态调节各模型特征在最终特征构建中的权重系数.在实验部分,本文用MFFM方法与四个短文本分类经典模型(CNN、BILSTM、CAPSNET和CNN-BILSTM)在三个中文短文本数据集上进行验证,为了进一步验证数据融合(将三个中文短文本数据正负样本融合)对MFFM的影响,实验结果表明MFFM模型性能在四个评价指标(F1、Recall、Precision、Accuracy)下优于对比模型.总之,这可表明M FFM是短文本分类模型的一个有用框架.
关键词
中文短文本分类
字词
向量
结合
特征融合
Self-attention模型
Keywords
Chinese short text classification
word vector combination
feature fusion
Self-attention
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合本体特征的BiLSTM-CRF军事实体识别模型
被引量:
6
4
作者
齐玉东
丁海强
吴晋豫
司维超
机构
海军航空大学
[
出处
《兵器装备工程学报》
CAS
北大核心
2020年第5期118-123,共6页
基金
山东省重点研发计划项目(2016YJS02A01)。
文摘
针对军事实体识别依赖领域知识的特点,提出了融合本体特征的BiLSTM-CRF军事实体识别模型。通过构建军事领域本体,将分词的本体特征作为领域知识融入到词向量中,有效弥补了传统命名实体识别方法的领域知识缺乏问题,且模型加入字向量描述分词的内部形态学特征,避免了分词不准确与未登录词对军事命名实体识别造成的影响,最后采用BiLSTM-CRF模型实现军事命名实体识别工作。实验证明,该军事实体识别模型的准确率达到91.08%,能够有效识别军事实体。
关键词
本体
Bi-LSTM
军事文本
命名实体识别
字词
向量
结合
Keywords
ontology
Bi-LSTM
military text
named entity recognition
word embedding
分类号
TP389.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于孪生网络和字词向量结合的文本相似度匹配
李奕霖
周艳平
《计算机系统应用》
2022
2
下载PDF
职称材料
2
基于Bert融合词汇的中文命名实体识别
宋煜
李可丰
《上海第二工业大学学报》
2024
0
下载PDF
职称材料
3
多特征融合的中文短文本分类模型
杨朝强
邵党国
杨志豪
相艳
马磊
《小型微型计算机系统》
CSCD
北大核心
2020
12
下载PDF
职称材料
4
融合本体特征的BiLSTM-CRF军事实体识别模型
齐玉东
丁海强
吴晋豫
司维超
《兵器装备工程学报》
CAS
北大核心
2020
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部