期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于百度百科的词语相似度计算
被引量:
21
1
作者
詹志建
梁丽娜
杨小平
《计算机科学》
CSCD
北大核心
2013年第6期199-202,共4页
词语相似度计算是自然语言处理的关键技术之一,是一个被广泛研究的基础课题。传统的词语相似度量方法大多是基于语义知识和基于语料库统计的方法,即这两类方法需要具有层次关系组织的语义词典和大规模的语料库。提出了一种新的基于百度...
词语相似度计算是自然语言处理的关键技术之一,是一个被广泛研究的基础课题。传统的词语相似度量方法大多是基于语义知识和基于语料库统计的方法,即这两类方法需要具有层次关系组织的语义词典和大规模的语料库。提出了一种新的基于百度百科的词语相似度量方法,通过分析百度百科词条信息,从表征词条的解释内容方面综合分析词条相似度,并定义了词条间的相似度计算公式,通过计算部分之间的相似度得到整体的相似度。实验结果表明,与已有的相似度计算方法对比,提出的算法更加有效合理。
展开更多
关键词
词语相似度
语言网络
百度百科
向量空间模型
下载PDF
职称材料
自然语言网络答疑系统的研究与实现
被引量:
10
2
作者
郑庆华
胡云华
张素娟
《小型微型计算机系统》
CSCD
北大核心
2005年第3期554-560,共7页
网络答疑是现代远程教育的重要组成部分,本文提出了一种基于自然语言的新型网络答疑系统的实现模型,介绍其实现原理及框架,并提出了从关键词、提问方式、提问重点三个层次对用户提问进行语义分析、特征向量提取及语义匹配的分析方法.实...
网络答疑是现代远程教育的重要组成部分,本文提出了一种基于自然语言的新型网络答疑系统的实现模型,介绍其实现原理及框架,并提出了从关键词、提问方式、提问重点三个层次对用户提问进行语义分析、特征向量提取及语义匹配的分析方法.实验结果表明,本文提出的关键技术解决方案能有效分析自然语言提问,提高问题答案匹配的精确率及召回率.
展开更多
关键词
网络答疑
自然语言处理
分词
提问方式
语义分析
向量空间模型
概念背景网
下载PDF
职称材料
融合耦合距离区分度和强类别特征的短文本相似度计算方法
被引量:
12
3
作者
马慧芳
刘文
+1 位作者
李志欣
蔺想红
《电子学报》
EI
CAS
CSCD
北大核心
2019年第6期1331-1336,共6页
短文本相似度计算在社会网络、文本挖掘和自然语言处理等领域中起着至关重要的作用.针对短文本内容简短、特征稀疏等特点,以及传统的短文本相似度计算忽略类别信息等问题,提出一种融合耦合距离区分度和强类别特征的短文本相似度计算方法...
短文本相似度计算在社会网络、文本挖掘和自然语言处理等领域中起着至关重要的作用.针对短文本内容简短、特征稀疏等特点,以及传统的短文本相似度计算忽略类别信息等问题,提出一种融合耦合距离区分度和强类别特征的短文本相似度计算方法.一方面,在整个短文本语料库中利用两个共现词之间的距离计算词项共现距离相关度,并以此来对词项加权从而捕获词项间内联和外联关系,得到短文本的耦合距离区分度相似度;另一方面,基于少量带类别标签的监督数据提取每类中强类别区分能力的特征项作为强类别特征集合,并利用词项的上下文来对强类别特征语义消歧,然后基于文本间包含相同类别的强类别特征数量来衡量文本间的相似度.最后,本文结合耦合距离区分度和强类别特征来衡量短文本的相似度.经实验证明本文提出的方法能够提高短文本相似度计算的准确率.
展开更多
关键词
文本挖掘
自然语言处理
文本聚类
社会网络
耦合关系
特征提取
语义消歧
相似度计算
下载PDF
职称材料
基于CNN图像识别与语义可靠性的路径搜索方法
被引量:
7
4
作者
李宇霞
孙永奇
+1 位作者
闫茹
朱卫国
《计算机工程》
CAS
CSCD
北大核心
2021年第1期255-263,274,共10页
光学字符识别技术可有效提高票据应用中票据信息录入的工作效率。针对票据的复杂背景与不规范手写字符降低票据识别准确率的问题,结合卷积神经网络图像识别与语义可靠性,提出一种可靠性优先的路径搜索方法,以降低模糊字符对搜索路径的...
光学字符识别技术可有效提高票据应用中票据信息录入的工作效率。针对票据的复杂背景与不规范手写字符降低票据识别准确率的问题,结合卷积神经网络图像识别与语义可靠性,提出一种可靠性优先的路径搜索方法,以降低模糊字符对搜索路径的干扰。利用基于公司名结构特点的前后缀推断策略,有效解决公司名前后缀识别错误问题。采用结巴中文分词与字符位置信息检查识别结果中的错误,并将长短期记忆语言模型与在传统字形相似度基础上引入的汉字部件相似度相结合进行纠错。实验结果表明,通过将纠错策略与该方法相结合可有效提高公司名识别准确率至93.08%。
展开更多
关键词
文本识别
语言模型
卷积神经网络
长短期记忆网络
字形相似度
结巴中文分词
下载PDF
职称材料
基于BERT的短文本相似度判别模型
被引量:
4
5
作者
方子卿
陈一飞
《电脑知识与技术》
2021年第5期14-18,共5页
短文本的表示方法和特征提取方法是自然语言处理基础研究的一个重要方向,具有广泛的应用价值。本文提出了BERT_BLSTM_TCNN模型,该神经网络模型利用BERT的迁移学习,并在词向量编码阶段引入对抗训练方法,训练出包括句的语义和结构特征的...
短文本的表示方法和特征提取方法是自然语言处理基础研究的一个重要方向,具有广泛的应用价值。本文提出了BERT_BLSTM_TCNN模型,该神经网络模型利用BERT的迁移学习,并在词向量编码阶段引入对抗训练方法,训练出包括句的语义和结构特征的且泛化性能更优的句特征,并将这些特征输入BLSTM_TCNN层中进行特征抽取以完成对短文本的语义层面上的相似判定。在相关数据集上的实验结果表明:与最先进的预训练模型相比,该模型在有着不错的判定准确率的同时还有参数量小易于训练的优点。
展开更多
关键词
词向量模型
自然语言处理
短文本相似度
卷积神经网络
循环神经网络
下载PDF
职称材料
题名
基于百度百科的词语相似度计算
被引量:
21
1
作者
詹志建
梁丽娜
杨小平
机构
中国人民大学信息学院北京
出处
《计算机科学》
CSCD
北大核心
2013年第6期199-202,共4页
基金
国家自然科学基金(70871115)资助
文摘
词语相似度计算是自然语言处理的关键技术之一,是一个被广泛研究的基础课题。传统的词语相似度量方法大多是基于语义知识和基于语料库统计的方法,即这两类方法需要具有层次关系组织的语义词典和大规模的语料库。提出了一种新的基于百度百科的词语相似度量方法,通过分析百度百科词条信息,从表征词条的解释内容方面综合分析词条相似度,并定义了词条间的相似度计算公式,通过计算部分之间的相似度得到整体的相似度。实验结果表明,与已有的相似度计算方法对比,提出的算法更加有效合理。
关键词
词语相似度
语言网络
百度百科
向量空间模型
Keywords
word similarity
,
language network
,
baidubaike
,
vsm
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
自然语言网络答疑系统的研究与实现
被引量:
10
2
作者
郑庆华
胡云华
张素娟
机构
西安交通大学计算机系
出处
《小型微型计算机系统》
CSCD
北大核心
2005年第3期554-560,共7页
基金
国家自然科学基金项目(60373105
60473136)资助
+1 种基金
国家"十五"重大科技攻关项目(2001BA101A01)资助
教育部优秀青年教师基金项目资助.
文摘
网络答疑是现代远程教育的重要组成部分,本文提出了一种基于自然语言的新型网络答疑系统的实现模型,介绍其实现原理及框架,并提出了从关键词、提问方式、提问重点三个层次对用户提问进行语义分析、特征向量提取及语义匹配的分析方法.实验结果表明,本文提出的关键技术解决方案能有效分析自然语言提问,提高问题答案匹配的精确率及召回率.
关键词
网络答疑
自然语言处理
分词
提问方式
语义分析
向量空间模型
概念背景网
Keywords
web answering
natural
language
process
word
segmentation
question type
semantic analysis
vsm
background concep
network
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合耦合距离区分度和强类别特征的短文本相似度计算方法
被引量:
12
3
作者
马慧芳
刘文
李志欣
蔺想红
机构
西北师范大学计算机科学与工程学院
桂林电子科技大学广西可信软件重点实验室
广西师范大学广西多源信息挖掘与安全重点实验室
出处
《电子学报》
EI
CAS
CSCD
北大核心
2019年第6期1331-1336,共6页
基金
国家自然科学基金(No.61762078,No.61363058,No.61663004)
广西多源信息挖掘与安全重点实验室开放基金项目(No.MIMS18-08)
广西可信软件重点实验室研究课题(No.KX201705)
文摘
短文本相似度计算在社会网络、文本挖掘和自然语言处理等领域中起着至关重要的作用.针对短文本内容简短、特征稀疏等特点,以及传统的短文本相似度计算忽略类别信息等问题,提出一种融合耦合距离区分度和强类别特征的短文本相似度计算方法.一方面,在整个短文本语料库中利用两个共现词之间的距离计算词项共现距离相关度,并以此来对词项加权从而捕获词项间内联和外联关系,得到短文本的耦合距离区分度相似度;另一方面,基于少量带类别标签的监督数据提取每类中强类别区分能力的特征项作为强类别特征集合,并利用词项的上下文来对强类别特征语义消歧,然后基于文本间包含相同类别的强类别特征数量来衡量文本间的相似度.最后,本文结合耦合距离区分度和强类别特征来衡量短文本的相似度.经实验证明本文提出的方法能够提高短文本相似度计算的准确率.
关键词
文本挖掘
自然语言处理
文本聚类
社会网络
耦合关系
特征提取
语义消歧
相似度计算
Keywords
text mining
natural
language
processing
text clustering
social
network
couplingrelation
feature extraction
word
sense disambiguation
similarity
computation
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于CNN图像识别与语义可靠性的路径搜索方法
被引量:
7
4
作者
李宇霞
孙永奇
闫茹
朱卫国
机构
北京交通大学计算机与信息技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第1期255-263,274,共10页
基金
国家自然科学基金(61572005,61672086,61272004)。
文摘
光学字符识别技术可有效提高票据应用中票据信息录入的工作效率。针对票据的复杂背景与不规范手写字符降低票据识别准确率的问题,结合卷积神经网络图像识别与语义可靠性,提出一种可靠性优先的路径搜索方法,以降低模糊字符对搜索路径的干扰。利用基于公司名结构特点的前后缀推断策略,有效解决公司名前后缀识别错误问题。采用结巴中文分词与字符位置信息检查识别结果中的错误,并将长短期记忆语言模型与在传统字形相似度基础上引入的汉字部件相似度相结合进行纠错。实验结果表明,通过将纠错策略与该方法相结合可有效提高公司名识别准确率至93.08%。
关键词
文本识别
语言模型
卷积神经网络
长短期记忆网络
字形相似度
结巴中文分词
Keywords
text recognition
language
model
Convolutional Neural
network
(CNN)
Long Short-Term Memory(LSTM)
network
character pattern
similarity
Jieba Chinese
word
segmentation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于BERT的短文本相似度判别模型
被引量:
4
5
作者
方子卿
陈一飞
机构
南京审计大学信息工程学院
出处
《电脑知识与技术》
2021年第5期14-18,共5页
基金
江苏省自然科学基金面上项目(BK20171495)。
文摘
短文本的表示方法和特征提取方法是自然语言处理基础研究的一个重要方向,具有广泛的应用价值。本文提出了BERT_BLSTM_TCNN模型,该神经网络模型利用BERT的迁移学习,并在词向量编码阶段引入对抗训练方法,训练出包括句的语义和结构特征的且泛化性能更优的句特征,并将这些特征输入BLSTM_TCNN层中进行特征抽取以完成对短文本的语义层面上的相似判定。在相关数据集上的实验结果表明:与最先进的预训练模型相比,该模型在有着不错的判定准确率的同时还有参数量小易于训练的优点。
关键词
词向量模型
自然语言处理
短文本相似度
卷积神经网络
循环神经网络
Keywords
word
embedding model
natural
language
processing
short text
similarity
convolutional neural
network
s
recurrent neu⁃ral
network
s
分类号
G642 [文化科学—高等教育学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于百度百科的词语相似度计算
詹志建
梁丽娜
杨小平
《计算机科学》
CSCD
北大核心
2013
21
下载PDF
职称材料
2
自然语言网络答疑系统的研究与实现
郑庆华
胡云华
张素娟
《小型微型计算机系统》
CSCD
北大核心
2005
10
下载PDF
职称材料
3
融合耦合距离区分度和强类别特征的短文本相似度计算方法
马慧芳
刘文
李志欣
蔺想红
《电子学报》
EI
CAS
CSCD
北大核心
2019
12
下载PDF
职称材料
4
基于CNN图像识别与语义可靠性的路径搜索方法
李宇霞
孙永奇
闫茹
朱卫国
《计算机工程》
CAS
CSCD
北大核心
2021
7
下载PDF
职称材料
5
基于BERT的短文本相似度判别模型
方子卿
陈一飞
《电脑知识与技术》
2021
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部