期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
混合词汇特征和LDA的语义相关度计算方法 被引量:5
1
作者 肖宝 李璞 蒋运承 《计算机工程与应用》 CSCD 北大核心 2017年第12期152-157,165,共7页
文本语义相关度计算在自然语言处理、语义信息检索等方面起着重要作用,以Wikipedia为知识库,基于词汇特征的ESA(Explicit Semantic Analysis)因简单有效的特点在这些领域中受到学术界的广泛关注和应用。然而其语义相关度计算因为有大量... 文本语义相关度计算在自然语言处理、语义信息检索等方面起着重要作用,以Wikipedia为知识库,基于词汇特征的ESA(Explicit Semantic Analysis)因简单有效的特点在这些领域中受到学术界的广泛关注和应用。然而其语义相关度计算因为有大量冗余概念的参与变成了一种高维度、低效率的计算方式,同时也忽略了文本所属主题因素对语义相关度计算的作用。引入LDA(Latent Dirichlet Allocation)主题模型,对ESA返回的相关度较高的概念转换为模型的主题概率向量,从而达到降低维度和提高效率的目的;将JSD距离(Jensen-Shannon Divergence)替换余弦距离的测量方法,使得文本语义相关度计算更加合理和有效。最后对不同层次的数据集进行算法的测试评估,结果表明混合词汇特征和主题模型的语义相关度计算方法的皮尔逊相关系数比ESA和LDA分别高出3%和9%以上。 展开更多
关键词 主题模型 词汇特征 显式语义分析(ESA) 隐含狄利克雷分布(LDA) 语义相关度计算
下载PDF
自然语言语义相关度计算模型及其权重系数研究
2
作者 刘运通 熊晶 《计算机应用研究》 CSCD 北大核心 2014年第6期1661-1664,共4页
为了更为高效、准确地使用语义信息来进行自然语言处理,提出了一种自然语言语义相关度计算模型,并对模型的求解方法以及相关的权重系数作了研究。该模型使用语义相关度来判定语句的最佳语法分析方案,并采用简单子句归结法进行模型求解;... 为了更为高效、准确地使用语义信息来进行自然语言处理,提出了一种自然语言语义相关度计算模型,并对模型的求解方法以及相关的权重系数作了研究。该模型使用语义相关度来判定语句的最佳语法分析方案,并采用简单子句归结法进行模型求解;通过对比实验,可以初步确定这些权重系数的合理取值范围,并揭示权重系数与模型求解正确率之间的关系。 展开更多
关键词 语义相关度计算模型 权重系数 简单语义单元 简单子句
下载PDF
基于BERTCA的新闻实体与正文语义相关度计算模型 被引量:2
3
作者 向军毅 胡慧君 +1 位作者 刘茂福 毛瑞彬 《中文信息学报》 CSCD 北大核心 2022年第3期109-119,共11页
目前的搜索引擎仍然存在“重形式,轻语义”的问题,无法做到对搜索关键词和文本的深层次语义理解,因此语义检索成为当前搜索引擎中亟需解决的问题。为了提高搜索引擎的语义理解能力,该文提出一种语义相关度的计算方法。首先,标注了金融... 目前的搜索引擎仍然存在“重形式,轻语义”的问题,无法做到对搜索关键词和文本的深层次语义理解,因此语义检索成为当前搜索引擎中亟需解决的问题。为了提高搜索引擎的语义理解能力,该文提出一种语义相关度的计算方法。首先,标注了金融类新闻标题实体与新闻正文语义相关度语料1万条,然后建立新闻实体与正文语义相关度计算的BERTCA(Bidirectional Encoder Representation from Transformers Co-Attention)模型,通过使用BERT预训练模型,综合考虑细粒度的实体和粗粒度的正文的语义信息,然后经过协同注意力,实现实体与正文的语义匹配,不仅能计算出金融新闻实体与新闻正文之间的相关度,还能根据相关度阈值来判定相关度类别,实验表明该模型在1万条标注语料上准确率超过95%,优于目前主流模型,最后通过具体搜索示例展示了该模型的优秀性能。 展开更多
关键词 语义相关度计算 BERT模型 协同注意力机制
下载PDF
基于属性坐标系框架下的Freebase语义库研究
4
作者 王斌 冯嘉礼 《微型机与应用》 2013年第21期59-61,共3页
属性坐标系是由n个不相关的属性组成的一个n-1维坐标系。第n+1个属性,可以由这n个属性做合取运算得到;这样在这个n-1维坐标系中,就形成一个唯一点来表示这第n+1个属性。2007年Freebase数据库的建立,使得该属性坐标系理论得以验证,并为... 属性坐标系是由n个不相关的属性组成的一个n-1维坐标系。第n+1个属性,可以由这n个属性做合取运算得到;这样在这个n-1维坐标系中,就形成一个唯一点来表示这第n+1个属性。2007年Freebase数据库的建立,使得该属性坐标系理论得以验证,并为属性坐标系的建立提供可能,而且将在语义相关度计算中发挥重要作用。 展开更多
关键词 属性坐标系 Freebase 语义相关度计算
下载PDF
基于梯度核特征及N-gram模型的商品图像句子标注 被引量:5
5
作者 张红斌 姬东鸿 +1 位作者 尹兰 任亚峰 《计算机科学》 CSCD 北大核心 2016年第5期269-273,287,共6页
提出为商品图像标注句子,以便更准确地刻画图像内容。首先,执行图像特征学习,选出标注性能最优的梯度核特征完成图像分类和图像检索,该特征能客观描绘商品图像中形状和纹理这两类关键视觉特性。然后,基于语义相关度计算结果从训练图像... 提出为商品图像标注句子,以便更准确地刻画图像内容。首先,执行图像特征学习,选出标注性能最优的梯度核特征完成图像分类和图像检索,该特征能客观描绘商品图像中形状和纹理这两类关键视觉特性。然后,基于语义相关度计算结果从训练图像的文本描述中摘取关键单词,并采用N-gram模型把单词组装为蕴涵丰富语义信息且满足句法模式兼容性的修饰性短语,基于句子模板和修饰性短语生成句子。最后,构建Boosting模型,从若干标注结果中选取BLEU-3评分最优的句子标注商品图像。结果表明,Boosting模型的标注性能优于各基线。 展开更多
关键词 梯度核特征 N-GRAM模型 商品图像 句子标注 语义相关度计算 修饰性短语
下载PDF
面向机器阅读理解的候选句抽取算法 被引量:3
6
作者 郭鑫 张庚 +1 位作者 陈千 王素格 《计算机科学》 CSCD 北大核心 2020年第5期198-203,共6页
使机器理解人类自然语言是人工智能在认知领域的终极目标,机器阅读理解是自然语言处理技术中继语音识别、语义理解之后的一大挑战,要求计算机具有一定的背景常识,全面理解给定文本材料,并根据材料内容对相应的问题作答。随着深度学习的... 使机器理解人类自然语言是人工智能在认知领域的终极目标,机器阅读理解是自然语言处理技术中继语音识别、语义理解之后的一大挑战,要求计算机具有一定的背景常识,全面理解给定文本材料,并根据材料内容对相应的问题作答。随着深度学习的快速发展,阅读理解成为当前人工智能的热点研究方向,涉及机器学习、信息检索、语义计算等核心技术,在聊天机器人、问答系统、智能化教育等多个领域具有广泛的应用前景。文中聚焦微阅读模式,根据问题或选项从给定文本材料中抽取包含答案的候选句,缩小推理范围,为进一步实现机器阅读理解提供技术支持。传统基于特征的方法耗费大量人力,文中将答案候选句抽取看成一种语义相关度计算问题,提出了一种答案候选句排序方法,即Att-BiGRU/BiLSTM模型。首先,利用双向长短期记忆和门控循环单元来编码句子中表达的语义信息;其次,设计Atten结构,结合相异性和相似性对语义相关度进行建模;最后,采用Adam算法来学习模型的参数。在SemEval-SICK数据集上的实验结果显示,该模型在测试集上的pearson指标超过了基线方法BiGRU将近0.67,在MSE指标上超过BiGRU方法16.83%,收敛速度更快,表明双向和Atten结构能大大提高候选句抽取的精度。 展开更多
关键词 长短期记忆模型 门控循环单元 候选句抽取 语义相关度计算
下载PDF
网络问答资源挖掘综述
7
作者 王宝勋 刘秉权 +1 位作者 孙承杰 王晓龙 《智能计算机与应用》 2012年第6期54-58,共5页
由大规模问答对组成的问答知识库对于自动问答技术的巨大支持作用是不言而喻的,从互联网获取知识并以问答对的形式加以保存是扩充和完善问答知识库的必要手段。阐述了面向互联网数据源的问答资源挖掘对于问答系统构建和自然语言处理研... 由大规模问答对组成的问答知识库对于自动问答技术的巨大支持作用是不言而喻的,从互联网获取知识并以问答对的形式加以保存是扩充和完善问答知识库的必要手段。阐述了面向互联网数据源的问答资源挖掘对于问答系统构建和自然语言处理研究的重要意义,概述了网络问答资源挖掘研究的主要任务以及面临的挑战,并通过对当前该领域的研究成果的综述分析了其中的重点研究问题。 展开更多
关键词 问答资源挖掘 问答语义相关度计算 答案摘要 模式化答案抽取
下载PDF
Research on Semantic and Cache Model of Relational Database
8
作者 Cuiying WANG 《International Journal of Technology Management》 2015年第5期63-65,共3页
The paper firstly analyze cache replacement strategies at present, and proposed the ideas of the semantic query cache replacement based on user access features, and describe the semantic similarity calculation and rea... The paper firstly analyze cache replacement strategies at present, and proposed the ideas of the semantic query cache replacement based on user access features, and describe the semantic similarity calculation and realize the algorithm of replacement strategy. The strategy use semantic to match information in the query cache, through dynamic analysis and tracking three characteristics of user access time, user access to content and Business Association, give out the similarity minimum of the cache item, to improve the hit ratio of the cache and the response time and throughput of the server is improved. 展开更多
关键词 Database technology Semantic Cache User access feature
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部