期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于词上下文向量的文本自动分类方法
被引量:
5
1
作者
郭少友
《情报科学》
CSSCI
北大核心
2008年第7期1030-1034,共5页
分析了传统文本自动分类方法的不足、词上下文向量的含义及其在自动分类中的作用,提出了一种基于词上下文向量的文本自动分类方法,该方法利用词上下文向量来生成分类器的类别中心向量和待分类文本的文本向量,使分类质量有所提高。
关键词
自动分类
上下文
词上下文向量
分类器
文本表示
下载PDF
职称材料
基于上下文词向量和主题模型的实体消歧方法
被引量:
12
2
作者
王瑞
李弼程
杜文倩
《中文信息学报》
CSCD
北大核心
2019年第11期46-56,共11页
传统词向量训练模型仅考虑词共现而未考虑词序,语义表达能力弱。此外,现有实体消歧方法没有考虑实体的局部特征。综合实体的全局特征和局部特征,该文提出一种基于上下文词向量和主题模型的实体消歧方法。首先,在传统词向量模型上增加上...
传统词向量训练模型仅考虑词共现而未考虑词序,语义表达能力弱。此外,现有实体消歧方法没有考虑实体的局部特征。综合实体的全局特征和局部特征,该文提出一种基于上下文词向量和主题模型的实体消歧方法。首先,在传统词向量模型上增加上下文方向向量,用于表征语序,并利用该模型与主题模型训练主题词向量;其次,分别计算实体上下文相似度、基于实体上下文主题的类别主题相似度以及基于主题词向量的实体主题相似度;最后,融合三种相似度,选择相似度最高的实体作为最终消歧实体。实验结果表明,相比于现有的主流消歧方法,新方法是有效的。
展开更多
关键词
上下文
词
向量
实体消歧
知识库
主题
词
向量
主题模型
下载PDF
职称材料
基于词语上下文关系的文本自动分类方法研究
3
作者
郭少友
《现代图书情报技术》
CSSCI
北大核心
2008年第5期44-49,共6页
用词上下文向量来表达文本集内一个词语与其他词语之间的上下文关系,并在词上下文向量的基础上生成分类器中所有类别的类别特征向量,以及待分类文本的特征向量,最后由分类器给出待分类文本的所属类别。实验显示,在类别特征向量和文本向...
用词上下文向量来表达文本集内一个词语与其他词语之间的上下文关系,并在词上下文向量的基础上生成分类器中所有类别的类别特征向量,以及待分类文本的特征向量,最后由分类器给出待分类文本的所属类别。实验显示,在类别特征向量和文本向量中融入词语上下文关系有助于改善文本分类效果。
展开更多
关键词
文本自动分类
上下文
词上下文向量
下载PDF
职称材料
word2vec-ACV:OOV语境含义的词向量生成模型
被引量:
7
4
作者
王永贵
郑泽
李玥
《计算机应用研究》
CSCD
北大核心
2019年第6期1623-1628,共6页
针对word2vec模型生成的词向量缺乏语境的多义性以及无法创建集外词(OOV)词向量的问题,引入相似信息与word2vec模型相结合,提出word2vec-ACV模型。该模型首先基于连续词袋(CBOW)和Hierarchical softmax的word2vec模型训练出词向量矩阵...
针对word2vec模型生成的词向量缺乏语境的多义性以及无法创建集外词(OOV)词向量的问题,引入相似信息与word2vec模型相结合,提出word2vec-ACV模型。该模型首先基于连续词袋(CBOW)和Hierarchical softmax的word2vec模型训练出词向量矩阵即权重矩阵;然后将共现矩阵进行归一化处理得到平均上下文词向量,再将词向量组成平均上下文词向量矩阵;最后将平均上下文词向量矩阵与权重矩阵相乘得到词向量矩阵。为了能同时解决集外词及多义性问题,将平均上下文词向量分为全局平均上下文词向量(global ACV)和局部平均上下文词向量(local ACV)两种,并对两者取权值组成新的平均上下文词向量矩阵,并将word2vec-ACV模型和word2vec模型分别进行类比任务实验和命名实体识别任务实验。实验结果表明,word2vec-ACV模型同时解决了语境多义性以及创建集外词词向量的问题,降低了时间消耗,提升了词向量表达的准确性和对海量词汇的处理能力。
展开更多
关键词
word2vec模型
词
向量
共现矩阵
平均
上下文
词
向量
下载PDF
职称材料
深层差异特征增强的机器翻译自动评价
5
作者
支思威
李茂西
+1 位作者
吴水秀
陈有德
《中文信息学报》
CSCD
北大核心
2024年第10期46-53,共8页
机器翻译自动评价任务将机器翻译系统输出译文与人工参考译文进行对比定量计算翻译质量,在机器翻译的研究和应用中发挥着重要作用。当前主流的方法是使用预训练上下文语言模型表征机器翻译和人工参考译文,将两者的表征向量直接拼接输入...
机器翻译自动评价任务将机器翻译系统输出译文与人工参考译文进行对比定量计算翻译质量,在机器翻译的研究和应用中发挥着重要作用。当前主流的方法是使用预训练上下文语言模型表征机器翻译和人工参考译文,将两者的表征向量直接拼接输入前馈神经网络层以预测翻译质量;它没有在统一语义空间对两者之间的差异进行显式建模。该文提出基于深层差异特征增强的机器翻译自动评价方法,使用多头注意力机制深层抽象机器翻译和人工参考译文,利用两者在统一语义空间的差异特征增强当前最先进的自动评价方法UniTE_UP,将它们抽取的特征进行深层交互,以对机器翻译和人工参考译文之间的差异进行直接显式建模。在WMT'21机器翻译自动评价基准数据集上的实验结果表明,深层差异特征增强的自动评价方法能有效提高机器翻译自动评价与人工评价的相关性,消融实验和深入的实验分析进一步揭示了深层差异特征的有效性。
展开更多
关键词
机器翻译
自动评价
多头注意力
预训练
上下文
词
向量
差异特征
下载PDF
职称材料
TSPT:基于预训练的三阶段复合式文本摘要模型
被引量:
3
6
作者
吕瑞
王涛
+1 位作者
曾碧卿
刘相湖
《计算机应用研究》
CSCD
北大核心
2020年第10期2917-2921,共5页
抽取式方法从源文本中抽取句子,会造成信息冗余;生成式方法可能生成非源文词,会产生语法问题,自然性差。BERT作为一种双向Transformer模型,在自然语言理解任务上展现了优异的性能,但在文本生成任务的应用有待探索。针对以上问题,提出一...
抽取式方法从源文本中抽取句子,会造成信息冗余;生成式方法可能生成非源文词,会产生语法问题,自然性差。BERT作为一种双向Transformer模型,在自然语言理解任务上展现了优异的性能,但在文本生成任务的应用有待探索。针对以上问题,提出一种基于预训练的三阶段复合式文本摘要模型(TSPT),结合抽取式方法和生成式方法,将源本文经过预训练产生的双向上下文信息词向量由sigmoid函数获取句子得分抽取关键句,在摘要生成阶段将关键句作为完形填空任务重写,生成最终摘要。实验结果表明,该模型在CNN/Daily Mail数据集中取得了良好效果。
展开更多
关键词
预训练
复合式文本摘要模型
抽取式方法
生成式方法
双向
上下文
信息
词
向量
下载PDF
职称材料
面向语文辞书编纂的神经网络语料库检索研究
7
作者
胡钦谙
《辞书研究》
2023年第1期36-45,I0002,共11页
语料库检索已成为语文辞书编纂过程中不可或缺的一个步骤。现有的语料库检索系统通常先返回句子列表,然后由人工进行筛选。然而,随着语料库规模不断扩大,海量检索结果与用户有限的语料消化能力之间的矛盾已成为辞书编纂过程中的痛点之...
语料库检索已成为语文辞书编纂过程中不可或缺的一个步骤。现有的语料库检索系统通常先返回句子列表,然后由人工进行筛选。然而,随着语料库规模不断扩大,海量检索结果与用户有限的语料消化能力之间的矛盾已成为辞书编纂过程中的痛点之一。文章注意到,辞书编纂人员在检索语料库时,实际上更为关注的是检索词出现的语境(或称上下文)。语境具有相对稳定的语言学规律,语料库中往往存在着大量符合同一语言规律的语境。这种同质的语境对辞书编纂提供的价值相对有限,单纯依靠增加语料数量对辞书编纂的贡献已呈现出边际效益递减的现象。因此,文章尝试以海量检索结果中的同质语境为突破口,通过人工智能中的注意力机制、上下文相关词向量以及预训练语言模型等技术,以可视化及可交互的形式为辞书编纂人员展现检索结果分布的概貌,批量处理同质的语境,以提升辞书编纂的效率。
展开更多
关键词
语料库检索
语境
语义
上下文
相关
词
向量
注意力机制
下载PDF
职称材料
基于多元相似度融合的中文命名实体消歧方法
8
作者
石水倩
金晶
+2 位作者
沈耕宇
王宝佳
任妮
《数据分析与知识发现》
EI
CSSCI
CSCD
北大核心
2024年第2期56-64,共9页
【目的】解决文本中多个不同含义的同名实体在映射到知识库时产生的歧义问题,提高实体消歧的准确率。【方法】提出一种多元相似度融合方法,考虑实体上下文的语义相似度、实体属性的背景相似度和主题词的主题相似度,对实体进行刻画。【...
【目的】解决文本中多个不同含义的同名实体在映射到知识库时产生的歧义问题,提高实体消歧的准确率。【方法】提出一种多元相似度融合方法,考虑实体上下文的语义相似度、实体属性的背景相似度和主题词的主题相似度,对实体进行刻画。【结果】在维基百科农业方向数据集上的实验结果表明,本文所提方法准确率为89.7%,优于传统方法。【局限】方法仅在特定领域适用。【结论】本文所提多元相似度融合方法较传统方法和主流消歧方法具有更高的实体消歧准确率,能够解决特定领域的实体消歧问题,未来可将其应用于更广泛的实体消歧场景中。
展开更多
关键词
实体消歧
相似度
上下文
词
向量
实体属性
主题
词
向量
原文传递
题名
一种基于词上下文向量的文本自动分类方法
被引量:
5
1
作者
郭少友
机构
郑州大学信息管理系
出处
《情报科学》
CSSCI
北大核心
2008年第7期1030-1034,共5页
基金
河南省科技攻关项目(0613039700)
文摘
分析了传统文本自动分类方法的不足、词上下文向量的含义及其在自动分类中的作用,提出了一种基于词上下文向量的文本自动分类方法,该方法利用词上下文向量来生成分类器的类别中心向量和待分类文本的文本向量,使分类质量有所提高。
关键词
自动分类
上下文
词上下文向量
分类器
文本表示
Keywords
automatic classification
context
term context vector
classifier
text representation
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于上下文词向量和主题模型的实体消歧方法
被引量:
12
2
作者
王瑞
李弼程
杜文倩
机构
华侨大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2019年第11期46-56,共11页
基金
福建省社会科学规划项目(FJ2017B073)
华侨大学科研启动项目(600005-Z16Y0005)
文摘
传统词向量训练模型仅考虑词共现而未考虑词序,语义表达能力弱。此外,现有实体消歧方法没有考虑实体的局部特征。综合实体的全局特征和局部特征,该文提出一种基于上下文词向量和主题模型的实体消歧方法。首先,在传统词向量模型上增加上下文方向向量,用于表征语序,并利用该模型与主题模型训练主题词向量;其次,分别计算实体上下文相似度、基于实体上下文主题的类别主题相似度以及基于主题词向量的实体主题相似度;最后,融合三种相似度,选择相似度最高的实体作为最终消歧实体。实验结果表明,相比于现有的主流消歧方法,新方法是有效的。
关键词
上下文
词
向量
实体消歧
知识库
主题
词
向量
主题模型
Keywords
context word vector
entity disambiguation
knowledge base
topic vector
topic models
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于词语上下文关系的文本自动分类方法研究
3
作者
郭少友
机构
郑州大学信息管理系
出处
《现代图书情报技术》
CSSCI
北大核心
2008年第5期44-49,共6页
文摘
用词上下文向量来表达文本集内一个词语与其他词语之间的上下文关系,并在词上下文向量的基础上生成分类器中所有类别的类别特征向量,以及待分类文本的特征向量,最后由分类器给出待分类文本的所属类别。实验显示,在类别特征向量和文本向量中融入词语上下文关系有助于改善文本分类效果。
关键词
文本自动分类
上下文
词上下文向量
Keywords
Text automatic classification
Context
Term context vector
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
word2vec-ACV:OOV语境含义的词向量生成模型
被引量:
7
4
作者
王永贵
郑泽
李玥
机构
辽宁工程技术大学软件学院
出处
《计算机应用研究》
CSCD
北大核心
2019年第6期1623-1628,共6页
基金
国家自然科学基金青年基金资助项目(61404069)
文摘
针对word2vec模型生成的词向量缺乏语境的多义性以及无法创建集外词(OOV)词向量的问题,引入相似信息与word2vec模型相结合,提出word2vec-ACV模型。该模型首先基于连续词袋(CBOW)和Hierarchical softmax的word2vec模型训练出词向量矩阵即权重矩阵;然后将共现矩阵进行归一化处理得到平均上下文词向量,再将词向量组成平均上下文词向量矩阵;最后将平均上下文词向量矩阵与权重矩阵相乘得到词向量矩阵。为了能同时解决集外词及多义性问题,将平均上下文词向量分为全局平均上下文词向量(global ACV)和局部平均上下文词向量(local ACV)两种,并对两者取权值组成新的平均上下文词向量矩阵,并将word2vec-ACV模型和word2vec模型分别进行类比任务实验和命名实体识别任务实验。实验结果表明,word2vec-ACV模型同时解决了语境多义性以及创建集外词词向量的问题,降低了时间消耗,提升了词向量表达的准确性和对海量词汇的处理能力。
关键词
word2vec模型
词
向量
共现矩阵
平均
上下文
词
向量
Keywords
word2vec model
word vector
co-occurrence matrix
ACV
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
深层差异特征增强的机器翻译自动评价
5
作者
支思威
李茂西
吴水秀
陈有德
机构
江西师范大学计算机信息工程学院
江西师范大学管理科学与工程研究中心
出处
《中文信息学报》
CSCD
北大核心
2024年第10期46-53,共8页
基金
国家自然科学基金(62366020)
江西省教育厅科技项目(GJJ210306)。
文摘
机器翻译自动评价任务将机器翻译系统输出译文与人工参考译文进行对比定量计算翻译质量,在机器翻译的研究和应用中发挥着重要作用。当前主流的方法是使用预训练上下文语言模型表征机器翻译和人工参考译文,将两者的表征向量直接拼接输入前馈神经网络层以预测翻译质量;它没有在统一语义空间对两者之间的差异进行显式建模。该文提出基于深层差异特征增强的机器翻译自动评价方法,使用多头注意力机制深层抽象机器翻译和人工参考译文,利用两者在统一语义空间的差异特征增强当前最先进的自动评价方法UniTE_UP,将它们抽取的特征进行深层交互,以对机器翻译和人工参考译文之间的差异进行直接显式建模。在WMT'21机器翻译自动评价基准数据集上的实验结果表明,深层差异特征增强的自动评价方法能有效提高机器翻译自动评价与人工评价的相关性,消融实验和深入的实验分析进一步揭示了深层差异特征的有效性。
关键词
机器翻译
自动评价
多头注意力
预训练
上下文
词
向量
差异特征
Keywords
machine translation
automatic evaluation
multi-head attention
pre-trained contextual word embedding
difference features
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
TSPT:基于预训练的三阶段复合式文本摘要模型
被引量:
3
6
作者
吕瑞
王涛
曾碧卿
刘相湖
机构
华南师范大学计算机学院
出处
《计算机应用研究》
CSCD
北大核心
2020年第10期2917-2921,共5页
基金
国家自然科学基金资助项目(61772211,61503143)。
文摘
抽取式方法从源文本中抽取句子,会造成信息冗余;生成式方法可能生成非源文词,会产生语法问题,自然性差。BERT作为一种双向Transformer模型,在自然语言理解任务上展现了优异的性能,但在文本生成任务的应用有待探索。针对以上问题,提出一种基于预训练的三阶段复合式文本摘要模型(TSPT),结合抽取式方法和生成式方法,将源本文经过预训练产生的双向上下文信息词向量由sigmoid函数获取句子得分抽取关键句,在摘要生成阶段将关键句作为完形填空任务重写,生成最终摘要。实验结果表明,该模型在CNN/Daily Mail数据集中取得了良好效果。
关键词
预训练
复合式文本摘要模型
抽取式方法
生成式方法
双向
上下文
信息
词
向量
Keywords
pre-training
compound text summarization model
extractive method
generative method
bidirectional contextual information word vectors
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向语文辞书编纂的神经网络语料库检索研究
7
作者
胡钦谙
机构
中国社会科学院语言研究所/辞书编纂研究中心
出处
《辞书研究》
2023年第1期36-45,I0002,共11页
基金
国家语委“十三五”科研规划2020年度一般(委托)项目“辅助语文辞书编纂的人工智能关键技术研究”(项目编号WT135-69)的研究成果之一。
文摘
语料库检索已成为语文辞书编纂过程中不可或缺的一个步骤。现有的语料库检索系统通常先返回句子列表,然后由人工进行筛选。然而,随着语料库规模不断扩大,海量检索结果与用户有限的语料消化能力之间的矛盾已成为辞书编纂过程中的痛点之一。文章注意到,辞书编纂人员在检索语料库时,实际上更为关注的是检索词出现的语境(或称上下文)。语境具有相对稳定的语言学规律,语料库中往往存在着大量符合同一语言规律的语境。这种同质的语境对辞书编纂提供的价值相对有限,单纯依靠增加语料数量对辞书编纂的贡献已呈现出边际效益递减的现象。因此,文章尝试以海量检索结果中的同质语境为突破口,通过人工智能中的注意力机制、上下文相关词向量以及预训练语言模型等技术,以可视化及可交互的形式为辞书编纂人员展现检索结果分布的概貌,批量处理同质的语境,以提升辞书编纂的效率。
关键词
语料库检索
语境
语义
上下文
相关
词
向量
注意力机制
Keywords
corpus retrieval
contexts
semantics
contextual word embeddings
attentions
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TP391.1 [自动化与计算机技术—计算机应用技术]
H16 [语言文字—汉语]
下载PDF
职称材料
题名
基于多元相似度融合的中文命名实体消歧方法
8
作者
石水倩
金晶
沈耕宇
王宝佳
任妮
机构
江苏省农业科学院农业信息研究所
出处
《数据分析与知识发现》
EI
CSSCI
CSCD
北大核心
2024年第2期56-64,共9页
基金
国家社会科学基金项目(项目编号:19BTQ032)的研究成果之一。
文摘
【目的】解决文本中多个不同含义的同名实体在映射到知识库时产生的歧义问题,提高实体消歧的准确率。【方法】提出一种多元相似度融合方法,考虑实体上下文的语义相似度、实体属性的背景相似度和主题词的主题相似度,对实体进行刻画。【结果】在维基百科农业方向数据集上的实验结果表明,本文所提方法准确率为89.7%,优于传统方法。【局限】方法仅在特定领域适用。【结论】本文所提多元相似度融合方法较传统方法和主流消歧方法具有更高的实体消歧准确率,能够解决特定领域的实体消歧问题,未来可将其应用于更广泛的实体消歧场景中。
关键词
实体消歧
相似度
上下文
词
向量
实体属性
主题
词
向量
Keywords
Entity Disambiguation
Similarity
Contextual Word Vector
Entity Properties
Topic Word Vector
分类号
TP393 [自动化与计算机技术—计算机应用技术]
G250 [文化科学—图书馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种基于词上下文向量的文本自动分类方法
郭少友
《情报科学》
CSSCI
北大核心
2008
5
下载PDF
职称材料
2
基于上下文词向量和主题模型的实体消歧方法
王瑞
李弼程
杜文倩
《中文信息学报》
CSCD
北大核心
2019
12
下载PDF
职称材料
3
基于词语上下文关系的文本自动分类方法研究
郭少友
《现代图书情报技术》
CSSCI
北大核心
2008
0
下载PDF
职称材料
4
word2vec-ACV:OOV语境含义的词向量生成模型
王永贵
郑泽
李玥
《计算机应用研究》
CSCD
北大核心
2019
7
下载PDF
职称材料
5
深层差异特征增强的机器翻译自动评价
支思威
李茂西
吴水秀
陈有德
《中文信息学报》
CSCD
北大核心
2024
0
下载PDF
职称材料
6
TSPT:基于预训练的三阶段复合式文本摘要模型
吕瑞
王涛
曾碧卿
刘相湖
《计算机应用研究》
CSCD
北大核心
2020
3
下载PDF
职称材料
7
面向语文辞书编纂的神经网络语料库检索研究
胡钦谙
《辞书研究》
2023
0
下载PDF
职称材料
8
基于多元相似度融合的中文命名实体消歧方法
石水倩
金晶
沈耕宇
王宝佳
任妮
《数据分析与知识发现》
EI
CSSCI
CSCD
北大核心
2024
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部