期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于WordNet的本体澄清 被引量:4
1
作者 郭雷 方俊 王晓东 《计算机科学》 CSCD 北大核心 2008年第10期145-147,185,共4页
由于本体能够消除概念的混淆和重用知识,因此它的质量对于语义网技术的应用非常重要。为了提高本体的质量,很多的工作集中在概念建模,但是本体表示这个非常重要的方面一直被忽视。目前本体的表示使用的是词(term),但同一个词可能有很多... 由于本体能够消除概念的混淆和重用知识,因此它的质量对于语义网技术的应用非常重要。为了提高本体的质量,很多的工作集中在概念建模,但是本体表示这个非常重要的方面一直被忽视。目前本体的表示使用的是词(term),但同一个词可能有很多不同的意思,这样在基于本体的应用时将导致不清楚或错误的理解。为了解决这个问题,使用定义在WordNet中的词义(sense)而不是词来作为本体的表示,其原因是词义只有唯一的意思。本体澄清的定义为利用目标词周围的本体元素和被它标注的文档附近的词,对目标词进行自动消歧的过程。通过计算目标词义和它的邻居词的语义相似度,语义相关度最大的词义将选为正确的词义。实验表明,我们的算法有很好的性能。与最好的消歧算法相比,概念(Concept)精度差不多是名词精度的2倍,关系(Property)精度差不多是动词精度的3倍。实验证明了我们的算法在半自动的本体净化过程中也是非常有效的。 展开更多
关键词 本体澄清 语义相关度 消歧
下载PDF
基于词嵌入技术的心理学研究:方法及应用 被引量:2
2
作者 包寒吴霜 王梓西 +5 位作者 程曦 苏展 杨盈 张光耀 王博 蔡华俭 《心理科学进展》 CSSCI CSCD 北大核心 2023年第6期887-904,I0001-I0003,共21页
词嵌入是自然语言处理的一项基础技术。其核心理念是根据大规模语料中词语和上下文的联系,使用神经网络等机器学习算法自动提取有限维度的语义特征,将每个词表示为一个低维稠密的数值向量(词向量),以用于后续分析。心理学研究中,词向量... 词嵌入是自然语言处理的一项基础技术。其核心理念是根据大规模语料中词语和上下文的联系,使用神经网络等机器学习算法自动提取有限维度的语义特征,将每个词表示为一个低维稠密的数值向量(词向量),以用于后续分析。心理学研究中,词向量及其衍生的各种语义联系指标可用于探究人类的语义加工、认知判断、发散思维、社会偏见与刻板印象、社会与文化心理变迁等各类问题。未来,基于词嵌入技术的心理学研究需要区分心理的内隐和外显成分,深化拓展动态词向量和大型预训练语言模型(如GPT、BERT)的应用,并在时间和空间维度建立细粒度词向量数据库,更多开展基于词嵌入的社会变迁和跨文化研究。我们为心理学专门开发的R语言工具包PsychWordVec可以帮助研究者利用词嵌入技术开展心理学研究。 展开更多
关键词 自然语言处理 词嵌入 词向量 语义表征 语义关联 词嵌入联系测验
下载PDF
基于语义的关键词提取算法 被引量:39
3
作者 方俊 郭雷 王晓东 《计算机科学》 CSCD 北大核心 2008年第6期148-151,共4页
关键词1提供了文档内容的概要信息,它们被使用在很多数据挖掘的应用中。在目前的关键词提取算法中,我们发现词汇层面(代表意思的词)和概念层面(意思本身)的差别导致了关键字提取的不准确,比如不同语法的词可能有着相同的意思,而相同语... 关键词1提供了文档内容的概要信息,它们被使用在很多数据挖掘的应用中。在目前的关键词提取算法中,我们发现词汇层面(代表意思的词)和概念层面(意思本身)的差别导致了关键字提取的不准确,比如不同语法的词可能有着相同的意思,而相同语法的词在不同的上下文有着不同的意思。为了解决这个问题,这篇文章提出使用词义代替词并且通过考虑关键候选词的语义信息来提高关键词提取算法性能的方法。与现有的关键词提取方法不同,该方法首先通过使用消歧算法,通过上下文得到候选词的词义;然后在后面的词合并、特征提取和评估的步骤中,候选词义之间的语义相关度被用来提高算法的性能。在评估算法时,我们采用一种更为有效的基于语义的评估方法与著名的Kea系统作比较。在不同领域间的实验中可以发现,当考虑语义信息后,关键词提取算法的性能能够得到很大的提高。在同领域的实验中,我们的算法的性能与Kea++算法的相近。我们的算法没有领域的限制性,因此具有更好的应用前景。 展开更多
关键词 关键词提取 语义相关度 消歧
下载PDF
基于中文维基百科的词语相关度计算 被引量:12
4
作者 谌志群 高飞 曾智军 《情报学报》 CSSCI 北大核心 2012年第12期1265-1270,共6页
词语相关度的计算是自然语言处理关键技术之一,在信息检索、机器翻译、词义消歧、句法分析等领域有广泛应用。国内现有大部分词语相关度计算方法是基于知网(HowNet)的。本文将中文维基百科作为语义资源,利用其分类层次、概念文档之... 词语相关度的计算是自然语言处理关键技术之一,在信息检索、机器翻译、词义消歧、句法分析等领域有广泛应用。国内现有大部分词语相关度计算方法是基于知网(HowNet)的。本文将中文维基百科作为语义资源,利用其分类层次、概念文档之间的链接来计算汉语词语之间的相关度。在借鉴向量空间模型和谷歌相似度(Google Similarity Distance)计算方法基础上,通过构建分类图和相关语义向量来实现汉语词语相关度的计算。在测试集Word Similarity-353上进行了实验,实验结果的斯皮尔曼等级相关系数显示,本文的方法是可行和有效的。 展开更多
关键词 词语相关度计算 维基百科 分类图 语义向量
下载PDF
叙述文本中中心概念的确定方式及其通达 被引量:1
5
作者 陈红敏 莫雷 王瑞明 《心理科学》 CSSCI CSCD 北大核心 2006年第1期115-119,106,共6页
采用移动窗口技术考察叙述文本中中心概念的确定方式及其通达。实验一在中文条件下得出了与Michelle&O’Brien2002研究一致的结果。实验二采用事件相关方式确定中心词,结果表明,无论在标题相关陪衬词还是在事件相关陪衬词干扰下,事... 采用移动窗口技术考察叙述文本中中心概念的确定方式及其通达。实验一在中文条件下得出了与Michelle&O’Brien2002研究一致的结果。实验二采用事件相关方式确定中心词,结果表明,无论在标题相关陪衬词还是在事件相关陪衬词干扰下,事件相关中心词通达效果显著优于边缘词。实验三进一步比较事件相关中心概念与词频相关中心概念的通达效果,结果表明,前者通达效果显著优于后者。总的实验结果表明,事件相关中心的确定方式同样在叙述文本中具有适用性,能够很好地体现文本中心,表现出情境模型水平上的通达优势。 展开更多
关键词 事件相关中心 词频相关中心 标题相关中心 中心概念 边缘概念
下载PDF
DRM范式的关联性记忆错觉的理论解释述评 被引量:4
6
作者 王红椿 刘鸣 卢波 《心理学探新》 CSSCI 2004年第1期38-42,共5页
随着关联性记忆错觉的深入发展,研究者逐渐对关联性记忆错觉进行理论解释,并提出了一些相关的模型,该文从四个角度进行了归纳,即:基于部分编码的解释、基于信号检测分析的模型、模糊痕迹理论和综合的建构性记忆模型等,并进行了评价和展望。
关键词 关联性记忆错觉 DRM范式 原型词 模糊痕迹理论 建构性记忆模型
下载PDF
基于复杂网络的汉语相似词挖掘和相似度计算研究 被引量:5
7
作者 韩普 王东波 朱恒民 《情报学报》 CSSCI 北大核心 2015年第8期885-896,共12页
相似词是自然语言中普遍存在的现象,词汇相似度计算是情报学、自然语言处理和信息处理等领域的一项中间步骤。首先,基于大规模语料库构建了汉语词汇共现网络,进而利用复杂网络结构中节点相似的思想来计算词汇的相似度。其次,基于分... 相似词是自然语言中普遍存在的现象,词汇相似度计算是情报学、自然语言处理和信息处理等领域的一项中间步骤。首先,基于大规模语料库构建了汉语词汇共现网络,进而利用复杂网络结构中节点相似的思想来计算词汇的相似度。其次,基于分布假设、上下文语境理论和词汇网络结构的特点,本文提出了基于贡献度折扣的词汇相似度计算方法,该方法不仅考虑了网络边的权重信息,还将节点的全局度特征融合进来。通过节点相似度实验发现,本文提出的基于贡献度折扣的相似度算法要明显好于共同邻居法、Jaccard方法和Sahon方法。最后文章就实验结果及其结论做了详细分析。 展开更多
关键词 复杂网络 语料库 词汇相似度 语义相关度
下载PDF
多义词意义间的联系程度对词汇判断时间的影响 被引量:4
8
作者 陈宝国 周会霞 《心理与行为研究》 2005年第3期214-218,共5页
采用词汇判断法,考察双字多义词各意义间的联系程度对词汇判断时间的影响,同时考察,意义间联系程度不同的多义词与单义词的词汇判断时间的关系。实验结果表明:汉语中双字多义词意义间联系程度的高低没有对多义词词汇判断的时间产生影响... 采用词汇判断法,考察双字多义词各意义间的联系程度对词汇判断时间的影响,同时考察,意义间联系程度不同的多义词与单义词的词汇判断时间的关系。实验结果表明:汉语中双字多义词意义间联系程度的高低没有对多义词词汇判断的时间产生影响。在低频词的条件下,双字多义词,不管其意义间联系程度的高低,词汇判断的时间都快于单义词的判断时间,这表明汉语词汇识别中,存在低频多义词的识别优势效应。 展开更多
关键词 多义词 意义联系程度 词汇判断
下载PDF
二语词汇阅读的跨语言语音干扰:语义关联判断任务的证据 被引量:7
9
作者 吴诗玉 马拯 《心理学报》 CSSCI CSCD 北大核心 2015年第11期1318-1327,共10页
研究采用语义关联判断任务探讨二语词汇阅读的跨语言语音干扰现象。共有35名英语专业硕士研究生参加了实验,平均年龄23.17岁;同时为提供比对的基准样本,还挑选了35名英语本族语者参加实验,平均年龄26.06岁。语义关联判断任务实验结果表... 研究采用语义关联判断任务探讨二语词汇阅读的跨语言语音干扰现象。共有35名英语专业硕士研究生参加了实验,平均年龄23.17岁;同时为提供比对的基准样本,还挑选了35名英语本族语者参加实验,平均年龄26.06岁。语义关联判断任务实验结果表明,中国英语学习者,在对同音词对进行语义关联判断时,不仅在错误率上要比控制条件显著更高,而且在作出判断时的速度也要显著更慢。这种语音干扰效应的出现为二语词汇阅读时语音信息的自动激活提供了有力的证据。这也说明,在本研究中词汇入口由同音词经过语音路线而通达。另外,结果还表明,中国英语学习者在对由英语元音对比音/i/-/I/组成的词汇最小对立体进行语义判断时,不仅在错误率上要比控制条件显著更高,而且在作出判断时的速度也要显著更慢;但是英语本族语者不管是在错误率还是在反应时,实验条件下与控制条件下都没有区别。这一结果证实了中国学习者在进行二语词汇阅读时跨语言语音干扰的发生,说明二语词汇的心理表征受母语语音系统的影响。 展开更多
关键词 二语 词汇阅读 语义关联判断任务 跨语言语音干扰 对比音
下载PDF
基于无导词义消歧的语义查询扩展 被引量:4
10
作者 王瑞琴 孔繁胜 《情报学报》 CSSCI 北大核心 2011年第2期131-137,共7页
一个构造良好的查询是信息检索质量的基本保证,语义查询扩展技术解决了传统信息检索系统不能很好理解用户查询意图的问题,在提高检索查全率的同时保证了检索准确率.本文以查询关键字之间的语义关联为切入点,辅以隐式反馈技术获取消歧上... 一个构造良好的查询是信息检索质量的基本保证,语义查询扩展技术解决了传统信息检索系统不能很好理解用户查询意图的问题,在提高检索查全率的同时保证了检索准确率.本文以查询关键字之间的语义关联为切入点,辅以隐式反馈技术获取消歧上下文,以WordNet本体库和WordNet Domains扩展库作为消歧数据源,使用基于局部上下文和基于图论的两类无导词义消歧方法进行查询关键字到本体概念的映射,最后基于概念词汇关联完成基于语义的查询扩展.综合WordNet本体库和WordNet Domains扩展库中的各项知识源对查询词义进行判定,保证了词义消歧的精度;采用无导词义消歧实现查询词义的快速判定,保证了信息检索的实时性;根据查询关键词的多寡分别提出两类消歧方法,满足了各种查询需求. 展开更多
关键词 词义消歧 语义查询扩展 word Sense DISAMBIGUATION Based Query Expansion wordNet 信息检索系统 消歧方法 上下文 扩展库 关键字 本体库 检索准确率 语义关联 隐式反馈 快速判定 检索质量 技术解决 技术获取 基于语义
下载PDF
一个基于超图的词义归纳模型 被引量:5
11
作者 钱涛 姬东鸿 戴文华 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2016年第1期152-157,共6页
针对词义归纳如何学习多个上下文实例中的高阶语义关系的问题,提出一个基于超图的词义归纳模型。首先,采用基于词汇链的方法发现目标单词的上下文实例间的高阶语义关系;然后,用上下文实例表示结点,用词汇链发现超边来构建超图;最后,使... 针对词义归纳如何学习多个上下文实例中的高阶语义关系的问题,提出一个基于超图的词义归纳模型。首先,采用基于词汇链的方法发现目标单词的上下文实例间的高阶语义关系;然后,用上下文实例表示结点,用词汇链发现超边来构建超图;最后,使用一个基于最大密度超图谱聚类算法发现词义。实验基于Semeval-2013 WSI任务,与普通图模型进行比较,其在词义检测与词义评级2个指标上分别提升了5.6%和6.4%。 展开更多
关键词 词义归纳 超图 高阶语义关系
下载PDF
一种改进的基于语义的词义消歧方法 被引量:1
12
作者 王贤川 曾敏 +3 位作者 王小宁 朱雪波 李洪波 刘巧 《计算机应用与软件》 CSCD 北大核心 2012年第2期218-220,共3页
针对现有基于语义的词义消歧方法存在两点不足:一,利用部分具有歧义的上下文语境词进行消歧存在不合理性;二,未考虑上下文语境词距离远近对语义相关度计算的影响,提出一种改进的方法,采用分步策略和距离加权两种方法分别进行改进。实验... 针对现有基于语义的词义消歧方法存在两点不足:一,利用部分具有歧义的上下文语境词进行消歧存在不合理性;二,未考虑上下文语境词距离远近对语义相关度计算的影响,提出一种改进的方法,采用分步策略和距离加权两种方法分别进行改进。实验结果表明,改进方法在消歧效果上有明显的改善。 展开更多
关键词 词义消歧 上下文加权 语义相关度 知网
下载PDF
基于语义处理技术的信息检索模型 被引量:9
13
作者 王瑞琴 《情报学报》 CSSCI 北大核心 2012年第1期9-17,共9页
信息爆炸是当今信息社会的一大特点,如何在海量的信息中有效地找到所需信息因而成为了一个关键问题,语义检索技术是解决这一问题非常有潜力的方法。本文对信息检索中的若干关键问题进行了研究,提出了基于语义处理技术的信息检索模型... 信息爆炸是当今信息社会的一大特点,如何在海量的信息中有效地找到所需信息因而成为了一个关键问题,语义检索技术是解决这一问题非常有潜力的方法。本文对信息检索中的若干关键问题进行了研究,提出了基于语义处理技术的信息检索模型——SPTIR,该模型主要包括以下关键技术:基于词义消歧的语义查询扩展、基于词汇语义相关性度量的查询优化和基于文档语义相关性的检索结果重排序。最后使用大型测试数据集和多项性能指标对SPTIR模型的检索性能进行了试验评估,实验结果充分验证了SPTIR模型的竞争优势以及该模型采用的各项语义处理技术对提高检索性能所起的积极作用。 展开更多
关键词 词义消歧 语义相关性 查询扩展 查询优化 检索结果重排序
下载PDF
一种基于维基百科的中文词语相关度学习算法
14
作者 黄岚 杜友福 《中文信息学报》 CSCD 北大核心 2016年第3期36-45,共10页
词语相关程度计算是语义计算的基础。维基百科是目前最大、更新最快的在线开放式百科全书,涵盖概念广,概念解释详细,蕴含了大量概念间关联关系,为语义计算提供了丰富的背景知识。然而,中文维基百科中存在严重的数据稀疏问题,降低了中文... 词语相关程度计算是语义计算的基础。维基百科是目前最大、更新最快的在线开放式百科全书,涵盖概念广,概念解释详细,蕴含了大量概念间关联关系,为语义计算提供了丰富的背景知识。然而,中文维基百科中存在严重的数据稀疏问题,降低了中文词语相关度计算方法的有效性。针对这一问题,该文利用机器学习技术,提出一种新的基于多种维基资源的词语相关度学习算法。在三个标准数据集上的实验结果验证了新算法的有效性,在已知最好结果的基础上提升了20%—40%。 展开更多
关键词 词语相关度 维基百科 中文信息处理 回归 链接结构
下载PDF
基于挖掘Web双语词汇关联度的无指导译文消歧
15
作者 刘鹏远 赵铁军 《高技术通讯》 EI CAS CSCD 北大核心 2010年第4期349-354,共6页
为缓解译文消歧任务中消歧知识获取困难及数据稀疏问题,提出了一种基于Web的挖掘双语词汇相关关系的无指导译文消歧方法。该方法将双语词汇在语料库中的间接相关拓展到Web,提出了基于Web的双语词汇间接相关模型,在此基础上又提出了一种... 为缓解译文消歧任务中消歧知识获取困难及数据稀疏问题,提出了一种基于Web的挖掘双语词汇相关关系的无指导译文消歧方法。该方法将双语词汇在语料库中的间接相关拓展到Web,提出了基于Web的双语词汇间接相关模型,在此基础上又提出了一种基于Web的双语词汇相关度的消歧方法,通过构造不同queries并利用搜索引擎抽取返回页面的page counts,最后利用点式互信息来计算词汇间的相关度并用于消歧决策。该方法最好性能(P_(mar)=0.464)超过了国际语义评测Semeval-2007的Task #5上可比较的最好无指导系统TorMd。 展开更多
关键词 无指导译文消歧 双语词汇相关 页面计数 间接相关 基于WEB
下载PDF
基于Web的无指导译文消歧词模型与N-gram模型及对比研究 被引量:3
16
作者 刘鹏远 赵铁军 《电子与信息学报》 EI CSCD 北大核心 2009年第12期2969-2974,共6页
该文提出了基于Web的无指导译文消歧的词模型及N-gram模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web上的Page Count作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web相... 该文提出了基于Web的无指导译文消歧的词模型及N-gram模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web上的Page Count作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web相关度,根据汉语上下文词汇与英语译文之间的相关度进行消歧;N-gram模型首先假设不同语义下的多义词N-gram序列行为模式不同,从而可对多义词不同语义类下词汇在实例中的N-gram序列进行统计与分析以进行消歧。两个模型的性能均超过了在国际语义评测SemEval2007的task#5上可比较的最好无指导系统。对这两个模型进行试验对比可发现N-gram模型性能优于词模型,也表明组合两类模型的结果有进一步提升消歧性能的潜力。 展开更多
关键词 计算语言学 无指导译文消歧 词模型 N-GRAM模型 PAGE COUNT 双语词汇Web相关度
下载PDF
一种新的图像语义自动标注模型 被引量:2
17
作者 王妍宁 郭雷 方俊 《计算机工程与应用》 CSCD 北大核心 2011年第7期193-197,共5页
根据图像低层特征和高级语义间的对应关系,自动进行图像语义标注是目前图像检索系统研究的热点。简要介绍了基于图像语义连接网络的图像检索框架,提出了一种基于该框架的图像自动标注模型。该模型通过积累用户反馈信息,学习并获得图像语... 根据图像低层特征和高级语义间的对应关系,自动进行图像语义标注是目前图像检索系统研究的热点。简要介绍了基于图像语义连接网络的图像检索框架,提出了一种基于该框架的图像自动标注模型。该模型通过积累用户反馈信息,学习并获得图像语义,从而进行自动的图像标注。图像语义及标注可以在与用户交互过程中得到实时更新。还提出了一种词义相关度分析的方法剔除冗余标注词,解决标注误传播的问题。通过在Corel图像集上的对比实验,验证了该方法的有效性。 展开更多
关键词 图像标注 相关反馈 语义连接网络 词义相关度
下载PDF
基于百科资源的名词性隐喻识别 被引量:3
18
作者 冯帅 苏畅 陈怡疆 《计算机系统应用》 2013年第10期8-13,59,共7页
针对现有隐喻计算知识库的广度和深度不足问题,提出了引入了网络百科资源作为隐喻识别的世界知识库的方法.利用信息检索技术,从概念对应的百科页面中获取概念的背景世界知识,计算两个概念的世界知识的重合程度,作为判断它们是否属于同... 针对现有隐喻计算知识库的广度和深度不足问题,提出了引入了网络百科资源作为隐喻识别的世界知识库的方法.利用信息检索技术,从概念对应的百科页面中获取概念的背景世界知识,计算两个概念的世界知识的重合程度,作为判断它们是否属于同一个概念域的依据,进行隐喻的识别.实验结果表明在使用百度百科作为世界知识库时,隐喻/常规表达的识别正确率达到81.06%,算法的有效性得到证明. 展开更多
关键词 名词性隐喻 隐喻识别 百科资源 词语相关度 隐喻可接受度
下载PDF
摘要、关键词、引言、结论与科技论文内容的关联性探讨
19
作者 常士正 《南阳理工学院学报》 2017年第1期63-65,共3页
科技论文的摘要、关键词、引言与结论是本论之外最重要的要素,涉及论文的吸引力、可读性和转载率等。笔者以引论-本论-结论结构模式的科技论文与使用IMRAD(Introduction,Materials and Methods,Results and Discussion)结构模式的报道... 科技论文的摘要、关键词、引言与结论是本论之外最重要的要素,涉及论文的吸引力、可读性和转载率等。笔者以引论-本论-结论结构模式的科技论文与使用IMRAD(Introduction,Materials and Methods,Results and Discussion)结构模式的报道性摘要为典型,分析了摘要、关键词、引言、结论等与论文相关内容的关联性。这些要素与论文正文的内容既密切相关又相互独立,不是简单的重复或重组。 展开更多
关键词 科技论文写作 摘要 关键词 引言 结论 关联性
下载PDF
基于Spark与词语相关度的KNN文本分类算法 被引量:3
20
作者 于苹苹 倪建成 +2 位作者 韦锦涛 曹博 姚彬修 《计算机技术与发展》 2018年第3期87-92,共6页
针对K-最近邻(KNN)分类算法在当前大数据背景下分类效率降低、分类效果不理想的问题,提出了一种基于Spark框架与词语相关度优化的高效KNN文本分类算法。在相似度计算过程中,采用词语相关度将文本词语间的关系考虑在内,对分类算法相似度... 针对K-最近邻(KNN)分类算法在当前大数据背景下分类效率降低、分类效果不理想的问题,提出了一种基于Spark框架与词语相关度优化的高效KNN文本分类算法。在相似度计算过程中,采用词语相关度将文本词语间的关系考虑在内,对分类算法相似度计算进行优化,从而提高文本分类的准确度;依托Spark计算框架的内存处理机制,实现文本分类的并行化,从而提高KNN文本分类算法的处理效率,同时在并行化过程中建立类别-距离向量,以进一步加快文本分类的处理速度。实验结果表明,Spark框架下基于词语相关度的KNN文本分类算法在保证分类效果的基础上大大提高了分类效率,较Hadoop平台有较好的加速比,可有效地对大数据进行分类处理。 展开更多
关键词 K-最近邻 词语相关度 SPARK 并行化计算
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部