期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
情感Ontology构建与文本倾向性分析 被引量:10
1
作者 王晓东 刘倩 陶县俊 《计算机工程与应用》 CSCD 北大核心 2010年第30期117-120,共4页
对文本倾向性分析方法进行了研究,并提出了一种基于情感Ontology的分析方法。首先基于《知网》构建情感Ontology,然后基于情感Ontology抽取文本倾向性分析的特征词汇并判断其情感倾向性,最后根据抽取的特征词汇对整篇文本的倾向性进行... 对文本倾向性分析方法进行了研究,并提出了一种基于情感Ontology的分析方法。首先基于《知网》构建情感Ontology,然后基于情感Ontology抽取文本倾向性分析的特征词汇并判断其情感倾向性,最后根据抽取的特征词汇对整篇文本的倾向性进行分析。实验结果表明,以实验语料中的所有词汇作为特征词汇,在Baseline的基础上,利用情感Ontology抽取特征词汇的文本倾向性分析方法可以使准确率达到86.76%。 展开更多
关键词 ontology 文本倾向性分析 《知网》 词汇相似度
下载PDF
基于Ontology的Web文本分类法 被引量:2
2
作者 凌云 魏贵义 刘军 《情报学报》 CSSCI 北大核心 2006年第2期202-207,共6页
传统方法处理文本分类时都需要进行文本训练,并且在文本表示时需要抽取特征项。搜集训练文本的过程需要费时费力的人工参与,而且中文信息的特征项抽取工作难度较大。为了解决这些问题,本文探讨了一种新的文本分类法——基于Ontology... 传统方法处理文本分类时都需要进行文本训练,并且在文本表示时需要抽取特征项。搜集训练文本的过程需要费时费力的人工参与,而且中文信息的特征项抽取工作难度较大。为了解决这些问题,本文探讨了一种新的文本分类法——基于Ontology的Web文本分类法。该方法首先通过“知网”建立一个Ontology,然后根据分类体系建立每个类的Ontology,最后根据每个类的Ontology对文本进行分类。试验表明这种分类法与KNN分类法在准确率上相当,但比KNN方法稳定,在召回率上优于KNN方法。 展开更多
关键词 ontology 文本分类 知网
下载PDF
基于情感Ontology的资源分析模型 被引量:2
3
作者 刘倩 陶县俊 王晓东 《计算机与数字工程》 2009年第9期115-119,共5页
对资源分析方法进行了研究,并提出了一种基于情感Ontology的分析方法。首先基于"知网"构建情感On-tology,然后基于情感Ontology抽取资源分析的特征词汇并判断其情感倾向性,最后根据抽取的特征词汇对整篇文本的情感倾向进行分... 对资源分析方法进行了研究,并提出了一种基于情感Ontology的分析方法。首先基于"知网"构建情感On-tology,然后基于情感Ontology抽取资源分析的特征词汇并判断其情感倾向性,最后根据抽取的特征词汇对整篇文本的情感倾向进行分析。实验结果表明,在以人工标注做Baseline的基础上,利用情感Ontology抽取特征词汇的资源分析方法可以使情感识别的准确率达到78.87%。 展开更多
关键词 ontology 文本倾向性分析 “知网” 词汇相似度
下载PDF
基于HowNet的中文本体学习方法研究 被引量:6
4
作者 贾文娟 何丰 《计算机技术与发展》 2011年第6期77-80,84,共5页
目前针对国内在中文环境下本体学习的研究才刚刚起步的现状,对本体学习和HowNet进行了简单介绍,提出了基于HowNet的中文本体学习的主要思路。当前,本体学习的研究重点在于概念及概念间关系抽取。采用文本语料作为输入,首先对文本进行预... 目前针对国内在中文环境下本体学习的研究才刚刚起步的现状,对本体学习和HowNet进行了简单介绍,提出了基于HowNet的中文本体学习的主要思路。当前,本体学习的研究重点在于概念及概念间关系抽取。采用文本语料作为输入,首先对文本进行预处理,然后基于HowNet生成了一个领域语义词典,在本体学习中加入领域核心概念本体,在概念关系抽取阶段,采用基于HowNet的语义相似度计算方法。实验证明,提出的本体学习方法能够有效改进概念和概念间关系抽取的准确度。 展开更多
关键词 本体学习 hownet 概念抽取 概念关系抽取
下载PDF
基于领域词语本体的短文本分类 被引量:41
5
作者 宁亚辉 樊兴华 吴渝 《计算机科学》 CSCD 北大核心 2009年第3期142-145,共4页
短文本自身长度较短,描述概念能力弱,常用文本分类方法都不太适用于短文本分类。提出了基于领域词语本体的短文本分类方法。首先抽取领域高频词作为特征词,借助知网从语义方面将特征词扩展为概念和义元,通过计算不同概念所包含相同义元... 短文本自身长度较短,描述概念能力弱,常用文本分类方法都不太适用于短文本分类。提出了基于领域词语本体的短文本分类方法。首先抽取领域高频词作为特征词,借助知网从语义方面将特征词扩展为概念和义元,通过计算不同概念所包含相同义元的信息量来衡量词的相似度,从而进行分类。对比实验表明,该方法在一定程度上弥补了短文本特征不足的缺点,且提高了准确率和召回率。 展开更多
关键词 短文本 本体 知网 文本分类 语义 义元
下载PDF
自动问答系统中的句子相似度算法的研究 被引量:18
6
作者 周永梅 陶红 +1 位作者 陈姣姣 张再跃 《计算机技术与发展》 2012年第5期75-78,共4页
文中主要研究了自动问答系统的句子相似度的几种常见算法,基于统计的VSM算法、语义相似度算法、结构的相似度算法,并在此基础上进行改进,提出了一种新的句子相似度算法,提高了自动问答系统的查全率和查准率。主要研究了分词、标注词性... 文中主要研究了自动问答系统的句子相似度的几种常见算法,基于统计的VSM算法、语义相似度算法、结构的相似度算法,并在此基础上进行改进,提出了一种新的句子相似度算法,提高了自动问答系统的查全率和查准率。主要研究了分词、标注词性和权值、计算词语的相似度,进而计算句子的加权相似度,最后从FAQ中抽取相似度比较高的句子以及答案给用户。最后通过实验进行验证,这种新的句子相似度算法在一定程度上提高了自动问答系统的查全率和查准率,并具有一定的合理性。 展开更多
关键词 分词 本体 知网 语义相似度 查全率 查准率
下载PDF
基于知网和术语相关度的本体关系抽取研究 被引量:7
7
作者 傅继彬 刘杰 +1 位作者 贾可亮 毛金涛 《现代图书情报技术》 CSSCI 北大核心 2008年第9期36-40,共5页
提出一种基于知网和术语相关度的关系抽取方法。首先通过句法分析提取术语的上下文特征,结合自然语言特征和互信息的方法计算术语之间的相关度,然后使用术语的义原和动态角色作为关键词,在知网语义关系框架中定位关系,并为关系指定明确... 提出一种基于知网和术语相关度的关系抽取方法。首先通过句法分析提取术语的上下文特征,结合自然语言特征和互信息的方法计算术语之间的相关度,然后使用术语的义原和动态角色作为关键词,在知网语义关系框架中定位关系,并为关系指定明确的语义标签。实验结果表明该方法具有较好的实用效果。 展开更多
关键词 关系抽取 本体学习 知网 自然语言处理
下载PDF
银行领域汉语自动问答系统BAQS的研究与实现 被引量:27
8
作者 樊孝忠 李宏乔 +1 位作者 李良富 叶江 《北京理工大学学报》 EI CAS CSCD 北大核心 2004年第6期528-532,共5页
介绍BAQS的研究背景和系统框架.探讨基于问点块和语义块识别以及句模匹配分析问句的新方法,并用向量表示整个问句语义.借鉴本体和知网思想,构建银行领域本体库和银行知网.采用预先对金融领域实用文本进行标注,依据问句向量从标注树中提... 介绍BAQS的研究背景和系统框架.探讨基于问点块和语义块识别以及句模匹配分析问句的新方法,并用向量表示整个问句语义.借鉴本体和知网思想,构建银行领域本体库和银行知网.采用预先对金融领域实用文本进行标注,依据问句向量从标注树中提取答案.并针对某银行实现汉语自动问答系统.实验表明该方法可行,对自动问答系统的设计具有借鉴意义和深入研究的价值. 展开更多
关键词 问答系统 银行本体 银行知网 语义块
下载PDF
一种基于语义和统计特征的中文文本特征表示方法 被引量:8
9
作者 赵鹏 耿焕同 蔡庆生 《小型微型计算机系统》 CSCD 北大核心 2007年第7期1311-1313,共3页
基于关键词集的中文文本特征表示方法难以准确表示文本语义信息,从而导致聚类质量较差.为了解决这个问题,本文将本体论和词共现模型的思想引入到中文文本的特征表示中,并在此基础上提出了一种基于语义和统计特征的中文文本特征表示方法... 基于关键词集的中文文本特征表示方法难以准确表示文本语义信息,从而导致聚类质量较差.为了解决这个问题,本文将本体论和词共现模型的思想引入到中文文本的特征表示中,并在此基础上提出了一种基于语义和统计特征的中文文本特征表示方法.本方法在统计特征的基础上加入了基于知网和特征项共现的语义特征,实验结果表明该方法更加准确地表示了中文文本的语义信息,使得中文文本自动聚类的质量提高了近18%. 展开更多
关键词 向量空间模型 本体论 知网 词共现
下载PDF
中文本体映射研究与实现 被引量:10
10
作者 李佳 祝铭 +1 位作者 刘辰 杨正球 《中文信息学报》 CSCD 北大核心 2007年第4期27-33,共7页
本体间的异构是语义网建设亟待解决的问题,本体映射则是解决本体异构的有效手段。中文资源是信息网络的重要组成部分,实现中文本体间以及中文与其他本体的映射是实现知识共享重用的一个重要组成部分。本文从元素层的角度对中文本体映射... 本体间的异构是语义网建设亟待解决的问题,本体映射则是解决本体异构的有效手段。中文资源是信息网络的重要组成部分,实现中文本体间以及中文与其他本体的映射是实现知识共享重用的一个重要组成部分。本文从元素层的角度对中文本体映射进行了研究,提出利用知网,结合多种技术计算词汇相似度,利用词汇的相似度计算概念匹配的可信度,实现元素层本体映射的算法,并根据此算法实现了ELOMC(Element Level Ontology Matching for Chinese)系统。 展开更多
关键词 计算机应用 中文信息处理 中文本体映射 知网 词汇相似度 语义网
下载PDF
一种基于《知网》的中文文本聚类算法的研究 被引量:7
11
作者 赵鹏 蔡庆生 《计算机工程与应用》 CSCD 北大核心 2007年第12期162-163,共2页
针对基于关键词集的中文文本聚类算法中存在的问题,将《知网》引入到中文文本的特征表示中,并在此基础上提出了一种基于《知网》的中文文本聚类算法。该算法在中文文本表示中加入了基于《知网》的概念特征,实验结果表明该算法能够更好... 针对基于关键词集的中文文本聚类算法中存在的问题,将《知网》引入到中文文本的特征表示中,并在此基础上提出了一种基于《知网》的中文文本聚类算法。该算法在中文文本表示中加入了基于《知网》的概念特征,实验结果表明该算法能够更好地将语义相关的中文文档聚集在一起,与传统的基于关键词集的中文文本聚类算法相比,聚类质量得到了较大提高。 展开更多
关键词 向量空间模型 本体论 知网
下载PDF
基于How Net的事件角色语义特征提取 被引量:9
12
作者 郝秀兰 杨尔弘 舒鑫柱 《中文信息学报》 CSCD 北大核心 2001年第5期26-32,共7页
本文提出了一种将HowNet中事件的主要特征与实体的主要特征联系起来的方法———为事件类定义角色语义表 ,从而将HowNet的事件类与语义解释联接起来。文中给出了角色语义表的形式描述、一个角色语义表获取算法 。
关键词 hownet 角色语义表 事件类 实体类 特征提取 语义解释 词类范畴
下载PDF
基于知网的模糊情感本体的构建研究 被引量:16
13
作者 史伟 王洪伟 何绍义 《情报学报》 CSSCI 北大核心 2012年第6期595-602,共8页
构建模糊情感本体是在线评论情感分析的基础。针对在线评论情感表达的多样性和模糊性,将情感本体划分为评价词本体和情感词本体,利用模糊理论和知网相关概念,构建模糊情感本体的基本模型。根据评价词和情感词的各自特点,运用模糊化... 构建模糊情感本体是在线评论情感分析的基础。针对在线评论情感表达的多样性和模糊性,将情感本体划分为评价词本体和情感词本体,利用模糊理论和知网相关概念,构建模糊情感本体的基本模型。根据评价词和情感词的各自特点,运用模糊化处理和语义相似度的相关理论,分别对评价词模糊本体和情感词模糊本体的情感类型和隶属度进行了相应处理。并通过与点互信息方法比较,验证了情感本体模型在自动获取情感类方面的有效性,最后进行了相关数据统计。 展开更多
关键词 模糊情感本体 知网 评价词情感词模糊处理
下载PDF
一种改进的基于本体概念相似度计算方法研究 被引量:1
14
作者 刘影 陈立 +4 位作者 宋自林 董庆超 陈兴华 朱卫星 何继贤 《南京邮电大学学报(自然科学版)》 2011年第6期60-66,共7页
知网是一个英汉双语本体,含有丰富的语义知识。在综合考虑了知网中义原重合度、义原差度、层次深度等因素的基础上,提出了一种新颖的义原相似度计算方法,并在义原相似度计算的基础上,通过改进的匈牙利算法来计算基于知网的概念相似度,... 知网是一个英汉双语本体,含有丰富的语义知识。在综合考虑了知网中义原重合度、义原差度、层次深度等因素的基础上,提出了一种新颖的义原相似度计算方法,并在义原相似度计算的基础上,通过改进的匈牙利算法来计算基于知网的概念相似度,最后通过实验验证算法的有效性,与基于WordNet的方法相比,文中提出的基于知网的相似度计算一样可以取得较好的精确度。 展开更多
关键词 本体 知网 义原相似度 概念相似度 匈牙利算法
下载PDF
基于概念聚类的领域本体图中文文本分类 被引量:2
15
作者 叶施仁 孙宁 《计算机工程》 CAS CSCD 北大核心 2016年第12期181-187,共7页
基于半监督概念聚类技术,提出一种改进的领域本体图中文文本分类算法。根据领域本体图结构模型,创建中文文本分类的本体学习框架,利用HowNet字典实现术语提取并建立中文术语-术语关系映射。依据术语间的权重连接关系,设计二分类关系的KL... 基于半监督概念聚类技术,提出一种改进的领域本体图中文文本分类算法。根据领域本体图结构模型,创建中文文本分类的本体学习框架,利用HowNet字典实现术语提取并建立中文术语-术语关系映射。依据术语间的权重连接关系,设计二分类关系的KLSeeker本体中文文本分类算法,并通过基于概念聚类的本体图半监督学习,实现中文文本的精确分类。实验结果表明,与基于非负张量分解的中文文本分类算法相比,该算法具有更高的分类精度。 展开更多
关键词 词消歧 半监督 概念聚类 hownet字典 二分类关系 领域本体图
下载PDF
一种基于语义本体的网络爬虫模型 被引量:4
16
作者 张红云 刘炜 熊前兴 《计算机应用与软件》 CSCD 2009年第11期101-103,共3页
针对传统通用网络爬虫的自身固有的缺陷,结合本体的相关理论,提出了一种基于语义本体的网络爬虫的相关模型。该模型以本体构建领域知识概念集,结合知网,从语义的角度,利用扩展的元数据,在词的语义层次,对抓取的页面链接进行语义相关性计... 针对传统通用网络爬虫的自身固有的缺陷,结合本体的相关理论,提出了一种基于语义本体的网络爬虫的相关模型。该模型以本体构建领域知识概念集,结合知网,从语义的角度,利用扩展的元数据,在词的语义层次,对抓取的页面链接进行语义相关性计算,预测与主题相关的URL,提高采集的网络资源信息与设定主题的相关度。实验结果表明,该模型同其它通用网络爬虫模型相比具有较高的信息抓取准确率。 展开更多
关键词 领域本体 网络爬虫 扩展元数据 知网
下载PDF
基于多词典融合的词汇语义倾向判别 被引量:3
17
作者 刘清松 张仰森 《计算机技术与发展》 2015年第5期104-109,共6页
文本情感倾向性判别是情感分析的重要组成部分,而精确的词汇情感计算是文本情感倾向性判别的基础。基于词汇知识库的情感词倾向判别计算引起了学者们的广泛关注与研究。文中融合国内知名的三大词典:How Net、同义词词林、情感词汇本体,... 文本情感倾向性判别是情感分析的重要组成部分,而精确的词汇情感计算是文本情感倾向性判别的基础。基于词汇知识库的情感词倾向判别计算引起了学者们的广泛关注与研究。文中融合国内知名的三大词典:How Net、同义词词林、情感词汇本体,重新对基准词对做进一步的归纳与总结,从不同的角度构建三类等价情感倾向集合并提出两种处理集合的策略,建立了待定情感词与特定等价情感倾向集合的情感映射关系。实验结果表明:该方法获得的最高准确率可达91.62%,平均正确率85.31%,符合人们对词语的情感倾向认识。 展开更多
关键词 hownet 情感词汇本体 同义词词林 等价情感倾向集合
下载PDF
一种基于上下文的语义相似度算法 被引量:4
18
作者 宗裕朋 吴刚 《微计算机信息》 北大核心 2008年第30期211-212,243,共3页
本体中概念映射的关键是概念相似度计算。本文针对目前概念相似度计算所存在的问题,提出了一种基于上下文的计算本体内概念间语义相似度的算法,从概念的父代和子代两个角度进行计算。该算法充分考虑了概念所处的具体应用环境,利用了本... 本体中概念映射的关键是概念相似度计算。本文针对目前概念相似度计算所存在的问题,提出了一种基于上下文的计算本体内概念间语义相似度的算法,从概念的父代和子代两个角度进行计算。该算法充分考虑了概念所处的具体应用环境,利用了本体中概念的语义信息。实验结果表明,基于上下文的语义相似度算法比单纯地计算概念间语义相似度更有效。 展开更多
关键词 语义相似度 本体上下文 知网
下载PDF
基于领域本体映射的综合相似度计算方法 被引量:3
19
作者 金海涛 张琳 《现代计算机(中旬刊)》 2017年第5期34-39,共6页
领域本体为知识的共享和重用提供重大作用。本体映射是在异构本体间建立语义映射关系,解决本体异构的重要途径。针对目前本体映射中相似度计算存在的不足,提出一种综合的相似度计算方法,即先依据知网知识词典并考虑未登录词分词后词性... 领域本体为知识的共享和重用提供重大作用。本体映射是在异构本体间建立语义映射关系,解决本体异构的重要途径。针对目前本体映射中相似度计算存在的不足,提出一种综合的相似度计算方法,即先依据知网知识词典并考虑未登录词分词后词性的作用,计算出本体元素的概念相似度;再分析本体的层次关系计算其结构相似度;通过加权综合得到本体的综合相似度;最后构建两个异构航运本体,设计实验来验证改进后算法的正确性和有效性,实验表明所提出的方法具有较高准确率。 展开更多
关键词 领域本体 本体映射 本体异构 知网 相似度计算
下载PDF
面向搜索引擎的多策略本体半自动构建方法
20
作者 葛幸 徐炜民 《计算机工程与设计》 CSCD 北大核心 2010年第20期4459-4462,4475,共5页
为减少本体建设中对领域专家的过分依赖,结合本体应用于搜索引擎的特点,提出了一种多策略的本体半自动构建方法。构建一领域本体雏形应用于信息检索;在概念抽取模块,基于用户查询的统计信息以及与本体雏形中概念的关联法则进行概念抽取... 为减少本体建设中对领域专家的过分依赖,结合本体应用于搜索引擎的特点,提出了一种多策略的本体半自动构建方法。构建一领域本体雏形应用于信息检索;在概念抽取模块,基于用户查询的统计信息以及与本体雏形中概念的关联法则进行概念抽取;在关系发现模块,综合运用概念组合同现频率、在用户点击链接正文中的互信息和基于《知网》的语义分析对抽取出来的概念组合进行筛选和语义分析;最终将结果更新入本体。将该方法应用医学健康知识信息检索,实验结果表明,该本体半自动构建的方法是可行的,更新本体的内容符合本体构建标准。 展开更多
关键词 本体 半自动构建 知网 语义相关度 搜索引擎
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部