期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
一种基于概念抽取的相关词推荐模型 被引量:2
1
作者 张选平 马琮 +2 位作者 蒋宇 袁明轩 梁平 《微电子学与计算机》 CSCD 北大核心 2006年第5期163-165,169,共4页
搜索引擎已经成为Internet上非常有用的信息检索工具,而查询关键词的质量则是影响搜索效果的最重要的因素之一。相关词推荐技术可以通过向用户提供高质量的查询词,帮助用户缩小查询范围,提高搜索结果的查准率。文章提出一种新的基于概... 搜索引擎已经成为Internet上非常有用的信息检索工具,而查询关键词的质量则是影响搜索效果的最重要的因素之一。相关词推荐技术可以通过向用户提供高质量的查询词,帮助用户缩小查询范围,提高搜索结果的查准率。文章提出一种新的基于概念抽取的相关词推荐模型,该模型克服了传统相关词推荐模型的一些不足,提供精确度更高的相关词作为二次搜索关键词,使信息搜索达到更好的效果。 展开更多
关键词 WEB搜索 概念抽取 相关度
下载PDF
基于模式匹配的中文通用本体概念抽取模型 被引量:5
2
作者 王昊 苏新宁 《情报理论与实践》 CSSCI 北大核心 2008年第2期292-297,291,共7页
本文重点阐述了中文通用本体概念实例的机器抽取过程,建立了基于模式匹配的通用本体概念识别模型,以此作为领域本体自动构建的基础。此后探讨了该模型在情报学各研究领域中的应用前景,并通过实验检验模型在实际应用中的识别效果。
关键词 通用本体 概念抽取 模式匹配 隐马尔可夫模型
下载PDF
粗糙形式概念抽取的属性集合幂集方法 被引量:1
3
作者 王丹 黄映辉 李冠宇 《计算机工程与设计》 CSCD 北大核心 2011年第9期3162-3165,共4页
为了最大限度地抽取出形式背景中的粗糙形式概念,以便为粗糙概念格的构建提供完整的信息源,对粗糙形式概念的抽取进行了研究,提出了粗糙形式概念抽取的属性集合幂集方法。其操作要点为:粗糙形式概念的内涵由属性集合幂集方法所求得的子... 为了最大限度地抽取出形式背景中的粗糙形式概念,以便为粗糙概念格的构建提供完整的信息源,对粗糙形式概念的抽取进行了研究,提出了粗糙形式概念抽取的属性集合幂集方法。其操作要点为:粗糙形式概念的内涵由属性集合幂集方法所求得的子集确定,粗糙形式概念的外延由属性集合幂集所对应对象的上下近似集确定。该方法实现了粗糙形式概念的抽取,保证了从形式背景中抽取出概念的完整性,并能发掘一些隐含的概念,该方法简单快捷,易于计算机实现。 展开更多
关键词 形式背景 粗糙概念 粗糙形式概念 形式概念抽取 属性集合幂集
下载PDF
基于知网的领域概念抽取与关系分析研究 被引量:6
4
作者 唐一之 《湘潭大学自然科学学报》 CAS CSCD 北大核心 2009年第1期135-140,共6页
针对目前领域概念抽取手工完成的现况,提出了一种基于知网的领域概念抽取和关系分析系统模型.本模型利用知网语义相关性从文本中生成领域语义词典,结合TFIDF算法建立"词-文本文档矩阵",用以代替传统的词形频率统计;通过产生... 针对目前领域概念抽取手工完成的现况,提出了一种基于知网的领域概念抽取和关系分析系统模型.本模型利用知网语义相关性从文本中生成领域语义词典,结合TFIDF算法建立"词-文本文档矩阵",用以代替传统的词形频率统计;通过产生领域语义本体,利用语义相似度对概念进行聚类.讨论了这3个步骤所涉及的算法,包括基于统计模式从文本中抽词,基于奇异值分解从词-文档矩阵中提取概念,基于语义相似度对概念进行聚类等.实验表明,本文提出的抽取方法相对与词频算法具有较高的准确度. 展开更多
关键词 知网 HOWNET 概念抽取 语义相似度
下载PDF
基于上下文语义的甲骨文领域概念抽取算法的研究 被引量:1
5
作者 吴琴霞 高峰 刘永革 《科学技术与工程》 北大核心 2014年第26期255-258,共4页
本体构建的重点在于概念的抽取,针对甲骨文卜辞特有的特征和已有的领域概念抽取算法的缺陷,提出了一种基于上下文语义的甲骨文领域概念抽取算法。该算法针对传统的基于DR+DC的概念抽取算法的缺点进行改进,提出了基于上下文的概念间的相... 本体构建的重点在于概念的抽取,针对甲骨文卜辞特有的特征和已有的领域概念抽取算法的缺陷,提出了一种基于上下文语义的甲骨文领域概念抽取算法。该算法针对传统的基于DR+DC的概念抽取算法的缺点进行改进,提出了基于上下文的概念间的相似度的计算方法,并给出了基于语义的领域概念筛选算法。实验数据表明,该方法在准确率和召回率以及困惑度衰减比率都有较大的提高。 展开更多
关键词 语义 概念抽取 领域相关度 领域一致度 困惑度衰减比
下载PDF
一种基于概念抽取的元搜索引擎
6
作者 张选平 袁明轩 +2 位作者 蒋宇 马琮 梁平 《微电子学与计算机》 CSCD 北大核心 2006年第3期156-159,共4页
文章在概念抽取算法基础上,提出一种基于概念的元搜索引擎体系结构。这种体系结构提供统一的用户界面,通过查询适配可以同时使用多个独立搜索引擎的高级搜索功能。并且通过概念抽取对搜索结果进一步分析,使其更为准确和详细。系统提供... 文章在概念抽取算法基础上,提出一种基于概念的元搜索引擎体系结构。这种体系结构提供统一的用户界面,通过查询适配可以同时使用多个独立搜索引擎的高级搜索功能。并且通过概念抽取对搜索结果进一步分析,使其更为准确和详细。系统提供了概念图这种独特的结果显示方式,引导用户细化搜索范围以得到更为精确的结果。 展开更多
关键词 元搜索引擎 概念抽取 相关度排序
下载PDF
军事领域中概念抽取及其应用
7
作者 郑玄 蒋锴 +1 位作者 钱夔 徐俊瑜 《指挥信息系统与技术》 2016年第4期72-76,共5页
在军事领域的概念抽取中,以军事领域核心概念作为种子概念扩充了领域概念,并提出了基于核心概念结构的候选概念评价方法。该方法利用核心概念表征的不同语义范围,对语料进行层次聚类,计算不同层次细粒度的统计特征,对候选概念的领域归... 在军事领域的概念抽取中,以军事领域核心概念作为种子概念扩充了领域概念,并提出了基于核心概念结构的候选概念评价方法。该方法利用核心概念表征的不同语义范围,对语料进行层次聚类,计算不同层次细粒度的统计特征,对候选概念的领域归属度进行评价,避免语料分布不均匀造成候选概念的归属度差异。试验表明,该方法在一定程度上提升了准确率和召回率,通过不同细粒度的领域相关度和领域一致度统计特征,优化候选概念的抽取和排序,可应用于概念集扩充和概念推荐等场景。 展开更多
关键词 概念抽取 领域相关度 领域-致度 核心概念结构
下载PDF
舆情本体概念抽取研究 被引量:3
8
作者 张学芳 刘胜全 刘艳 《新疆大学学报(自然科学版)》 CAS 北大核心 2016年第3期333-337,共5页
面对舆情信息的动态性、跨领域性、面向主题等特点,目前已有的领域本体学习方法难以适应舆情本体知识的自动构建.本文采用信息爬取技术收集热点舆情文本信息,根据构建模型自动识别主题进行归类,并对识别后的主题文本提取名词性词汇或者... 面对舆情信息的动态性、跨领域性、面向主题等特点,目前已有的领域本体学习方法难以适应舆情本体知识的自动构建.本文采用信息爬取技术收集热点舆情文本信息,根据构建模型自动识别主题进行归类,并对识别后的主题文本提取名词性词汇或者短语作为候选概念集;采用语义相似度方法计算候选概念间的相关度,根据相关度计算各概念的权值,并进行排序;结合词频变化的方法抽取与主题相关的核心概念.实验结果表明,本文方法可有效地抽取与舆情主题相关的核心概念,对舆情本体的构建以及后期的知识共享和重用起到积极作用. 展开更多
关键词 舆情本体 概念抽取 词语相似度 词频统计
下载PDF
基于主题概念抽取的多文档文摘方法 被引量:5
9
作者 宋宣辰 刘贵全 《计算机工程》 CAS CSCD 北大核心 2010年第4期190-192,共3页
提出一种应用于多文档文摘的有效概念抽取方法。利用WordNet中词语的同义和上下义关系进行语义消歧和概念树构造,通过概念优化算法进行主题概念抽取,建立概念向量空间模型并通过最大边缘相关方法得到文摘句。采用语义概念统计来替代传... 提出一种应用于多文档文摘的有效概念抽取方法。利用WordNet中词语的同义和上下义关系进行语义消歧和概念树构造,通过概念优化算法进行主题概念抽取,建立概念向量空间模型并通过最大边缘相关方法得到文摘句。采用语义概念统计来替代传统的词形统计,能更准确地提取文档中的重要信息。DUC2005的评测结果表明,该方法比传统方法能获得更好的效果。 展开更多
关键词 多文档文摘 概念 概念抽取
下载PDF
茶学本体学习中的概念抽取 被引量:2
10
作者 程波波 张友华 +2 位作者 李绍稳 辜丽川 朱利君 《计算机系统应用》 2010年第7期111-114,共4页
提出了一种基于茶学词典和统计算法相结合的茶学知识概念抽取方法。该方法以茶学词典为基础,首先对非结构化数据源进行中文分词处理,然后采用两种统计算法对分词结果进行概念抽取。通过使用丰富的茶学词典来降低统计算法时间复杂度,提... 提出了一种基于茶学词典和统计算法相结合的茶学知识概念抽取方法。该方法以茶学词典为基础,首先对非结构化数据源进行中文分词处理,然后采用两种统计算法对分词结果进行概念抽取。通过使用丰富的茶学词典来降低统计算法时间复杂度,提高了中文分词和概念抽取的精度和效率。实验结果表明,词库的丰富程度决定了概念抽取的效果,可以通过不断丰富词库,进一步提高概念抽取精度。 展开更多
关键词 本体学习 概念抽取 茶学词典 统计算法
下载PDF
基于词向量和条件随机场的煤矿安全事故本体概念抽取 被引量:2
11
作者 刘思含 刘旭红 +1 位作者 刘秀磊 李红臣 《煤炭技术》 CAS 2018年第9期178-181,共4页
煤矿安全事故的"人-机-环-管"信息种类繁多、结构复杂。基于传统条件随机场模型的概念抽取方法只考虑了词语的统计特征,因此效果不够理想。为解决上述问题,提出一种基于词向量和条件随机场模型的概念抽取方法。该方法改进了... 煤矿安全事故的"人-机-环-管"信息种类繁多、结构复杂。基于传统条件随机场模型的概念抽取方法只考虑了词语的统计特征,因此效果不够理想。为解决上述问题,提出一种基于词向量和条件随机场模型的概念抽取方法。该方法改进了词向量模型并综合考虑了统计特征和语义相似性特征。通过对比实验,证明了其具有更好的性能。 展开更多
关键词 煤矿安全事故本体 条件随机场 词向量 语义相似度 概念抽取
下载PDF
基于领域相关性度量的抑郁症药物概念抽取 被引量:1
12
作者 王宁宁 陈建辉 《计算机工程与应用》 CSCD 北大核心 2016年第19期140-145,共6页
开发基于生物医学文献的抑郁症药物本体自动学习技术,对于抑郁症辅助诊疗有着重要的指导意义。概念抽取是面向文本的本体学习的基础。然而,现有的本体概念抽取算法在解决特定、细粒度领域的概念抽取问题时性能较差。借鉴传统的领域相关... 开发基于生物医学文献的抑郁症药物本体自动学习技术,对于抑郁症辅助诊疗有着重要的指导意义。概念抽取是面向文本的本体学习的基础。然而,现有的本体概念抽取算法在解决特定、细粒度领域的概念抽取问题时性能较差。借鉴传统的领域相关性及领域一致性的思想,综合使用对数似然比和领域关联函数进行抑郁症药物领域的概念抽取。实验结果表明,该算法能够降低抑郁症其他相关领域对概念抽取的影响,同时改善低频术语的领域隶属度计算,提高了准召率。 展开更多
关键词 本体学习 概念抽取 抑郁症 对数似然比 领域关联函数
下载PDF
基于双模式的产品指标本体概念抽取 被引量:1
13
作者 时公泽 王浩畅 《信息技术》 2017年第3期26-29,33,共5页
由于人们对产品指标执行情况的关心日益增加,人们需要一种能够清晰描述产品指标的方法,而以本体为基础描述产品指标的方法由于其清晰的领域知识结构能够为统计分析打好基础成为目前研究者研究的主要方向之一。为了减少产品指标本体构建... 由于人们对产品指标执行情况的关心日益增加,人们需要一种能够清晰描述产品指标的方法,而以本体为基础描述产品指标的方法由于其清晰的领域知识结构能够为统计分析打好基础成为目前研究者研究的主要方向之一。为了减少产品指标本体构建对领域专家的依赖度,文中提出了一种双策略结合的产品指标本体概念抽取模式,针对产品指标数据的结构特点,融合两种分类特征重叠范围较小的策略分别对关键词赋予权重并加权排序,之后可由人工挑选或设定阈值确定领域概念。实验证明使用该方法抽取概念相较于单一策略准确性有所提高,且抽取结果是有效的。 展开更多
关键词 本体 产品指标 概念抽取
下载PDF
概念抽取的技术分析
14
作者 杜政康 邓思铭 戴小鹏 《福建电脑》 2020年第1期87-88,共2页
本文重点进行了概念抽取的技术分析,从命名实体识别、候选概念提取、核心概念提取这三个步骤阐述了概念抽取的过程:采用基于语言学或统计学的方法识别出命名实体;采用距离相似度或语义相似度进行聚类划分,得到候选概念;计算候选概念的... 本文重点进行了概念抽取的技术分析,从命名实体识别、候选概念提取、核心概念提取这三个步骤阐述了概念抽取的过程:采用基于语言学或统计学的方法识别出命名实体;采用距离相似度或语义相似度进行聚类划分,得到候选概念;计算候选概念的主题隶属度及权值排序最后得到核心概念。 展开更多
关键词 概念抽取 技术分析 命名实体 候选概念 核心概念
下载PDF
基于模糊贝叶斯决策的核心概念抽取方法
15
作者 钟寒 徐艺嘉 +1 位作者 鹿浩 孙旌睿 《计算机工程与科学》 CSCD 北大核心 2022年第9期1686-1692,共7页
为了提高特定领域核心概念抽取的效率,提出一种基于模糊贝叶斯决策的核心概念抽取方法。在特定领域内随机抽取大量文本并进行分词获取候选概念;然后采用TF-IDF算法计算候选概念的各项特征值,采用概念隶属度归一化处理候选概念特征值;最... 为了提高特定领域核心概念抽取的效率,提出一种基于模糊贝叶斯决策的核心概念抽取方法。在特定领域内随机抽取大量文本并进行分词获取候选概念;然后采用TF-IDF算法计算候选概念的各项特征值,采用概念隶属度归一化处理候选概念特征值;最终通过贝叶斯决策计算候选概念为核心概念的概率。在财经领域相关数据集上进行文本核心概念抽取的实验结果表明,所提方法的F1值相比TextRank、LDA主题模型、word2vec词聚类模型、RNN、LSTM等的F1值有所提高。综合实验结果表明,基于模糊贝叶斯决策的核心概念抽取方法在核心概念抽取方面表现较好。 展开更多
关键词 概念抽取 概念隶属度 贝叶斯决策
下载PDF
中文社会化媒体的本体概念抽取研究 被引量:5
16
作者 唐晓波 胡华 《情报科学》 CSSCI 北大核心 2014年第4期9-15,共7页
本文以信息熵的理论为基础,建立了社会化媒体的本体概念抽取模型,开发了社会化媒体的本体概念抽取原型系统。实验证明该中文社会化媒体概念抽取系统具有较好的准确率和召回率,并在对本体概念的同义词抽取上具有一定的优势。
关键词 概念抽取 词性规则 互信息 左右信息熵
原文传递
中文UGC信息源的本体概念抽取研究 被引量:4
17
作者 唐晓波 胡华 《现代图书情报技术》 CSSCI 北大核心 2014年第5期41-49,共9页
【目的】实现基于UGC信息源的本体概念抽取。【方法】针对UGC信息源特征,提出一种基于语言学的细粒度词抽取组合并应用统计过滤组成概念的本体概念抽取方法,建立基于UGC信息源的概念抽取模型并对原型系统进行验证。【结果】在UGC信息源... 【目的】实现基于UGC信息源的本体概念抽取。【方法】针对UGC信息源特征,提出一种基于语言学的细粒度词抽取组合并应用统计过滤组成概念的本体概念抽取方法,建立基于UGC信息源的概念抽取模型并对原型系统进行验证。【结果】在UGC信息源概念抽取实验中,该方法的结果比其他4组概念抽取方法的表现更为优异,准确率达68.42%,召回率达85.35%。【局限】概念抽取的测试集来自信息质量较高的UGC信息源,部分信息经过人工过滤,语料规模存在不足。【结论】概念抽取方法与技术在实现基于UGC信息源的本体概念抽取中具有一定的意义。 展开更多
关键词 概念抽取 词性规则 中心词 互信息 信息熵
原文传递
基于动态权值的多策略领域本体概念自动抽取 被引量:1
18
作者 张华楠 刘胜全 +2 位作者 刘艳 刘华鹏 李鹏 《计算机工程与应用》 CSCD 2014年第21期152-156,共5页
为了提高中文领域本体概念抽取的自动化程度及准确率,提出了一种基于动态权值的多策略中文领域本体概念自动抽取方法。针对中文领域本体概念的特点,采用自动学习的规则学习模式,筛选出候选概念,将改进的DR&DC、TF-IDF和NC-Value三... 为了提高中文领域本体概念抽取的自动化程度及准确率,提出了一种基于动态权值的多策略中文领域本体概念自动抽取方法。针对中文领域本体概念的特点,采用自动学习的规则学习模式,筛选出候选概念,将改进的DR&DC、TF-IDF和NC-Value三种策略融合,对候选概念进行领域归属度排序,将最终权重超过阈值的概念存入最终概念集合。实验证明了该方法抽取领域概念的可行性和有效性。 展开更多
关键词 动态权值 本体学习 多策略 概念抽取
下载PDF
领域本体概念实例、属性和属性值的抽取及关系预测 被引量:31
19
作者 郭剑毅 李真 +1 位作者 余正涛 张志坤 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期383-389,共7页
研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转... 研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转化为命名实体识别问题,利用条件随机场建模进行命名实体识别;在此基础上定义实体间对应关系,对概念实例、属性及属性值三者的对应关系做预测,把概念实例、属性与属性值三者之间存在关系的向量标记为1,否则标记为0,利用支持向量机建模进行关系的预测.且以云南旅游景点概念实例、属性及属性值进行六组相关的实验.实验表明,在开放测试中协作分类器精确度达到84.4%、召回率达到82.7%及F值达到为83.6%,相比于词语共现F值提高了20个百分点. 展开更多
关键词 领域本体 概念实例抽取 属性抽取 属性值抽取 条件随机场 支持向量机
下载PDF
基于短文本的舆情本体概念的抽取研究
20
作者 查晨 刘胜全 《电脑知识与技术》 2018年第5Z期219-220,共2页
针对现有的本体学习方法难以适应短文本类型新闻媒体资讯由原来的长文本转为短文本的情形。本文提出了一种"基于短文本的舆情本体概念的抽取方法"。短文本语料经过词频统计,其词频呈现数据稀疏现象,经过词频调整后参加后续概... 针对现有的本体学习方法难以适应短文本类型新闻媒体资讯由原来的长文本转为短文本的情形。本文提出了一种"基于短文本的舆情本体概念的抽取方法"。短文本语料经过词频统计,其词频呈现数据稀疏现象,经过词频调整后参加后续概念抽取过程。短文本的描述信息较差。如果采用向量空间模型来表征短文本会造成向量空间的语义缺失和高维稀疏,所以本文使用集合空间来计算文档相似度,抽取与主题相关的核心概念。实验结果理想。 展开更多
关键词 舆情本体 概念抽取 短文本 集合
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部