期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
56
篇文章
<
1
2
3
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于概念抽取的相关词推荐模型
被引量:
2
1
作者
张选平
马琮
+2 位作者
蒋宇
袁明轩
梁平
《微电子学与计算机》
CSCD
北大核心
2006年第5期163-165,169,共4页
搜索引擎已经成为Internet上非常有用的信息检索工具,而查询关键词的质量则是影响搜索效果的最重要的因素之一。相关词推荐技术可以通过向用户提供高质量的查询词,帮助用户缩小查询范围,提高搜索结果的查准率。文章提出一种新的基于概...
搜索引擎已经成为Internet上非常有用的信息检索工具,而查询关键词的质量则是影响搜索效果的最重要的因素之一。相关词推荐技术可以通过向用户提供高质量的查询词,帮助用户缩小查询范围,提高搜索结果的查准率。文章提出一种新的基于概念抽取的相关词推荐模型,该模型克服了传统相关词推荐模型的一些不足,提供精确度更高的相关词作为二次搜索关键词,使信息搜索达到更好的效果。
展开更多
关键词
WEB搜索
概念抽取
相关度
下载PDF
职称材料
基于模式匹配的中文通用本体概念抽取模型
被引量:
5
2
作者
王昊
苏新宁
《情报理论与实践》
CSSCI
北大核心
2008年第2期292-297,291,共7页
本文重点阐述了中文通用本体概念实例的机器抽取过程,建立了基于模式匹配的通用本体概念识别模型,以此作为领域本体自动构建的基础。此后探讨了该模型在情报学各研究领域中的应用前景,并通过实验检验模型在实际应用中的识别效果。
关键词
通用本体
概念抽取
模式匹配
隐马尔可夫模型
下载PDF
职称材料
粗糙形式概念抽取的属性集合幂集方法
被引量:
1
3
作者
王丹
黄映辉
李冠宇
《计算机工程与设计》
CSCD
北大核心
2011年第9期3162-3165,共4页
为了最大限度地抽取出形式背景中的粗糙形式概念,以便为粗糙概念格的构建提供完整的信息源,对粗糙形式概念的抽取进行了研究,提出了粗糙形式概念抽取的属性集合幂集方法。其操作要点为:粗糙形式概念的内涵由属性集合幂集方法所求得的子...
为了最大限度地抽取出形式背景中的粗糙形式概念,以便为粗糙概念格的构建提供完整的信息源,对粗糙形式概念的抽取进行了研究,提出了粗糙形式概念抽取的属性集合幂集方法。其操作要点为:粗糙形式概念的内涵由属性集合幂集方法所求得的子集确定,粗糙形式概念的外延由属性集合幂集所对应对象的上下近似集确定。该方法实现了粗糙形式概念的抽取,保证了从形式背景中抽取出概念的完整性,并能发掘一些隐含的概念,该方法简单快捷,易于计算机实现。
展开更多
关键词
形式背景
粗糙
概念
格
粗糙形式
概念
形式
概念抽取
属性集合幂集
下载PDF
职称材料
基于知网的领域概念抽取与关系分析研究
被引量:
6
4
作者
唐一之
《湘潭大学自然科学学报》
CAS
CSCD
北大核心
2009年第1期135-140,共6页
针对目前领域概念抽取手工完成的现况,提出了一种基于知网的领域概念抽取和关系分析系统模型.本模型利用知网语义相关性从文本中生成领域语义词典,结合TFIDF算法建立"词-文本文档矩阵",用以代替传统的词形频率统计;通过产生...
针对目前领域概念抽取手工完成的现况,提出了一种基于知网的领域概念抽取和关系分析系统模型.本模型利用知网语义相关性从文本中生成领域语义词典,结合TFIDF算法建立"词-文本文档矩阵",用以代替传统的词形频率统计;通过产生领域语义本体,利用语义相似度对概念进行聚类.讨论了这3个步骤所涉及的算法,包括基于统计模式从文本中抽词,基于奇异值分解从词-文档矩阵中提取概念,基于语义相似度对概念进行聚类等.实验表明,本文提出的抽取方法相对与词频算法具有较高的准确度.
展开更多
关键词
知网
HOWNET
概念抽取
语义相似度
下载PDF
职称材料
基于上下文语义的甲骨文领域概念抽取算法的研究
被引量:
1
5
作者
吴琴霞
高峰
刘永革
《科学技术与工程》
北大核心
2014年第26期255-258,共4页
本体构建的重点在于概念的抽取,针对甲骨文卜辞特有的特征和已有的领域概念抽取算法的缺陷,提出了一种基于上下文语义的甲骨文领域概念抽取算法。该算法针对传统的基于DR+DC的概念抽取算法的缺点进行改进,提出了基于上下文的概念间的相...
本体构建的重点在于概念的抽取,针对甲骨文卜辞特有的特征和已有的领域概念抽取算法的缺陷,提出了一种基于上下文语义的甲骨文领域概念抽取算法。该算法针对传统的基于DR+DC的概念抽取算法的缺点进行改进,提出了基于上下文的概念间的相似度的计算方法,并给出了基于语义的领域概念筛选算法。实验数据表明,该方法在准确率和召回率以及困惑度衰减比率都有较大的提高。
展开更多
关键词
语义
概念抽取
领域相关度
领域一致度
困惑度衰减比
下载PDF
职称材料
一种基于概念抽取的元搜索引擎
6
作者
张选平
袁明轩
+2 位作者
蒋宇
马琮
梁平
《微电子学与计算机》
CSCD
北大核心
2006年第3期156-159,共4页
文章在概念抽取算法基础上,提出一种基于概念的元搜索引擎体系结构。这种体系结构提供统一的用户界面,通过查询适配可以同时使用多个独立搜索引擎的高级搜索功能。并且通过概念抽取对搜索结果进一步分析,使其更为准确和详细。系统提供...
文章在概念抽取算法基础上,提出一种基于概念的元搜索引擎体系结构。这种体系结构提供统一的用户界面,通过查询适配可以同时使用多个独立搜索引擎的高级搜索功能。并且通过概念抽取对搜索结果进一步分析,使其更为准确和详细。系统提供了概念图这种独特的结果显示方式,引导用户细化搜索范围以得到更为精确的结果。
展开更多
关键词
元搜索引擎
概念抽取
相关度排序
下载PDF
职称材料
军事领域中概念抽取及其应用
7
作者
郑玄
蒋锴
+1 位作者
钱夔
徐俊瑜
《指挥信息系统与技术》
2016年第4期72-76,共5页
在军事领域的概念抽取中,以军事领域核心概念作为种子概念扩充了领域概念,并提出了基于核心概念结构的候选概念评价方法。该方法利用核心概念表征的不同语义范围,对语料进行层次聚类,计算不同层次细粒度的统计特征,对候选概念的领域归...
在军事领域的概念抽取中,以军事领域核心概念作为种子概念扩充了领域概念,并提出了基于核心概念结构的候选概念评价方法。该方法利用核心概念表征的不同语义范围,对语料进行层次聚类,计算不同层次细粒度的统计特征,对候选概念的领域归属度进行评价,避免语料分布不均匀造成候选概念的归属度差异。试验表明,该方法在一定程度上提升了准确率和召回率,通过不同细粒度的领域相关度和领域一致度统计特征,优化候选概念的抽取和排序,可应用于概念集扩充和概念推荐等场景。
展开更多
关键词
概念抽取
领域相关度
领域-致度
核心
概念
结构
下载PDF
职称材料
舆情本体概念抽取研究
被引量:
3
8
作者
张学芳
刘胜全
刘艳
《新疆大学学报(自然科学版)》
CAS
北大核心
2016年第3期333-337,共5页
面对舆情信息的动态性、跨领域性、面向主题等特点,目前已有的领域本体学习方法难以适应舆情本体知识的自动构建.本文采用信息爬取技术收集热点舆情文本信息,根据构建模型自动识别主题进行归类,并对识别后的主题文本提取名词性词汇或者...
面对舆情信息的动态性、跨领域性、面向主题等特点,目前已有的领域本体学习方法难以适应舆情本体知识的自动构建.本文采用信息爬取技术收集热点舆情文本信息,根据构建模型自动识别主题进行归类,并对识别后的主题文本提取名词性词汇或者短语作为候选概念集;采用语义相似度方法计算候选概念间的相关度,根据相关度计算各概念的权值,并进行排序;结合词频变化的方法抽取与主题相关的核心概念.实验结果表明,本文方法可有效地抽取与舆情主题相关的核心概念,对舆情本体的构建以及后期的知识共享和重用起到积极作用.
展开更多
关键词
舆情本体
概念抽取
词语相似度
词频统计
下载PDF
职称材料
基于主题概念抽取的多文档文摘方法
被引量:
5
9
作者
宋宣辰
刘贵全
《计算机工程》
CAS
CSCD
北大核心
2010年第4期190-192,共3页
提出一种应用于多文档文摘的有效概念抽取方法。利用WordNet中词语的同义和上下义关系进行语义消歧和概念树构造,通过概念优化算法进行主题概念抽取,建立概念向量空间模型并通过最大边缘相关方法得到文摘句。采用语义概念统计来替代传...
提出一种应用于多文档文摘的有效概念抽取方法。利用WordNet中词语的同义和上下义关系进行语义消歧和概念树构造,通过概念优化算法进行主题概念抽取,建立概念向量空间模型并通过最大边缘相关方法得到文摘句。采用语义概念统计来替代传统的词形统计,能更准确地提取文档中的重要信息。DUC2005的评测结果表明,该方法比传统方法能获得更好的效果。
展开更多
关键词
多文档文摘
概念
树
概念抽取
下载PDF
职称材料
茶学本体学习中的概念抽取
被引量:
2
10
作者
程波波
张友华
+2 位作者
李绍稳
辜丽川
朱利君
《计算机系统应用》
2010年第7期111-114,共4页
提出了一种基于茶学词典和统计算法相结合的茶学知识概念抽取方法。该方法以茶学词典为基础,首先对非结构化数据源进行中文分词处理,然后采用两种统计算法对分词结果进行概念抽取。通过使用丰富的茶学词典来降低统计算法时间复杂度,提...
提出了一种基于茶学词典和统计算法相结合的茶学知识概念抽取方法。该方法以茶学词典为基础,首先对非结构化数据源进行中文分词处理,然后采用两种统计算法对分词结果进行概念抽取。通过使用丰富的茶学词典来降低统计算法时间复杂度,提高了中文分词和概念抽取的精度和效率。实验结果表明,词库的丰富程度决定了概念抽取的效果,可以通过不断丰富词库,进一步提高概念抽取精度。
展开更多
关键词
本体学习
概念抽取
茶学词典
统计算法
下载PDF
职称材料
基于词向量和条件随机场的煤矿安全事故本体概念抽取
被引量:
2
11
作者
刘思含
刘旭红
+1 位作者
刘秀磊
李红臣
《煤炭技术》
CAS
2018年第9期178-181,共4页
煤矿安全事故的"人-机-环-管"信息种类繁多、结构复杂。基于传统条件随机场模型的概念抽取方法只考虑了词语的统计特征,因此效果不够理想。为解决上述问题,提出一种基于词向量和条件随机场模型的概念抽取方法。该方法改进了...
煤矿安全事故的"人-机-环-管"信息种类繁多、结构复杂。基于传统条件随机场模型的概念抽取方法只考虑了词语的统计特征,因此效果不够理想。为解决上述问题,提出一种基于词向量和条件随机场模型的概念抽取方法。该方法改进了词向量模型并综合考虑了统计特征和语义相似性特征。通过对比实验,证明了其具有更好的性能。
展开更多
关键词
煤矿安全事故本体
条件随机场
词向量
语义相似度
概念抽取
下载PDF
职称材料
基于领域相关性度量的抑郁症药物概念抽取
被引量:
1
12
作者
王宁宁
陈建辉
《计算机工程与应用》
CSCD
北大核心
2016年第19期140-145,共6页
开发基于生物医学文献的抑郁症药物本体自动学习技术,对于抑郁症辅助诊疗有着重要的指导意义。概念抽取是面向文本的本体学习的基础。然而,现有的本体概念抽取算法在解决特定、细粒度领域的概念抽取问题时性能较差。借鉴传统的领域相关...
开发基于生物医学文献的抑郁症药物本体自动学习技术,对于抑郁症辅助诊疗有着重要的指导意义。概念抽取是面向文本的本体学习的基础。然而,现有的本体概念抽取算法在解决特定、细粒度领域的概念抽取问题时性能较差。借鉴传统的领域相关性及领域一致性的思想,综合使用对数似然比和领域关联函数进行抑郁症药物领域的概念抽取。实验结果表明,该算法能够降低抑郁症其他相关领域对概念抽取的影响,同时改善低频术语的领域隶属度计算,提高了准召率。
展开更多
关键词
本体学习
概念抽取
抑郁症
对数似然比
领域关联函数
下载PDF
职称材料
基于双模式的产品指标本体概念抽取
被引量:
1
13
作者
时公泽
王浩畅
《信息技术》
2017年第3期26-29,33,共5页
由于人们对产品指标执行情况的关心日益增加,人们需要一种能够清晰描述产品指标的方法,而以本体为基础描述产品指标的方法由于其清晰的领域知识结构能够为统计分析打好基础成为目前研究者研究的主要方向之一。为了减少产品指标本体构建...
由于人们对产品指标执行情况的关心日益增加,人们需要一种能够清晰描述产品指标的方法,而以本体为基础描述产品指标的方法由于其清晰的领域知识结构能够为统计分析打好基础成为目前研究者研究的主要方向之一。为了减少产品指标本体构建对领域专家的依赖度,文中提出了一种双策略结合的产品指标本体概念抽取模式,针对产品指标数据的结构特点,融合两种分类特征重叠范围较小的策略分别对关键词赋予权重并加权排序,之后可由人工挑选或设定阈值确定领域概念。实验证明使用该方法抽取概念相较于单一策略准确性有所提高,且抽取结果是有效的。
展开更多
关键词
本体
产品指标
概念抽取
下载PDF
职称材料
概念抽取的技术分析
14
作者
杜政康
邓思铭
戴小鹏
《福建电脑》
2020年第1期87-88,共2页
本文重点进行了概念抽取的技术分析,从命名实体识别、候选概念提取、核心概念提取这三个步骤阐述了概念抽取的过程:采用基于语言学或统计学的方法识别出命名实体;采用距离相似度或语义相似度进行聚类划分,得到候选概念;计算候选概念的...
本文重点进行了概念抽取的技术分析,从命名实体识别、候选概念提取、核心概念提取这三个步骤阐述了概念抽取的过程:采用基于语言学或统计学的方法识别出命名实体;采用距离相似度或语义相似度进行聚类划分,得到候选概念;计算候选概念的主题隶属度及权值排序最后得到核心概念。
展开更多
关键词
概念抽取
技术分析
命名实体
候选
概念
核心
概念
下载PDF
职称材料
基于模糊贝叶斯决策的核心概念抽取方法
15
作者
钟寒
徐艺嘉
+1 位作者
鹿浩
孙旌睿
《计算机工程与科学》
CSCD
北大核心
2022年第9期1686-1692,共7页
为了提高特定领域核心概念抽取的效率,提出一种基于模糊贝叶斯决策的核心概念抽取方法。在特定领域内随机抽取大量文本并进行分词获取候选概念;然后采用TF-IDF算法计算候选概念的各项特征值,采用概念隶属度归一化处理候选概念特征值;最...
为了提高特定领域核心概念抽取的效率,提出一种基于模糊贝叶斯决策的核心概念抽取方法。在特定领域内随机抽取大量文本并进行分词获取候选概念;然后采用TF-IDF算法计算候选概念的各项特征值,采用概念隶属度归一化处理候选概念特征值;最终通过贝叶斯决策计算候选概念为核心概念的概率。在财经领域相关数据集上进行文本核心概念抽取的实验结果表明,所提方法的F1值相比TextRank、LDA主题模型、word2vec词聚类模型、RNN、LSTM等的F1值有所提高。综合实验结果表明,基于模糊贝叶斯决策的核心概念抽取方法在核心概念抽取方面表现较好。
展开更多
关键词
概念抽取
概念
隶属度
贝叶斯决策
下载PDF
职称材料
中文社会化媒体的本体概念抽取研究
被引量:
5
16
作者
唐晓波
胡华
《情报科学》
CSSCI
北大核心
2014年第4期9-15,共7页
本文以信息熵的理论为基础,建立了社会化媒体的本体概念抽取模型,开发了社会化媒体的本体概念抽取原型系统。实验证明该中文社会化媒体概念抽取系统具有较好的准确率和召回率,并在对本体概念的同义词抽取上具有一定的优势。
关键词
概念抽取
词性规则
互信息
左右信息熵
原文传递
中文UGC信息源的本体概念抽取研究
被引量:
4
17
作者
唐晓波
胡华
《现代图书情报技术》
CSSCI
北大核心
2014年第5期41-49,共9页
【目的】实现基于UGC信息源的本体概念抽取。【方法】针对UGC信息源特征,提出一种基于语言学的细粒度词抽取组合并应用统计过滤组成概念的本体概念抽取方法,建立基于UGC信息源的概念抽取模型并对原型系统进行验证。【结果】在UGC信息源...
【目的】实现基于UGC信息源的本体概念抽取。【方法】针对UGC信息源特征,提出一种基于语言学的细粒度词抽取组合并应用统计过滤组成概念的本体概念抽取方法,建立基于UGC信息源的概念抽取模型并对原型系统进行验证。【结果】在UGC信息源概念抽取实验中,该方法的结果比其他4组概念抽取方法的表现更为优异,准确率达68.42%,召回率达85.35%。【局限】概念抽取的测试集来自信息质量较高的UGC信息源,部分信息经过人工过滤,语料规模存在不足。【结论】概念抽取方法与技术在实现基于UGC信息源的本体概念抽取中具有一定的意义。
展开更多
关键词
概念抽取
词性规则
中心词
互信息
信息熵
原文传递
基于动态权值的多策略领域本体概念自动抽取
被引量:
1
18
作者
张华楠
刘胜全
+2 位作者
刘艳
刘华鹏
李鹏
《计算机工程与应用》
CSCD
2014年第21期152-156,共5页
为了提高中文领域本体概念抽取的自动化程度及准确率,提出了一种基于动态权值的多策略中文领域本体概念自动抽取方法。针对中文领域本体概念的特点,采用自动学习的规则学习模式,筛选出候选概念,将改进的DR&DC、TF-IDF和NC-Value三...
为了提高中文领域本体概念抽取的自动化程度及准确率,提出了一种基于动态权值的多策略中文领域本体概念自动抽取方法。针对中文领域本体概念的特点,采用自动学习的规则学习模式,筛选出候选概念,将改进的DR&DC、TF-IDF和NC-Value三种策略融合,对候选概念进行领域归属度排序,将最终权重超过阈值的概念存入最终概念集合。实验证明了该方法抽取领域概念的可行性和有效性。
展开更多
关键词
动态权值
本体学习
多策略
概念抽取
下载PDF
职称材料
领域本体概念实例、属性和属性值的抽取及关系预测
被引量:
31
19
作者
郭剑毅
李真
+1 位作者
余正涛
张志坤
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2012年第4期383-389,共7页
研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转...
研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转化为命名实体识别问题,利用条件随机场建模进行命名实体识别;在此基础上定义实体间对应关系,对概念实例、属性及属性值三者的对应关系做预测,把概念实例、属性与属性值三者之间存在关系的向量标记为1,否则标记为0,利用支持向量机建模进行关系的预测.且以云南旅游景点概念实例、属性及属性值进行六组相关的实验.实验表明,在开放测试中协作分类器精确度达到84.4%、召回率达到82.7%及F值达到为83.6%,相比于词语共现F值提高了20个百分点.
展开更多
关键词
领域本体
概念
实例
抽取
属性
抽取
属性值
抽取
条件随机场
支持向量机
下载PDF
职称材料
基于短文本的舆情本体概念的抽取研究
20
作者
查晨
刘胜全
《电脑知识与技术》
2018年第5Z期219-220,共2页
针对现有的本体学习方法难以适应短文本类型新闻媒体资讯由原来的长文本转为短文本的情形。本文提出了一种"基于短文本的舆情本体概念的抽取方法"。短文本语料经过词频统计,其词频呈现数据稀疏现象,经过词频调整后参加后续概...
针对现有的本体学习方法难以适应短文本类型新闻媒体资讯由原来的长文本转为短文本的情形。本文提出了一种"基于短文本的舆情本体概念的抽取方法"。短文本语料经过词频统计,其词频呈现数据稀疏现象,经过词频调整后参加后续概念抽取过程。短文本的描述信息较差。如果采用向量空间模型来表征短文本会造成向量空间的语义缺失和高维稀疏,所以本文使用集合空间来计算文档相似度,抽取与主题相关的核心概念。实验结果理想。
展开更多
关键词
舆情本体
概念抽取
短文本
集合
下载PDF
职称材料
题名
一种基于概念抽取的相关词推荐模型
被引量:
2
1
作者
张选平
马琮
蒋宇
袁明轩
梁平
机构
西安交通大学软件与理论研究所
出处
《微电子学与计算机》
CSCD
北大核心
2006年第5期163-165,169,共4页
基金
到美国DIGGOL公司和西安迪戈公司的资助
文摘
搜索引擎已经成为Internet上非常有用的信息检索工具,而查询关键词的质量则是影响搜索效果的最重要的因素之一。相关词推荐技术可以通过向用户提供高质量的查询词,帮助用户缩小查询范围,提高搜索结果的查准率。文章提出一种新的基于概念抽取的相关词推荐模型,该模型克服了传统相关词推荐模型的一些不足,提供精确度更高的相关词作为二次搜索关键词,使信息搜索达到更好的效果。
关键词
WEB搜索
概念抽取
相关度
Keywords
Web searching, Concept extraction, Similarity
分类号
TP391.11 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于模式匹配的中文通用本体概念抽取模型
被引量:
5
2
作者
王昊
苏新宁
机构
南京大学信息管理系
出处
《情报理论与实践》
CSSCI
北大核心
2008年第2期292-297,291,共7页
文摘
本文重点阐述了中文通用本体概念实例的机器抽取过程,建立了基于模式匹配的通用本体概念识别模型,以此作为领域本体自动构建的基础。此后探讨了该模型在情报学各研究领域中的应用前景,并通过实验检验模型在实际应用中的识别效果。
关键词
通用本体
概念抽取
模式匹配
隐马尔可夫模型
Keywords
general ontology
concept extraction
pattern matching
hidden Markov model
分类号
G350 [文化科学—情报学]
下载PDF
职称材料
题名
粗糙形式概念抽取的属性集合幂集方法
被引量:
1
3
作者
王丹
黄映辉
李冠宇
机构
大连海事大学信息科学技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2011年第9期3162-3165,共4页
基金
国家自然科学基金项目(60972090)
文摘
为了最大限度地抽取出形式背景中的粗糙形式概念,以便为粗糙概念格的构建提供完整的信息源,对粗糙形式概念的抽取进行了研究,提出了粗糙形式概念抽取的属性集合幂集方法。其操作要点为:粗糙形式概念的内涵由属性集合幂集方法所求得的子集确定,粗糙形式概念的外延由属性集合幂集所对应对象的上下近似集确定。该方法实现了粗糙形式概念的抽取,保证了从形式背景中抽取出概念的完整性,并能发掘一些隐含的概念,该方法简单快捷,易于计算机实现。
关键词
形式背景
粗糙
概念
格
粗糙形式
概念
形式
概念抽取
属性集合幂集
Keywords
formal context
rough concept lattice
rough formal concept
formal concept extracting
attribute sets power set
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于知网的领域概念抽取与关系分析研究
被引量:
6
4
作者
唐一之
机构
北京交通大学交通运输学院
出处
《湘潭大学自然科学学报》
CAS
CSCD
北大核心
2009年第1期135-140,共6页
文摘
针对目前领域概念抽取手工完成的现况,提出了一种基于知网的领域概念抽取和关系分析系统模型.本模型利用知网语义相关性从文本中生成领域语义词典,结合TFIDF算法建立"词-文本文档矩阵",用以代替传统的词形频率统计;通过产生领域语义本体,利用语义相似度对概念进行聚类.讨论了这3个步骤所涉及的算法,包括基于统计模式从文本中抽词,基于奇异值分解从词-文档矩阵中提取概念,基于语义相似度对概念进行聚类等.实验表明,本文提出的抽取方法相对与词频算法具有较高的准确度.
关键词
知网
HOWNET
概念抽取
语义相似度
Keywords
conceptual option
conceptual relation
HowNet
分类号
TN911 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于上下文语义的甲骨文领域概念抽取算法的研究
被引量:
1
5
作者
吴琴霞
高峰
刘永革
机构
安阳师范学院计算机与信息工程学院
河南省甲骨文信息处理实验室
出处
《科学技术与工程》
北大核心
2014年第26期255-258,共4页
基金
国家自然科学基金资助项目(60875081)
河南省科技厅重点攻关项目(132102210115)资助
文摘
本体构建的重点在于概念的抽取,针对甲骨文卜辞特有的特征和已有的领域概念抽取算法的缺陷,提出了一种基于上下文语义的甲骨文领域概念抽取算法。该算法针对传统的基于DR+DC的概念抽取算法的缺点进行改进,提出了基于上下文的概念间的相似度的计算方法,并给出了基于语义的领域概念筛选算法。实验数据表明,该方法在准确率和召回率以及困惑度衰减比率都有较大的提高。
关键词
语义
概念抽取
领域相关度
领域一致度
困惑度衰减比
Keywords
semantic
concept extraction
domain relevancy
domain consensus perplexity atten-uation ration
分类号
TP302.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种基于概念抽取的元搜索引擎
6
作者
张选平
袁明轩
蒋宇
马琮
梁平
机构
西安交通大学软件与理论研究所
出处
《微电子学与计算机》
CSCD
北大核心
2006年第3期156-159,共4页
文摘
文章在概念抽取算法基础上,提出一种基于概念的元搜索引擎体系结构。这种体系结构提供统一的用户界面,通过查询适配可以同时使用多个独立搜索引擎的高级搜索功能。并且通过概念抽取对搜索结果进一步分析,使其更为准确和详细。系统提供了概念图这种独特的结果显示方式,引导用户细化搜索范围以得到更为精确的结果。
关键词
元搜索引擎
概念抽取
相关度排序
Keywords
Meta search engine, Concepts extraction, Relevancy ranking
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
军事领域中概念抽取及其应用
7
作者
郑玄
蒋锴
钱夔
徐俊瑜
机构
中国电子科技集团公司第二十八研究所
出处
《指挥信息系统与技术》
2016年第4期72-76,共5页
文摘
在军事领域的概念抽取中,以军事领域核心概念作为种子概念扩充了领域概念,并提出了基于核心概念结构的候选概念评价方法。该方法利用核心概念表征的不同语义范围,对语料进行层次聚类,计算不同层次细粒度的统计特征,对候选概念的领域归属度进行评价,避免语料分布不均匀造成候选概念的归属度差异。试验表明,该方法在一定程度上提升了准确率和召回率,通过不同细粒度的领域相关度和领域一致度统计特征,优化候选概念的抽取和排序,可应用于概念集扩充和概念推荐等场景。
关键词
概念抽取
领域相关度
领域-致度
核心
概念
结构
Keywords
concept extraction
domain relevancy
domain consistency
core concept structure
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
舆情本体概念抽取研究
被引量:
3
8
作者
张学芳
刘胜全
刘艳
机构
新疆大学软件学院
出处
《新疆大学学报(自然科学版)》
CAS
北大核心
2016年第3期333-337,共5页
基金
新疆维吾尔自治区科学基金项目(2014211A016)
文摘
面对舆情信息的动态性、跨领域性、面向主题等特点,目前已有的领域本体学习方法难以适应舆情本体知识的自动构建.本文采用信息爬取技术收集热点舆情文本信息,根据构建模型自动识别主题进行归类,并对识别后的主题文本提取名词性词汇或者短语作为候选概念集;采用语义相似度方法计算候选概念间的相关度,根据相关度计算各概念的权值,并进行排序;结合词频变化的方法抽取与主题相关的核心概念.实验结果表明,本文方法可有效地抽取与舆情主题相关的核心概念,对舆情本体的构建以及后期的知识共享和重用起到积极作用.
关键词
舆情本体
概念抽取
词语相似度
词频统计
Keywords
public opinion ontology
concept extraction
word similarity
word frequency statistics
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于主题概念抽取的多文档文摘方法
被引量:
5
9
作者
宋宣辰
刘贵全
机构
中国科学技术大学计算机科学与技术系
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第4期190-192,共3页
基金
国家自然科学基金资助项目(60775037)
文摘
提出一种应用于多文档文摘的有效概念抽取方法。利用WordNet中词语的同义和上下义关系进行语义消歧和概念树构造,通过概念优化算法进行主题概念抽取,建立概念向量空间模型并通过最大边缘相关方法得到文摘句。采用语义概念统计来替代传统的词形统计,能更准确地提取文档中的重要信息。DUC2005的评测结果表明,该方法比传统方法能获得更好的效果。
关键词
多文档文摘
概念
树
概念抽取
Keywords
multi-document summarization
concept-trees
concept extract
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
茶学本体学习中的概念抽取
被引量:
2
10
作者
程波波
张友华
李绍稳
辜丽川
朱利君
机构
安徽农业大学信息与计算机学院
出处
《计算机系统应用》
2010年第7期111-114,共4页
基金
国家高技术研究发展计划(863)(2006AA10Z249)
国家自然科学基金(30800663
30971691)
文摘
提出了一种基于茶学词典和统计算法相结合的茶学知识概念抽取方法。该方法以茶学词典为基础,首先对非结构化数据源进行中文分词处理,然后采用两种统计算法对分词结果进行概念抽取。通过使用丰富的茶学词典来降低统计算法时间复杂度,提高了中文分词和概念抽取的精度和效率。实验结果表明,词库的丰富程度决定了概念抽取的效果,可以通过不断丰富词库,进一步提高概念抽取精度。
关键词
本体学习
概念抽取
茶学词典
统计算法
Keywords
ontology learning
concept abstract
tea dictionary
statistics
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于词向量和条件随机场的煤矿安全事故本体概念抽取
被引量:
2
11
作者
刘思含
刘旭红
刘秀磊
李红臣
机构
北京信息科技大学计算机学院
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学数据科学与情报分析实验室
国家安全生产监督管理总局通信信息中心
出处
《煤炭技术》
CAS
2018年第9期178-181,共4页
基金
国家重点研发计划资助(2016YFC0801407)
国家自然科学基金资助(61601039)
+4 种基金
北京信息科技大学科研基金资助(1625008)
网络文化与数字传播北京市重点实验室开放课题资助(ICDDXN006)
网络与交换技术国家重点实验室(北京邮电大学)开放课题资助(SKLNST-2016-2-08)
北京信息科技大学软件工程专业学位点建设项目资助(5121723402)
北京市教育委员会科技计划面上项目(KM201811232018)
文摘
煤矿安全事故的"人-机-环-管"信息种类繁多、结构复杂。基于传统条件随机场模型的概念抽取方法只考虑了词语的统计特征,因此效果不够理想。为解决上述问题,提出一种基于词向量和条件随机场模型的概念抽取方法。该方法改进了词向量模型并综合考虑了统计特征和语义相似性特征。通过对比实验,证明了其具有更好的性能。
关键词
煤矿安全事故本体
条件随机场
词向量
语义相似度
概念抽取
Keywords
coal mine safety accident ontology
CRFs
word embedding
semantic similarity
concept extraction
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于领域相关性度量的抑郁症药物概念抽取
被引量:
1
12
作者
王宁宁
陈建辉
机构
北京工业大学电子信息与控制工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2016年第19期140-145,共6页
基金
国家重点基础研究发展规划项目(973)(No.2014CB744600)
国家自然科学基金(No.61272345)
文摘
开发基于生物医学文献的抑郁症药物本体自动学习技术,对于抑郁症辅助诊疗有着重要的指导意义。概念抽取是面向文本的本体学习的基础。然而,现有的本体概念抽取算法在解决特定、细粒度领域的概念抽取问题时性能较差。借鉴传统的领域相关性及领域一致性的思想,综合使用对数似然比和领域关联函数进行抑郁症药物领域的概念抽取。实验结果表明,该算法能够降低抑郁症其他相关领域对概念抽取的影响,同时改善低频术语的领域隶属度计算,提高了准召率。
关键词
本体学习
概念抽取
抑郁症
对数似然比
领域关联函数
Keywords
ontology learning
concepts extraction
depression
log-likelihood ratio
domain correlation function
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于双模式的产品指标本体概念抽取
被引量:
1
13
作者
时公泽
王浩畅
机构
东北石油大学计算机与信息技术学院
出处
《信息技术》
2017年第3期26-29,33,共5页
基金
国家自然科学基金(61402099)
文摘
由于人们对产品指标执行情况的关心日益增加,人们需要一种能够清晰描述产品指标的方法,而以本体为基础描述产品指标的方法由于其清晰的领域知识结构能够为统计分析打好基础成为目前研究者研究的主要方向之一。为了减少产品指标本体构建对领域专家的依赖度,文中提出了一种双策略结合的产品指标本体概念抽取模式,针对产品指标数据的结构特点,融合两种分类特征重叠范围较小的策略分别对关键词赋予权重并加权排序,之后可由人工挑选或设定阈值确定领域概念。实验证明使用该方法抽取概念相较于单一策略准确性有所提高,且抽取结果是有效的。
关键词
本体
产品指标
概念抽取
Keywords
ontology
product indicators
concept extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
概念抽取的技术分析
14
作者
杜政康
邓思铭
戴小鹏
机构
湖南农业大学信息与智能科学技术学院
出处
《福建电脑》
2020年第1期87-88,共2页
基金
湖南省教育厅科研项目(No.17A092)资助
文摘
本文重点进行了概念抽取的技术分析,从命名实体识别、候选概念提取、核心概念提取这三个步骤阐述了概念抽取的过程:采用基于语言学或统计学的方法识别出命名实体;采用距离相似度或语义相似度进行聚类划分,得到候选概念;计算候选概念的主题隶属度及权值排序最后得到核心概念。
关键词
概念抽取
技术分析
命名实体
候选
概念
核心
概念
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于模糊贝叶斯决策的核心概念抽取方法
15
作者
钟寒
徐艺嘉
鹿浩
孙旌睿
机构
中国人民公安大学信息网络安全学院
安全防范与风险评估公安部重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2022年第9期1686-1692,共7页
基金
国家社会科学基金(20AZD114)
公安部科技强警基础工作专项(2019GABJC01)
+1 种基金
公安部软科学理论研究计划(2021LL39)
中央高校基本科研业务费项目(2021JKF107)。
文摘
为了提高特定领域核心概念抽取的效率,提出一种基于模糊贝叶斯决策的核心概念抽取方法。在特定领域内随机抽取大量文本并进行分词获取候选概念;然后采用TF-IDF算法计算候选概念的各项特征值,采用概念隶属度归一化处理候选概念特征值;最终通过贝叶斯决策计算候选概念为核心概念的概率。在财经领域相关数据集上进行文本核心概念抽取的实验结果表明,所提方法的F1值相比TextRank、LDA主题模型、word2vec词聚类模型、RNN、LSTM等的F1值有所提高。综合实验结果表明,基于模糊贝叶斯决策的核心概念抽取方法在核心概念抽取方面表现较好。
关键词
概念抽取
概念
隶属度
贝叶斯决策
Keywords
concept extraction
conceptual membership
Bayesian decision-making
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文社会化媒体的本体概念抽取研究
被引量:
5
16
作者
唐晓波
胡华
机构
武汉大学信息管理学院
出处
《情报科学》
CSSCI
北大核心
2014年第4期9-15,共7页
基金
国家自然科学基金项目(71273194)
文摘
本文以信息熵的理论为基础,建立了社会化媒体的本体概念抽取模型,开发了社会化媒体的本体概念抽取原型系统。实验证明该中文社会化媒体概念抽取系统具有较好的准确率和召回率,并在对本体概念的同义词抽取上具有一定的优势。
关键词
概念抽取
词性规则
互信息
左右信息熵
Keywords
concept extraction
speech rules
mutual information
left and right information entropy
分类号
G254 [文化科学—图书馆学]
原文传递
题名
中文UGC信息源的本体概念抽取研究
被引量:
4
17
作者
唐晓波
胡华
机构
武汉大学信息管理学院
出处
《现代图书情报技术》
CSSCI
北大核心
2014年第5期41-49,共9页
基金
国家自然科学基金项目"社会化媒体集成检索与语义分析方法研究"(项目编号:71273194)的研究成果之一
文摘
【目的】实现基于UGC信息源的本体概念抽取。【方法】针对UGC信息源特征,提出一种基于语言学的细粒度词抽取组合并应用统计过滤组成概念的本体概念抽取方法,建立基于UGC信息源的概念抽取模型并对原型系统进行验证。【结果】在UGC信息源概念抽取实验中,该方法的结果比其他4组概念抽取方法的表现更为优异,准确率达68.42%,召回率达85.35%。【局限】概念抽取的测试集来自信息质量较高的UGC信息源,部分信息经过人工过滤,语料规模存在不足。【结论】概念抽取方法与技术在实现基于UGC信息源的本体概念抽取中具有一定的意义。
关键词
概念抽取
词性规则
中心词
互信息
信息熵
Keywords
Concept extraction Speech rules Seed word Mutual information Information entropy
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于动态权值的多策略领域本体概念自动抽取
被引量:
1
18
作者
张华楠
刘胜全
刘艳
刘华鹏
李鹏
机构
新疆大学信息科学与工程学院
新疆大学现代教育技术中心
出处
《计算机工程与应用》
CSCD
2014年第21期152-156,共5页
基金
新疆维吾尔自治区科技攻关项目(No.200931103)
新疆大学自然科学基金(No.XY110121)
文摘
为了提高中文领域本体概念抽取的自动化程度及准确率,提出了一种基于动态权值的多策略中文领域本体概念自动抽取方法。针对中文领域本体概念的特点,采用自动学习的规则学习模式,筛选出候选概念,将改进的DR&DC、TF-IDF和NC-Value三种策略融合,对候选概念进行领域归属度排序,将最终权重超过阈值的概念存入最终概念集合。实验证明了该方法抽取领域概念的可行性和有效性。
关键词
动态权值
本体学习
多策略
概念抽取
Keywords
dynamic weight
ontology learning
multi-strategy
concept extraction
分类号
TP182 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
领域本体概念实例、属性和属性值的抽取及关系预测
被引量:
31
19
作者
郭剑毅
李真
余正涛
张志坤
机构
昆明理工大学信息工程与自动化学院
昆明理工大学智能信息处理重点实验室
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2012年第4期383-389,共7页
基金
国家自然科学基金(60863011)
云南省自然科学基金(2008CC023)
+1 种基金
云南省中青年学术技术带头人后备人才项目(2007PY01-11)
云南省教育厅基金(07Z11139)
文摘
研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转化为命名实体识别问题,利用条件随机场建模进行命名实体识别;在此基础上定义实体间对应关系,对概念实例、属性及属性值三者的对应关系做预测,把概念实例、属性与属性值三者之间存在关系的向量标记为1,否则标记为0,利用支持向量机建模进行关系的预测.且以云南旅游景点概念实例、属性及属性值进行六组相关的实验.实验表明,在开放测试中协作分类器精确度达到84.4%、召回率达到82.7%及F值达到为83.6%,相比于词语共现F值提高了20个百分点.
关键词
领域本体
概念
实例
抽取
属性
抽取
属性值
抽取
条件随机场
支持向量机
Keywords
domain ontology, concept instance extraction, attribute extraction, attribute values extraction,conditional random fields, support vector machine.
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于短文本的舆情本体概念的抽取研究
20
作者
查晨
刘胜全
机构
新疆大学信息科学与工程学院
出处
《电脑知识与技术》
2018年第5Z期219-220,共2页
基金
新疆维吾尔自治区科学基金项目(编号:2014211A016)
文摘
针对现有的本体学习方法难以适应短文本类型新闻媒体资讯由原来的长文本转为短文本的情形。本文提出了一种"基于短文本的舆情本体概念的抽取方法"。短文本语料经过词频统计,其词频呈现数据稀疏现象,经过词频调整后参加后续概念抽取过程。短文本的描述信息较差。如果采用向量空间模型来表征短文本会造成向量空间的语义缺失和高维稀疏,所以本文使用集合空间来计算文档相似度,抽取与主题相关的核心概念。实验结果理想。
关键词
舆情本体
概念抽取
短文本
集合
Keywords
public opinion ontology
concept extraction
short text
gather
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于概念抽取的相关词推荐模型
张选平
马琮
蒋宇
袁明轩
梁平
《微电子学与计算机》
CSCD
北大核心
2006
2
下载PDF
职称材料
2
基于模式匹配的中文通用本体概念抽取模型
王昊
苏新宁
《情报理论与实践》
CSSCI
北大核心
2008
5
下载PDF
职称材料
3
粗糙形式概念抽取的属性集合幂集方法
王丹
黄映辉
李冠宇
《计算机工程与设计》
CSCD
北大核心
2011
1
下载PDF
职称材料
4
基于知网的领域概念抽取与关系分析研究
唐一之
《湘潭大学自然科学学报》
CAS
CSCD
北大核心
2009
6
下载PDF
职称材料
5
基于上下文语义的甲骨文领域概念抽取算法的研究
吴琴霞
高峰
刘永革
《科学技术与工程》
北大核心
2014
1
下载PDF
职称材料
6
一种基于概念抽取的元搜索引擎
张选平
袁明轩
蒋宇
马琮
梁平
《微电子学与计算机》
CSCD
北大核心
2006
0
下载PDF
职称材料
7
军事领域中概念抽取及其应用
郑玄
蒋锴
钱夔
徐俊瑜
《指挥信息系统与技术》
2016
0
下载PDF
职称材料
8
舆情本体概念抽取研究
张学芳
刘胜全
刘艳
《新疆大学学报(自然科学版)》
CAS
北大核心
2016
3
下载PDF
职称材料
9
基于主题概念抽取的多文档文摘方法
宋宣辰
刘贵全
《计算机工程》
CAS
CSCD
北大核心
2010
5
下载PDF
职称材料
10
茶学本体学习中的概念抽取
程波波
张友华
李绍稳
辜丽川
朱利君
《计算机系统应用》
2010
2
下载PDF
职称材料
11
基于词向量和条件随机场的煤矿安全事故本体概念抽取
刘思含
刘旭红
刘秀磊
李红臣
《煤炭技术》
CAS
2018
2
下载PDF
职称材料
12
基于领域相关性度量的抑郁症药物概念抽取
王宁宁
陈建辉
《计算机工程与应用》
CSCD
北大核心
2016
1
下载PDF
职称材料
13
基于双模式的产品指标本体概念抽取
时公泽
王浩畅
《信息技术》
2017
1
下载PDF
职称材料
14
概念抽取的技术分析
杜政康
邓思铭
戴小鹏
《福建电脑》
2020
0
下载PDF
职称材料
15
基于模糊贝叶斯决策的核心概念抽取方法
钟寒
徐艺嘉
鹿浩
孙旌睿
《计算机工程与科学》
CSCD
北大核心
2022
0
下载PDF
职称材料
16
中文社会化媒体的本体概念抽取研究
唐晓波
胡华
《情报科学》
CSSCI
北大核心
2014
5
原文传递
17
中文UGC信息源的本体概念抽取研究
唐晓波
胡华
《现代图书情报技术》
CSSCI
北大核心
2014
4
原文传递
18
基于动态权值的多策略领域本体概念自动抽取
张华楠
刘胜全
刘艳
刘华鹏
李鹏
《计算机工程与应用》
CSCD
2014
1
下载PDF
职称材料
19
领域本体概念实例、属性和属性值的抽取及关系预测
郭剑毅
李真
余正涛
张志坤
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2012
31
下载PDF
职称材料
20
基于短文本的舆情本体概念的抽取研究
查晨
刘胜全
《电脑知识与技术》
2018
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
3
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部