期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
Chunk Parsing and Entity Relation Extracting to Chinese Text by Using Conditional Random Fields Model 被引量:2
1
作者 Junhua Wu Longxia Liu 《Journal of Intelligent Learning Systems and Applications》 2010年第3期139-146,共8页
Currently, large amounts of information exist in Web sites and various digital media. Most of them are in natural lan-guage. They are easy to be browsed, but difficult to be understood by computer. Chunk parsing and e... Currently, large amounts of information exist in Web sites and various digital media. Most of them are in natural lan-guage. They are easy to be browsed, but difficult to be understood by computer. Chunk parsing and entity relation extracting is important work to understanding information semantic in natural language processing. Chunk analysis is a shallow parsing method, and entity relation extraction is used in establishing relationship between entities. Because full syntax parsing is complexity in Chinese text understanding, many researchers is more interesting in chunk analysis and relation extraction. Conditional random fields (CRFs) model is the valid probabilistic model to segment and label sequence data. This paper models chunk and entity relation problems in Chinese text. By transforming them into label solution we can use CRFs to realize the chunk analysis and entities relation extraction. 展开更多
关键词 information extraction chunk parsing ENTITY RELATION extraction
下载PDF
一种新的基于Ontology的信息抽取方法 被引量:18
2
作者 陈兰 左志宏 +1 位作者 熊毅 孟令谦 《计算机应用研究》 CSCD 北大核心 2004年第8期155-157,170,共4页
把语法分析和Ontology结合起来 ,先利用领域Ontology里的概念、关系、关键字自动生成标注规则(Rule) ,然后对文章、句子的语法结构进行分析 ,再利用语法分析的结果和先前生成的标注规则一起对文档进行信息标注与抽取 。
关键词 ontology 语法分析 标注 规则 信息抽取
下载PDF
雷达知识图谱构建方法及应用
3
作者 黄振铭 吴晓芳 薛孟武 《空天预警研究学报》 CSCD 2024年第3期178-183,共6页
描述雷达及其属性的非结构化文本信息分散在互联网各处,信息量丰富但数据格式多样,难以直接处理和分析,构建雷达知识图谱能够有效解决这一问题.为此本文首先梳理了构建雷达知识图谱的流程;然后结合雷达领域的特点同时参考七步法,构建了... 描述雷达及其属性的非结构化文本信息分散在互联网各处,信息量丰富但数据格式多样,难以直接处理和分析,构建雷达知识图谱能够有效解决这一问题.为此本文首先梳理了构建雷达知识图谱的流程;然后结合雷达领域的特点同时参考七步法,构建了雷达知识图谱的本体层;最后利用互联网文本语料作为数据源,对通用信息抽取(UIE)模型进行微调,完成了知识抽取,构建了雷达知识图谱.应用结果表明,构建的雷达知识图谱可为业内人员提供参考查询的功能,对搭载雷达的战斗平台进行高维画像;同时可作为底层数据库进一步开发,支撑完成上层应用. 展开更多
关键词 雷达知识图谱 雷达本体层 知识抽取 通用信息抽取
下载PDF
多元信息抽取技术在旅游本体构建中的应用研究
4
作者 卜伟琼 陈益能 龚花 《信息与电脑》 2023年第19期174-177,共4页
智慧旅游发展背景下,旅游本体有助于解决信息服务中的不足。信息抽取作为本体构建过程中的关键技术,极具研究价值。文章以旅游领域为对象,给出本体构建的基本思路,从文本资源采集、领域术语抽取和领域概念层次关系抽取3个过程探讨多元... 智慧旅游发展背景下,旅游本体有助于解决信息服务中的不足。信息抽取作为本体构建过程中的关键技术,极具研究价值。文章以旅游领域为对象,给出本体构建的基本思路,从文本资源采集、领域术语抽取和领域概念层次关系抽取3个过程探讨多元信息抽取技术在旅游本体构建中的具体应用。 展开更多
关键词 领域本体 旅游 信息抽取 领域术语
下载PDF
基于领域本体和语块分析的信息抽取的研究与实现 被引量:9
5
作者 丁晟春 刘逶迤 +1 位作者 熊霞 梅健 《情报学报》 CSSCI 北大核心 2010年第1期53-58,共6页
为了提高信息抽取过程中的语义深层次的理解和准确率,本文提出了一种基于领域本体和语块分析的语义信息抽取方法,在详细说明其信息抽取模型的基础上,重点针对命名实体识别、词性组合模板、基于本体的三元组和二元组规则等关键问题进... 为了提高信息抽取过程中的语义深层次的理解和准确率,本文提出了一种基于领域本体和语块分析的语义信息抽取方法,在详细说明其信息抽取模型的基础上,重点针对命名实体识别、词性组合模板、基于本体的三元组和二元组规则等关键问题进行了深入的分析和研究,提出了相应的解决方法,并进行了相关试验性研究。结果表明:采用本文所述的系统结构及其技术构建文本信息抽取系统是可行的,其能在深层次语义理解的基础上进一步提高信息抽取的准确率。 展开更多
关键词 领域本体 语块分析 信息抽取
下载PDF
基于模板和领域本体的Deep Web信息抽取研究 被引量:15
6
作者 顾韵华 高原 +1 位作者 高宝 杜杰 《计算机工程与设计》 CSCD 北大核心 2014年第1期327-332,共6页
为简化模板的抽取规则、提高抽取的准确率,提出了一种基于双模板和领域本体的Deep Web信息抽取方法。该方法采用DIV块模板和表格模板结合的方法,建立双模板。利用基于中文分词的网页预处理结果,在领域本体知识的指导下,通过C4.5决策树... 为简化模板的抽取规则、提高抽取的准确率,提出了一种基于双模板和领域本体的Deep Web信息抽取方法。该方法采用DIV块模板和表格模板结合的方法,建立双模板。利用基于中文分词的网页预处理结果,在领域本体知识的指导下,通过C4.5决策树算法来训练分类模型,筛选出待抽取的DIV块序号,构建DIV块模板,从而可以精确定位到数据块。利用XML技术构建XSLT文档,得到表格模板的抽取规则,从而抽取出数据片段。选取天气领域进行Deep Web信息抽取实验,实验结果表明,抽取准确率和召回率都可以达到95%以上,取得了较好的抽取效果。 展开更多
关键词 DEEP WEB 信息抽取 模板 领域本体 决策树
下载PDF
信息抽取中领域本体的设计和实现 被引量:13
7
作者 于江德 李学钰 樊孝忠 《电子科技大学学报》 EI CAS CSCD 北大核心 2008年第5期746-749,共4页
领域本体在信息抽取系统有着重要作用。该文介绍了本体、领域本体的基本概念,并探讨了领域本体与信息抽取的关系。提出了信息抽取系统中领域本体的设计准则和实施步骤,实施步骤包括领域本体需求分析、收集本体信息、构建领域本体框架、... 领域本体在信息抽取系统有着重要作用。该文介绍了本体、领域本体的基本概念,并探讨了领域本体与信息抽取的关系。提出了信息抽取系统中领域本体的设计准则和实施步骤,实施步骤包括领域本体需求分析、收集本体信息、构建领域本体框架、形式化编码、确认和评价等。在信息抽取原型系统中实现了显示器领域本体,并将该领域本体应用到信息抽取中的命名实体识别、抽取模式获取和主题概念提取等任务中,应用结果表明该方法、步骤是可行的。 展开更多
关键词 概念 本体构建 信息抽取 领域本体
下载PDF
领域本体指导的Web商品信息抽取 被引量:9
8
作者 毕蕾 沈洁 +3 位作者 徐法艳 魏榴花 朱燕 孙荣霜 《计算机工程与设计》 CSCD 北大核心 2008年第24期6393-6396,共4页
信息在网络上传播具有高时效、低成本等特性,因而越来越多的企业和个人都选择在网上发布商品信息,例如汽车、房产等信息。这些内容多数是以有一定的结构的信息呈现,如表格,但是不同网站的表现形式却大相径庭。提出了以领域本体知识为指... 信息在网络上传播具有高时效、低成本等特性,因而越来越多的企业和个人都选择在网上发布商品信息,例如汽车、房产等信息。这些内容多数是以有一定的结构的信息呈现,如表格,但是不同网站的表现形式却大相径庭。提出了以领域本体知识为指导,抽取表格信息表达为主的商品信息,以房产为例,自动集成不同网站的同类服务或产品的信息,用以实现专业检索的功能。 展开更多
关键词 领域本体 信息检索 信息抽取 搜索引擎 网络信息挖掘
下载PDF
一种基于领域本体的药品研发信息抽取方法 被引量:4
9
作者 蒋艳辉 姚靠华 +1 位作者 周双文 王薇 《情报杂志》 CSSCI 北大核心 2012年第12期130-134,64,共6页
以生物医药公司年度报告为载体,设计了一种基于领域本体的信息抽取方法获取药品研发信息。首先依据药品研发固有的基本流程构建了领域本体词典,在对样本文档进行预处理的基础上介绍了时间词和否定词的处理;然后基于映射原理并结合触发... 以生物医药公司年度报告为载体,设计了一种基于领域本体的信息抽取方法获取药品研发信息。首先依据药品研发固有的基本流程构建了领域本体词典,在对样本文档进行预处理的基础上介绍了时间词和否定词的处理;然后基于映射原理并结合触发机制、继承机制和选择机制,抽取并规范化药品研发信息;最后对抽取结果进行了查准率和查全率分析,证明了信息抽取方法的有效性。 展开更多
关键词 信息抽取 领域本体 映射原理 生物医药公司 药品研发 年度报告
下载PDF
基于视觉特征和领域本体的Web信息抽取 被引量:5
10
作者 张鑫 陈梅 +1 位作者 王翰虎 王嫣然 《计算机技术与发展》 2011年第2期58-61,65,共5页
为了解决网页信息的自动抽取,该文提出了一种基于视觉特征和领域本体的Web信息抽取算法。该算法以基于领域本体的信息抽取为基础,根据网页的视觉特征来准确划定信息抽取区域,然后结合DOM树技术和抽取路径的启发式学习,获得Web页面中信... 为了解决网页信息的自动抽取,该文提出了一种基于视觉特征和领域本体的Web信息抽取算法。该算法以基于领域本体的信息抽取为基础,根据网页的视觉特征来准确划定信息抽取区域,然后结合DOM树技术和抽取路径的启发式学习,获得Web页面中信息项的抽取路径。通过信息项的抽取路径自动生成信息项的领域本体,通过信息项的领域本体解析出信息项的抽取规则。使用本算法来进行Web信息的抽取,具有查全率与查准率高、时间复杂度低、用户负担较轻和自动化程度高的特点。 展开更多
关键词 视觉特征 领域本体 WEB信息抽取 路径学习 启发式学习
下载PDF
基于领域本体的Web页面信息抽取 被引量:4
11
作者 黄婵 罗艳梅 《实验室研究与探索》 CAS 北大核心 2011年第1期62-65,共4页
由于当前信息抽取系统因知识库结构和内容的不同带来的搜索质量问题,将本体引入信息抽取中,有助于信息抽取系统对领域内的概念和概念之间的联系的统一认识,为用户提供更有价值的信息。提出了基于本体的文本信息抽取算法,通过本体元素描... 由于当前信息抽取系统因知识库结构和内容的不同带来的搜索质量问题,将本体引入信息抽取中,有助于信息抽取系统对领域内的概念和概念之间的联系的统一认识,为用户提供更有价值的信息。提出了基于本体的文本信息抽取算法,通过本体元素描述抽取的文本信息。最后,利用此算法对某领域样本Web页面进行抽取并分析。实验表明性能有所提高。 展开更多
关键词 领域本体 WEB页面 案信息抽取
下载PDF
应用领域本体的Web信息知识集成研究 被引量:4
12
作者 李超 王兰成 《情报科学》 CSSCI 北大核心 2007年第3期430-434,共5页
缺少领域知识而进一步提高Web信息检索的质量是困难的,知识集成能够发挥重要作用。本文首先分析了目前Web用户信息利用的现状,研究领域本体与知识集成的方法,然后结合Web网页文档的特点及本体知识,给出一种基于领域本体的Web信息个性化... 缺少领域知识而进一步提高Web信息检索的质量是困难的,知识集成能够发挥重要作用。本文首先分析了目前Web用户信息利用的现状,研究领域本体与知识集成的方法,然后结合Web网页文档的特点及本体知识,给出一种基于领域本体的Web信息个性化集成方法,能够提高Web信息检索和用户利用的效率。 展开更多
关键词 知识集成 领域本体 信息提取 都柏林核心集
下载PDF
基于油田领域本体的信息抽取技术研究 被引量:4
13
作者 文必龙 李云静 《计算机技术与发展》 2015年第7期226-229,共4页
文中主要针对当前油田搜索引擎本身不能直接、自动、高效地从油田文本中抽取出精确信息,语义信息不清晰,而且模式不明确的现状进行分析、研究,将信息抽取技术引入到油田信息搜索引擎中,从而构建一种适合于油田领域的信息抽取系统。构建... 文中主要针对当前油田搜索引擎本身不能直接、自动、高效地从油田文本中抽取出精确信息,语义信息不清晰,而且模式不明确的现状进行分析、研究,将信息抽取技术引入到油田信息搜索引擎中,从而构建一种适合于油田领域的信息抽取系统。构建油田领域本体,在GATE框架下,对油田信息进行语法分析并生成相应的抽取规则,最后对文档进行信息抽取,展示抽取结果。该研究会为以后油田自动报表生成、知识推理、自动问答等提供依据,具有很大的实用价值。 展开更多
关键词 信息抽取 GATE 本体 领域本体
下载PDF
基于抽取规则和本体映射的领域XML语义集成 被引量:1
14
作者 李华昱 张培颖 肖晗 《河北科技大学学报》 CAS 2016年第4期416-422,共7页
油气井工程领域中存在大量的XML文档,传统的XML集成方案无法提供面向语义的信息查询,导致数据利用率不高。针对油气井XML文档WeXML语义集成与查询应用需求,提出一种基于抽取规则和本体映射的语义集成方法。首先定义一系列类、属性抽取规... 油气井工程领域中存在大量的XML文档,传统的XML集成方案无法提供面向语义的信息查询,导致数据利用率不高。针对油气井XML文档WeXML语义集成与查询应用需求,提出一种基于抽取规则和本体映射的语义集成方法。首先定义一系列类、属性抽取规则,分别将WeXML Schema中的元素、属性映射为WeOWL本体中的类和属性;然后,利用实例转换算法将WeXML文档转换为本体实例数据;由于WeOWL提供有限的局部语义模型,需要在两者之间建立语义映射,并借助WeOWL中的术语对全局语义模型中的类和属性进行解释,进而提供面向领域全局本体的语义查询。通过构建WeXML数据语义集成原型系统,对提出的转换规则、转换算法和映射规则进行了验证。 展开更多
关键词 计算机信息管理系统 抽取规则 本体映射 领域XML 语义集成
下载PDF
基于领域本体的Web信息抽取方法的设计与实现——以网易汽车资讯网页信息抽取为例 被引量:3
15
作者 吴恒亮 《图书馆论坛》 CSSCI 北大核心 2010年第3期78-81,共4页
以网易汽车资讯网页信息抽取为例,研究了基于领域本体的Web信息抽取技术的设计与实现。
关键词 WEB信息抽取 领域本体 WEB数据挖掘
下载PDF
一种基于本体的语义检索系统的研究 被引量:1
16
作者 宋艳娟 陈振标 张文德 《计算机与数字工程》 2009年第7期77-80,共4页
面向语义是提高检索效率的有效途径。基于本体技术,提出了一个面向特定领域的信息检索模型,重点研究了结合本体的信息收集、信息抽取以及语义推理技术,并分析了模型在手机本体领域的应用。通过本体的语义推理,提高了检索系统的查全率和... 面向语义是提高检索效率的有效途径。基于本体技术,提出了一个面向特定领域的信息检索模型,重点研究了结合本体的信息收集、信息抽取以及语义推理技术,并分析了模型在手机本体领域的应用。通过本体的语义推理,提高了检索系统的查全率和查准率。 展开更多
关键词 领域本体 语义检索 主题蜘蛛 信息抽取 LUCENE
下载PDF
基于领域本体构建的Web信息抽取 被引量:4
17
作者 张莉萍 《嘉兴学院学报》 2010年第6期107-111,共5页
指出了本体的涵义、类别和构成,基于语义的领域本体的构建模式和设计标准,阐述了信息抽取的涵义、特征、类型以及与信息检索的关系,探讨了领域本体构建的Web信息抽取,并从本体的信息抽取的原理、特点、方法和过程等方面论述了领域本体... 指出了本体的涵义、类别和构成,基于语义的领域本体的构建模式和设计标准,阐述了信息抽取的涵义、特征、类型以及与信息检索的关系,探讨了领域本体构建的Web信息抽取,并从本体的信息抽取的原理、特点、方法和过程等方面论述了领域本体构建的Web信息抽取的实现,认为构建高质量的本体并提高信息抽取的准确性是目前存在的两大技术瓶颈. 展开更多
关键词 领域本体 本体构建 信息抽取
下载PDF
基于半监督条件随机场的信息抽取方法 被引量:1
18
作者 林春杰 韩晓琴 《信息与电脑》 2020年第10期103-106,共4页
信息抽取能够自动地从大量的非结构化文档中识别和提取信息,是人工智能领域的一个研究热点。基于此,笔者提出了基于半监督条件随机场模型的信息抽取方法。该方法引入基于本体的相似度计算方法预测未标记样本的类别,有效利用了未标记数... 信息抽取能够自动地从大量的非结构化文档中识别和提取信息,是人工智能领域的一个研究热点。基于此,笔者提出了基于半监督条件随机场模型的信息抽取方法。该方法引入基于本体的相似度计算方法预测未标记样本的类别,有效利用了未标记数据训练条件随机场模型,利用包含在本体中语义信息扩展特征解决数据稀疏问题。提出的方法能够同时在有标记和无标记的数据集下学习,既降低了人工注入成本,又提高了信息抽取效率。实验表明,该方法在包含大量未标记样本数据中的信息抽取准确率和召回率较高。 展开更多
关键词 领域本体 条件随机场 信息抽取 半监督机器学习
下载PDF
面向茶学领域本体的概念自动提取方法研究
19
作者 徐济成 李绍稳 +1 位作者 张友华 辜丽川 《农业网络信息》 2010年第8期13-15,24,共4页
针对目前手工构建本体耗时费力这一难题,以茶学领域知识为研究对象,提出了一种本体的概念自动提取方法。该方法利用中文分词技术对茶学语料进行切分,使用互信息技术从切分后的语料中得出候选概念(合成词)集合,通过判断候选概念和非合成... 针对目前手工构建本体耗时费力这一难题,以茶学领域知识为研究对象,提出了一种本体的概念自动提取方法。该方法利用中文分词技术对茶学语料进行切分,使用互信息技术从切分后的语料中得出候选概念(合成词)集合,通过判断候选概念和非合成词的领域相关性,自动提取出茶学领域本体概念。以该方法为基础开发了相应的原型系统,实验结果表明,该方法是有效的。 展开更多
关键词 茶学本体 概念提取 互信息 领域相关性
下载PDF
基于领域本体的临床语义关联知识抽取技术研究
20
作者 蒋秀林 朱文婕 +1 位作者 谢静 陈玉娥 《常州工学院学报》 2016年第5期44-49,共6页
抽取临床电子病历系统有价值的检验检查信息,可以为临床工作人员和科研人员对某些疾病的诊断和分析研究提供数据支持。采用领域本体构建技术、知识抽取技术和基于领域本体的语义推理技术实现临床电子病历系统中文本信息的关联关系抽取... 抽取临床电子病历系统有价值的检验检查信息,可以为临床工作人员和科研人员对某些疾病的诊断和分析研究提供数据支持。采用领域本体构建技术、知识抽取技术和基于领域本体的语义推理技术实现临床电子病历系统中文本信息的关联关系抽取和分析,并给出了语义知识抽取技术在电子病历系统中的处理流程。在大数据时代背景下,该技术有利于临床语义知识的发现和关联,有利于辅助完成临床信息挖掘,为临床决策提供可靠的技术支持。 展开更多
关键词 临床信息 领域本体 语义技术 知识抽取 语义关联
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部