期刊文献+
共找到166篇文章
< 1 2 9 >
每页显示 20 50 100
多信息块Web页面中的抽取规则 被引量:6
1
作者 王庆一 王继成 +1 位作者 周源远 袁春风 《计算机工程》 CAS CSCD 北大核心 2003年第9期42-44,50,共4页
以往的包装器主要针对仅含有一个数据块的Web页面,而对含有多个信息块的Web页面,简称MIB(Multiple Information Block), Web页面无法处理。该文提出了一个新的抽取规则,结合了基于文档结构的抽取规则和基于特征Pattern匹配的抽取规... 以往的包装器主要针对仅含有一个数据块的Web页面,而对含有多个信息块的Web页面,简称MIB(Multiple Information Block), Web页面无法处理。该文提出了一个新的抽取规则,结合了基于文档结构的抽取规则和基于特征Pattern匹配的抽取规则的优点,能够有效地抽取MIB Web页面中的信息。 展开更多
关键词 Web 信息抽取 包装器 抽取规则 信息集成
下载PDF
基于DOM的Web信息抽取规则的构造与实现 被引量:5
2
作者 杨敬伟 杨文柱 高悦 《河北大学学报(自然科学版)》 CAS 北大核心 2007年第2期209-212,共4页
为了实现对Web信息的查询、重构和再利用,人们采用了Web信息抽取技术.本文主要讨论基于DOM的Web信息抽取,研究如何构造抽取规则,才能提高信息抽取的准确度、提高抽取规则的适应能力,并给出了抽取规则的生成过程.
关键词 DOM WEB信息抽取 抽取规则
下载PDF
航班信息抽取规则的自动生成技术 被引量:2
3
作者 张志远 徐涛 冯霞 《计算机工程》 CAS CSCD 北大核心 2011年第6期65-67,共3页
在基于包装器的Web信息提取工作中,抽取规则占有重要的地位。由于网页经常改版,使得抽取规则需要不断更新,且手工生成抽取规则是一项费时费力的工作。为此,提出一种自动生成抽取规则的方法,通过扫描HTML源码,生成带语义信息的TABLE树,... 在基于包装器的Web信息提取工作中,抽取规则占有重要的地位。由于网页经常改版,使得抽取规则需要不断更新,且手工生成抽取规则是一项费时费力的工作。为此,提出一种自动生成抽取规则的方法,通过扫描HTML源码,生成带语义信息的TABLE树,用以识别网页中的数据表格,并在此基础上利用贪心算法自动生成抽取规则。实验结果表明,该方法具有较高的准确率和F指数,且对于识别出的表格具有较高的规则生成率。 展开更多
关键词 WEB信息提取 抽取规则 语义TABLE树 贪心算法
下载PDF
基于数据区域发现的信息抽取规则生成方法 被引量:4
4
作者 曲著伟 李敏强 《计算机工程》 CAS CSCD 北大核心 2009年第22期59-61,共3页
提出一种自动检测网页中数据记录结构特点并生成Web信息抽取规则的方法,以网页DOM树为基础,自动发现和分离Web数据区域所对应的DOM子树,将其分解为数据记录子树集合,综合数据记录子树的结构特点生成抽取规则。实验结果显示,该方法具有... 提出一种自动检测网页中数据记录结构特点并生成Web信息抽取规则的方法,以网页DOM树为基础,自动发现和分离Web数据区域所对应的DOM子树,将其分解为数据记录子树集合,综合数据记录子树的结构特点生成抽取规则。实验结果显示,该方法具有较高的抽取准确率和查全率。 展开更多
关键词 信息抽取 抽取规则生成 Web数据区域 树匹配
下载PDF
基于抽取规则和本体映射的领域XML语义集成 被引量:1
5
作者 李华昱 张培颖 肖晗 《河北科技大学学报》 CAS 2016年第4期416-422,共7页
油气井工程领域中存在大量的XML文档,传统的XML集成方案无法提供面向语义的信息查询,导致数据利用率不高。针对油气井XML文档WeXML语义集成与查询应用需求,提出一种基于抽取规则和本体映射的语义集成方法。首先定义一系列类、属性抽取规... 油气井工程领域中存在大量的XML文档,传统的XML集成方案无法提供面向语义的信息查询,导致数据利用率不高。针对油气井XML文档WeXML语义集成与查询应用需求,提出一种基于抽取规则和本体映射的语义集成方法。首先定义一系列类、属性抽取规则,分别将WeXML Schema中的元素、属性映射为WeOWL本体中的类和属性;然后,利用实例转换算法将WeXML文档转换为本体实例数据;由于WeOWL提供有限的局部语义模型,需要在两者之间建立语义映射,并借助WeOWL中的术语对全局语义模型中的类和属性进行解释,进而提供面向领域全局本体的语义查询。通过构建WeXML数据语义集成原型系统,对提出的转换规则、转换算法和映射规则进行了验证。 展开更多
关键词 计算机信息管理系统 抽取规则 本体映射 领域XML 语义集成
下载PDF
基于文档结构的信息抽取规则的描述语言比较研究
6
作者 张志强 李天柱 +2 位作者 张波 陈少飞 郝亚南 《河北大学学报(自然科学版)》 CAS 2004年第2期212-218,共7页
基于文档结构的信息抽取工具很多 ,XWrap ,W 4F ,Lixto以及自主开发的PQagent是其中比较有代表性的几个 .这几个工具采用了不同的规则描述形式 ,XWrap ,W 4F ,Lixto使用的是自定义的规则描述形式 ,PQagent采用了通用的规范XQuery来描述... 基于文档结构的信息抽取工具很多 ,XWrap ,W 4F ,Lixto以及自主开发的PQagent是其中比较有代表性的几个 .这几个工具采用了不同的规则描述形式 ,XWrap ,W 4F ,Lixto使用的是自定义的规则描述形式 ,PQagent采用了通用的规范XQuery来描述规则 .现将XWrap ,W 4F ,Lixto使用的规则描述形式与PQagent采用的XQuery进行比较 ,说明了采用XQuery描述抽取规则的优越性 . 展开更多
关键词 信息抽取 抽取规则 描述语言 XQUERY
下载PDF
民国南海文献知识元内容抽取规则研究 被引量:5
7
作者 孙浩洋 沈固朝 《情报杂志》 CSSCI 北大核心 2022年第12期132-139,共8页
[研究目的]南海问题的深入研究,需要从海量历史文献中快速获得知识描述,实现由文献向语句描述的内容抽取,因此引入最小知识描述单位--知识元,并研究其抽取规则,为南海维权信息内容抽取提供新思路,以方便研究者快速浏览文献知识。[研究方... [研究目的]南海问题的深入研究,需要从海量历史文献中快速获得知识描述,实现由文献向语句描述的内容抽取,因此引入最小知识描述单位--知识元,并研究其抽取规则,为南海维权信息内容抽取提供新思路,以方便研究者快速浏览文献知识。[研究方法]基于民国南海文献总结知识元分类,归纳不同属性类型知识元句法规则,提炼形成规则模板,匹配文本与知识元描述规则,人工干预确定知识元内容,实现知识元的内容抽取。[研究结论]匹配结果发现,内容描述规则能较好地实现知识元抽取,满足研究者对知识元内容的阅览需求。 展开更多
关键词 知识元 知识元分类 知识元抽取 知识元描述规则 抽取规则 提炼规则 南海文献
下载PDF
基于抽取规则和本体映射的语义搜索算法 被引量:2
8
作者 周诗源 王英林 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2018年第2期329-334,共6页
针对目前语义搜索过程中存在效率低、用户推荐误差大等问题,提出一种基于抽取规则和本体映射的语义搜索算法.首先根据用户语义搜索要求抽取语义中的元素和属性,解决数据利用率低的缺陷;然后建立语义模型,构建本体之间的元素及属性之间... 针对目前语义搜索过程中存在效率低、用户推荐误差大等问题,提出一种基于抽取规则和本体映射的语义搜索算法.首先根据用户语义搜索要求抽取语义中的元素和属性,解决数据利用率低的缺陷;然后建立语义模型,构建本体之间的元素及属性之间的映射,消除用户需求和计算机之间的语义偏差;最后将语义搜索算法应用于用户个性化推荐系统.实验结果表明,该语义搜索算法有效提高了搜索效率,降低了用户个性化推荐误差. 展开更多
关键词 信息检索 语义搜索 本体映射 抽取规则 个性化推荐
下载PDF
最小节点信息树抽取规则及可视化生成方法
9
作者 霍滨焱 《应用科技》 CAS 2009年第7期37-40,共4页
提出了最小节点信息树概念,将抽取规则分为粗略规则和精细规则,降低了DOM树的高度,提高了信息抽取效率.设计并实现了一种最小节点信息树抽取规则的可视化实现方法.
关键词 WEB信息抽取 抽取规则 最小节点信息树
下载PDF
基于规则归纳的信息抽取系统实现 被引量:19
10
作者 石倩 陈荣 鲁明羽 《计算机工程与应用》 CSCD 北大核心 2008年第21期166-170,共5页
面对Web信息的迅猛增长,信息抽取技术非常适合于从大量的文档中抽取需要的事实数据。通过文档对象模型(DOM)解析以及检索、抽取、映射等规则的定义,设计并实现了一种具有规则归纳能力的信息抽取系统,用于Web信息的自动检索。在用于抽取... 面对Web信息的迅猛增长,信息抽取技术非常适合于从大量的文档中抽取需要的事实数据。通过文档对象模型(DOM)解析以及检索、抽取、映射等规则的定义,设计并实现了一种具有规则归纳能力的信息抽取系统,用于Web信息的自动检索。在用于抽取规则归纳的框架下,还重点对用于生成抽取模式的WHISK学习算法进行了实验对比分析,结果表明系统对于单槽和多槽数据都具有不错的归纳学习能力。 展开更多
关键词 信息抽取 抽取规则 DOM 学习算法
下载PDF
基于规则的海事自由文本信息抽取方法研究 被引量:16
11
作者 余晨 毛喆 高嵩 《交通信息与安全》 CSCD 2017年第2期40-47,共8页
海事数据的结构化处理是海事安全研究的一个重要步骤。目前,网络上存在着大量的海事相关信息,但多为不同格式的非结构化文档数据,可以采用一种基于规则的海事信息抽取方法,将海事自由文本转化为结构化的数据。通过网络爬虫从海事相关网... 海事数据的结构化处理是海事安全研究的一个重要步骤。目前,网络上存在着大量的海事相关信息,但多为不同格式的非结构化文档数据,可以采用一种基于规则的海事信息抽取方法,将海事自由文本转化为结构化的数据。通过网络爬虫从海事相关网页中得到待抽取文本数据,根据得到的文本信息定义抽取任务为时间、地点、船名和事故类型4个数据项,再根据抽取任务本身及其常见触发词构建自定义海事词库,用于自由文本的分词和词性标注;通过对大量事故语料的分析总结,编制抽取规则进行海事信息的抽取,形成结构化的海事数据。以长江海事局网站的事故详情为数据源,采用基于规则的抽取方法进行实验。实验结果表明,时间信息抽取的准确率为100%,召回率为91%;地点信息抽取的准确率为94.52%,召回率为69%;船名信息抽取的准确率为97.75%,召回率为86%;事故类型信息抽取的准确率为96.67%,召回率为87%。 展开更多
关键词 信息抽取 海事自由文本 自定义词库 抽取规则
下载PDF
基于规则的动物卫生事件舆情信息抽取研究 被引量:6
12
作者 丁晟春 王莉 刘梦露 《计算机应用与软件》 北大核心 2018年第9期56-62,共7页
为了能够快速地在海量信息中获取有效信息,监视国内外动物卫生变化动态,提高动物卫生领域舆情监测研究人员的工作效率,在总结待抽取属性项的描述规律以及出现位置和方向的基础上,使用正则表达式构建抽取规则,实现动物卫生事件舆情信息... 为了能够快速地在海量信息中获取有效信息,监视国内外动物卫生变化动态,提高动物卫生领域舆情监测研究人员的工作效率,在总结待抽取属性项的描述规律以及出现位置和方向的基础上,使用正则表达式构建抽取规则,实现动物卫生事件舆情信息中时间、地点、疫病名称、动物数量、应对措施等内容的抽取。对抽取效果较差的动物数量属性项提出基于节点关系比较的抽取方法,实现多个数值间的关系判断,提高动物数量属性项的抽取效果。实验证明该方法具有较好的适用性。 展开更多
关键词 动物卫生 信息抽取 抽取规则 节点关系比较
下载PDF
基于规则的城市轨道交通安全事件信息抽取及其知识元表示 被引量:6
13
作者 张萌 陈佳惠 +2 位作者 孙然然 李晓璐 朱广宇 《科学技术与工程》 北大核心 2021年第15期6435-6440,共6页
合理利用城市轨道交通安全事件案例对突发事件下辅助制定应急决策具有重大意义。目前,中国轨道交通运营商存储了大量的安全事件案例,但大多以自由化或半自由化文本的形式存储在数据库中,使用率较低。为提高城市轨道交通安全事件案例的... 合理利用城市轨道交通安全事件案例对突发事件下辅助制定应急决策具有重大意义。目前,中国轨道交通运营商存储了大量的安全事件案例,但大多以自由化或半自由化文本的形式存储在数据库中,使用率较低。为提高城市轨道交通安全事件案例的使用效率,提出了基于规则的信息抽取方法,将城市轨道交通安全事件案例的自由文本转化为用共性知识元表示的结构化数据。通过指标计算,所提出的方法可以以较高的准确率和召回率对安全事件要素进行抽取,可为突发事故时的应急决策制定提供高效的数据支撑。 展开更多
关键词 城市轨道交通安全事件案例 共性知识元 抽取规则 信息抽取
下载PDF
从神经网络中抽取土地评价模糊规则 被引量:18
14
作者 胡月明 薛月菊 +3 位作者 李波 谢健文 陈飞香 包世泰 《农业工程学报》 EI CAS CSCD 北大核心 2005年第12期93-97,共5页
为了明确土地评价中所训练神经网络的含义,使土地评价工作者可轻松地理解、判断所得到土地评价模型的正确性和合理性,提出从神经网络中抽取土地评价模糊规则的方法。现有的大多数从神经网络中提取方法,神经网络的输入属性要么局限于连续... 为了明确土地评价中所训练神经网络的含义,使土地评价工作者可轻松地理解、判断所得到土地评价模型的正确性和合理性,提出从神经网络中抽取土地评价模糊规则的方法。现有的大多数从神经网络中提取方法,神经网络的输入属性要么局限于连续的,要么只适应于离散的,而土地评价因子往往既包含连续的又包含离散的、标称的,该文首先提出了一种输入属性值适应于这三种类型数据的模糊神经网络建立方法,进而给出一种从建立的神经网络中抽取其中较主要模糊规则的算法。试验表明,所提出的土地评价方法,可直接从样本中学习评价规律,使土地评价工作者易于理解,当出现抽取的规则与实际情况不吻合时,可重新训练神经网络和抽取规则,所得到的评价结果比BP网络的评价结果更准确,从而提高了土地评价的准确性。 展开更多
关键词 神经网络 土地评价 模糊规则抽取 输入属性
下载PDF
一种基于统计的神经网络规则抽取方法 被引量:9
15
作者 周志华 何佳洲 +1 位作者 尹旭日 陈兆乾 《软件学报》 EI CSCD 北大核心 2001年第2期263-269,共7页
从功能性观点出发 ,提出了一种基于统计的神经网络规则抽取方法 .该方法利用统计技术对抽取出的规则进行评价 ,使其可以较好地覆盖示例空间 .采用独特的连续属性处理方式 ,降低了离散化处理的主观性和复杂度 .采用优先级规则形式 ,不仅... 从功能性观点出发 ,提出了一种基于统计的神经网络规则抽取方法 .该方法利用统计技术对抽取出的规则进行评价 ,使其可以较好地覆盖示例空间 .采用独特的连续属性处理方式 ,降低了离散化处理的主观性和复杂度 .采用优先级规则形式 ,不仅使得规则表示简洁、紧凑 ,而且还免除了规则应用时所需要的一致性处理 .该方法不依赖于具体的网络结构和训练算法 ,可以方便地应用于各种分类器型神经网络 .实验表明 ,利用该方法可以抽取出可理解性好 ,简洁、紧凑 ,保真度高的符号规则 . 展开更多
关键词 规则抽取 机器学习 统计 聚类 神经网络 知识发现
下载PDF
神经网络规则抽取研究 被引量:10
16
作者 孙晨 周志华 陈兆乾 《计算机应用研究》 CSCD 2000年第2期34-37,共4页
尽管神经网络已经在很广泛的领域得到应用,但由于训练好的神经网络中的知识不易于理解;神经网络被视为一个典型的“黑箱”结构。从神经网络中抽取规则来表示其中隐含的知识是解决这个问题的一个有效的手段。将对一些具有代表性的神经... 尽管神经网络已经在很广泛的领域得到应用,但由于训练好的神经网络中的知识不易于理解;神经网络被视为一个典型的“黑箱”结构。从神经网络中抽取规则来表示其中隐含的知识是解决这个问题的一个有效的手段。将对一些具有代表性的神经网络规则抽取算法进行综述分析,并提出一些未来的研究重点。 展开更多
关键词 神经网络 规则抽取 机器学习 专家系统
下载PDF
神经网络规则抽取 被引量:19
17
作者 周志华 陈世福 《计算机研究与发展》 EI CSCD 北大核心 2002年第4期398-405,共8页
神经网络是一种黑箱模型,其学习到的知识蕴涵在大量连接权中,不仅影响了用户对利用神经计算技术构建智能系统的信心,还阻碍了神经网络技术在数据挖掘领域的应用.由于对神经网络规则抽取进行研究有助于解决上述问题,因此该领域已成... 神经网络是一种黑箱模型,其学习到的知识蕴涵在大量连接权中,不仅影响了用户对利用神经计算技术构建智能系统的信心,还阻碍了神经网络技术在数据挖掘领域的应用.由于对神经网络规则抽取进行研究有助于解决上述问题,因此该领域已成为机器学习和神经计算界的研究热点.介绍了神经网络规则抽取研究的历史,综述了国际研究现状,对关于这方面研究的不同看法进行了讨论,并指出该领域中一些值得进一步研究的内容. 展开更多
关键词 神经网络 机器学习 规则抽取 知识获取 数据挖掘
下载PDF
基于优势-等价关系的几种约简及规则抽取方法 被引量:4
18
作者 李艳 孙娜欣 +1 位作者 赵津 王华超 《计算机科学》 CSCD 北大核心 2011年第11期220-224,共5页
考虑了条件属性引入优势关系而决策属性上引入等价关系的不协调目标信息系统。分析了这种基于优势-等价关系的相容约简、最大分布约简及正域约简三者之间的关系。此外,结合劣势关系抽取规则以提高规则的覆盖率,改进了基于优势关系的正... 考虑了条件属性引入优势关系而决策属性上引入等价关系的不协调目标信息系统。分析了这种基于优势-等价关系的相容约简、最大分布约简及正域约简三者之间的关系。此外,结合劣势关系抽取规则以提高规则的覆盖率,改进了基于优势关系的正域约简抽取规则(PDRIS)的方法。最后给出算例,并在UCI数据集上进行了大量的试验,以与PDRIS进行比较。 展开更多
关键词 粗糙集 优势关系 等价关系 正域约简 规则抽取
下载PDF
基于多种群协同优化的文本分类规则抽取方法 被引量:4
19
作者 刘赫 刘大有 +1 位作者 裴志利 高滢 《自动化学报》 EI CSCD 北大核心 2009年第10期1334-1340,共7页
针对文奉分类中的规则抽取问题,提出一种基于多种群协同优化的文奉分类规则抽取方法.该方法利用信息熵生成初始种群,采用多种群协同优化方法演化当前种群.多种群协同优化方法通过种群之间的相互竞争和良种共享机制提高优化方法的效率.... 针对文奉分类中的规则抽取问题,提出一种基于多种群协同优化的文奉分类规则抽取方法.该方法利用信息熵生成初始种群,采用多种群协同优化方法演化当前种群.多种群协同优化方法通过种群之间的相互竞争和良种共享机制提高优化方法的效率.实验结果表明,奉文提出的文本分类规则抽取方法所抽取规则的数量少,准确率高,平均长度短;同时,奉文方法所用的计算时间少,抽取分类规则的速度快,适用于大规模数据集. 展开更多
关键词 规则抽取 文本分类 多种群协同优化 遗传算法 蚁群算法
下载PDF
基于免疫克隆选择算法的神经网络规则抽取 被引量:4
20
作者 於时才 马宁 亢军贤 《计算机工程》 CAS CSCD 北大核心 2009年第1期173-175,共3页
神经网络的不可解释性一直是限制其发展的固有缺陷,该文从神经网络的功能性观点出发,提出基于免疫克隆选择算法的神经网络规则抽取方法。将免疫克隆策略用于神经网络的规则抽取中,对已经训练好的神经网络隐层神经元输出值进行聚类,缩小... 神经网络的不可解释性一直是限制其发展的固有缺陷,该文从神经网络的功能性观点出发,提出基于免疫克隆选择算法的神经网络规则抽取方法。将免疫克隆策略用于神经网络的规则抽取中,对已经训练好的神经网络隐层神经元输出值进行聚类,缩小搜索空间,抽取出理解性好、简洁的符号规则。该方法不依赖于具体的网络结构和训练算法,可以方便地应用于各种分类器型神经网络。实验结果表明该方法的实用性和可行性。 展开更多
关键词 神经网络 规则抽取 免疫克隆算法 聚类
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部