期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
基于网页上下文的Deep Web数据库分类 被引量:31
1
作者 马军 宋玲 +1 位作者 韩晓晖 闫泼 《软件学报》 EI CSCD 北大核心 2008年第2期267-274,共8页
讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属... 讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属性标记词的归一过程是把同义标记词用代表词进行替代的过程.给出了采用分层模糊集合对给定学习实例所发现的领域和语言知识进行表示和基于这些知识对标记词归一化算法.基于上述预处理,给出了计算Deep Web数据库的K-NN(k nearest neighbors)分类算法,其中对数据库之间语义距离计算综合了数据库表之间和含有数据库表的网页的内容文本之间的语义距离.分类实验给出算法对未预处理的网页和经过预处理后的网页在数据库分类精度、查全率和综合F1等测度上的分类结果比较. 展开更多
关键词 DEEP Web 隐式Web 数据库分类 内容文本抽取 语义分类
下载PDF
多数据库挖掘中独立于应用的数据库分类研究 被引量:3
2
作者 唐懿芳 牛力 +1 位作者 钟智 张成奇 《广西师范大学学报(自然科学版)》 CAS 2003年第4期32-36,共5页
目前的数据挖掘技术大多只针对单一数据库进行挖掘。当数据库有多个时,需要用到多数据库挖掘技术。应用聚类思想,提出一种独立于应用的数据库分类方法,并给出了相关的算法,最后用实验证明了该方法的正确性和有效性。
关键词 数据库挖掘 数据库分类 聚类 算法
下载PDF
基于领域样本查询的Deep Web数据库分类 被引量:1
3
作者 鲜学丰 赵朋朋 +2 位作者 辛洁 方巍 崔志明 《微电子学与计算机》 CSCD 北大核心 2010年第3期20-23,共4页
提出了一种基于领域样本查询的方法以分类这类Web数据库.通过分析领域的高级查询接口自动获取领域主属性并使用领域知识为主属性构建查询样本,然后对查询接口提交试探查询,根据返回结果页面的结果模式和记录内容估计Web数据库与领域的... 提出了一种基于领域样本查询的方法以分类这类Web数据库.通过分析领域的高级查询接口自动获取领域主属性并使用领域知识为主属性构建查询样本,然后对查询接口提交试探查询,根据返回结果页面的结果模式和记录内容估计Web数据库与领域的相关程度.通过在多个领域的Web数据库上进行实验验证,说明该方法分类只提供简单查询接口的Web数据库是有效的,取得了较高的分类精确率,召回率和F-measure值. 展开更多
关键词 DEEP WEB WEB数据库 数据库分类 简单查询接口
下载PDF
DIALOG数据库分类及常用功能 被引量:3
4
作者 张瑞芳 徐惠珍 《情报杂志》 CSSCI 北大核心 2001年第5期67-68,共2页
介绍了DIALOG数据库蓝页和数据库的分类以及笔者在实践中总结的几种常用检索功能:数据库扫描、免 费贮存、多重数据库一次检索、对检索结果的再处理、多种显示和提取检索结果以及在线帮助功能。
关键词 联机检索 DIALOG数据库 数据库蓝页 数据库分类 检索功能
下载PDF
无线网络中数据库分类优化存储仿真 被引量:2
5
作者 斯亚民 武斌 《计算机仿真》 北大核心 2018年第7期355-358,433,共5页
对无线网络数据库的分类优化存储,能够有效提高数据库处理能力,降低无线网络数据存储量。对无线网络中数据库的分类优化存储,需要对无线网络冗余数据进行滤除,获取数据存储节点适应度函数,完成数据库分类优化存储。传统方法采用布隆过滤... 对无线网络数据库的分类优化存储,能够有效提高数据库处理能力,降低无线网络数据存储量。对无线网络中数据库的分类优化存储,需要对无线网络冗余数据进行滤除,获取数据存储节点适应度函数,完成数据库分类优化存储。传统方法采用布隆过滤器,对存储节点进行分类,但忽略了对存储节点适应度函数的求取,导致数据存储精度偏低。提出无线网络数据库分类优化存储方法。基于节点位置的不同,将无线网络数据返回客服端所通过的节点划分为"边缘"类节点与"核心"节点,通过权衡此类节点的位置与无线网络数据在不同节点流行度的分布,结合自适应匹配滤波方法对无线网络冗余数据进行滤除处理,求得无线网络数据存储节点的适应度函数,实现数据优化存储分类设计。实验结果表明,所提方法提高了数据访问请求时间.存储负载均衡性能较优。 展开更多
关键词 无线网络 数据库分类 优化存储
下载PDF
基于相似度的多数据库分类
6
作者 李园园 张绿云 《计算机光盘软件与应用》 2014年第23期95-96,共2页
许多大型组织拥有大量的子公司,进行事务处理时会产生大量的多源数据库,然而现有的数据挖掘只致力于对单个数据库的挖掘,由此,提出了多数据库挖掘技术。为了减少寻找相关数据的检索代价,在对多数据库进行挖掘和分析之前,首先要对多数据... 许多大型组织拥有大量的子公司,进行事务处理时会产生大量的多源数据库,然而现有的数据挖掘只致力于对单个数据库的挖掘,由此,提出了多数据库挖掘技术。为了减少寻找相关数据的检索代价,在对多数据库进行挖掘和分析之前,首先要对多数据库进行分类。由于多数据库中包含大量数据,现有的分类算法Greedy Class的时间复杂度可达到O(m4),所需代价非常大。由此提出了Identify Completeclass算法用于对多数据库分类,其时间复杂度降为O(m3),并提出了相应的寻找最优完全分类算法Identify Best Classification,实验证明改进后的算法有较高的运行效率。 展开更多
关键词 数据挖掘 数据库分类 IDENTIFY Completeclass算法 IDENTIFY Best Classification算法
下载PDF
基于Web日志粒度化的深网数据库分类
7
作者 沈炜 蒙祖强 《微计算机信息》 2010年第15期161-162,181,共3页
Interuet上有大量的页面是由后台数据库动态产生的,传统的搜索引擎搜索不出这部分页面,我们称之为深网,其中大部分深网信息是结构化的。将这些结构化的深网数据库按所属领域进行分类是获得深网信息的一个关键问题。本文针对已有深网数... Interuet上有大量的页面是由后台数据库动态产生的,传统的搜索引擎搜索不出这部分页面,我们称之为深网,其中大部分深网信息是结构化的。将这些结构化的深网数据库按所属领域进行分类是获得深网信息的一个关键问题。本文针对已有深网数据库分类方法实现成本高昂、效率低下的问题,提出了一种基于Web日志粒度化的深网数据库分类算法,并通过实验检验了方法的分类效果。 展开更多
关键词 粒度计算 深网 数据库分类 WEB日志
下载PDF
基于数据库分类的deep web爬行器研究
8
作者 郭少友 赵善义 +1 位作者 李建平 王斌 《情报科学》 CSSCI 北大核心 2011年第10期1575-1579,共5页
在现有相关研究的基础上,设计一种基于数据库分类的deep web爬行器。该爬行器首先从抓取的网页中识别出deep web数据库的入口表单,然后采用查询探测方法对数据库进行自动分类,并根据分类结果来选取一组合适的关键词作为查询词,自动填写... 在现有相关研究的基础上,设计一种基于数据库分类的deep web爬行器。该爬行器首先从抓取的网页中识别出deep web数据库的入口表单,然后采用查询探测方法对数据库进行自动分类,并根据分类结果来选取一组合适的关键词作为查询词,自动填写入口表单中的文本框并向数据库提出查询请求。实验结果表明,基于数据库分类的deep web爬行器的爬行效果要优于基于指定查询词的deep web爬行器的爬行效果。 展开更多
关键词 数据库分类 DEEP WEB 爬行器 表单 查询探测
原文传递
CNMARC数据库分类检索语言应用之弱化及对策述略 被引量:5
9
作者 王利民 《图书情报工作》 CSSCI 北大核心 2001年第5期42-44,34,共4页
针对CNMARC数据库建设中分类检索语言应用的若干弱化现象进行分析,并从6个方面提出应对措施。
关键词 分类检索语言 CNMARC 数据库分类标引 机读目录数据 质量控制 弱化现象 《中图法》 完善
原文传递
云计算中基于Session和内容等级的数据库请求分类算法 被引量:4
10
作者 赵涓涓 刘涛 +1 位作者 强彦 卢军佐 《计算机科学》 CSCD 北大核心 2013年第2期177-179,共3页
云计算是当今世界IT行业的研究热点,在云计算实例中存在各种各样的用户对于数据库的请求,并且这些请求是海量的,如果不对这些数据库请求进行合理的分类,必然会对系统的性能造成很大的影响。如何对这些请求进行分类以达到Web QoS的标准,... 云计算是当今世界IT行业的研究热点,在云计算实例中存在各种各样的用户对于数据库的请求,并且这些请求是海量的,如果不对这些数据库请求进行合理的分类,必然会对系统的性能造成很大的影响。如何对这些请求进行分类以达到Web QoS的标准,是云计算研究的一大难点和关键点。原来基于先来先服务的请求模式不仅不能满足客户优先级的要求,不能达到利益的最大化,而且不能使服务资源得到充分利用。因此,提出了基于Session和内容等级的数据库请求分类算法,该算法提出了基于Session和内容等级的性能函数,充分考虑了客户的优先级,使得优先级高的客户的请求优先得到服务资源;而对于优先级较低的请求,由于在算法中加入了时间函数,其优先级会随着等待时间的加长而变成优先级较高的请求,从而也会得到处理,不至于无限期地等待。因此,该算法既保证了优先级高的请求优先得到处理,又保证了优先级低的请求不至于由于优先级较低而得不到处理,是一种动态的数据库自适应的数据库请求分类。 展开更多
关键词 云计算 SESSION 内容等级 数据库请求分类 数据库自适应
下载PDF
一种基于聚类的多数据库分类方法设计 被引量:1
11
作者 曹慧 《网络安全技术与应用》 2010年第6期79-81,共3页
多数据库挖掘最常用的方法是先将多数据库进行分类,然后对每个类进行单独挖掘,最后将各个类中的模式进行集成得到全局模式。这些数据库分类方法都只是针对事务数据库而设计,用两个数据库中共同项集的比例来衡量这两个数据库的相似度,以... 多数据库挖掘最常用的方法是先将多数据库进行分类,然后对每个类进行单独挖掘,最后将各个类中的模式进行集成得到全局模式。这些数据库分类方法都只是针对事务数据库而设计,用两个数据库中共同项集的比例来衡量这两个数据库的相似度,以此来进行数据库分类。本文提出一种基于聚类的数据库分类方法,可以对任何类型的数据库进行分类。 展开更多
关键词 数据库挖掘 数据库分类 聚类
原文传递
色谱柱分类数据库用于指导天然药物化学对照品色谱纯度测定时色谱柱理性选择(英文) 被引量:2
12
作者 王明娟 戴忠 +3 位作者 马双成 金红宇 HOOGMARTENS Jos ADAMS Erwin 《色谱》 CAS CSCD 北大核心 2017年第2期196-202,共7页
由于中药化学对照品多数来源于动植物药材,很容易混有结构类似物,故有机杂质测定是可能影响其化学对照品赋值准确性的关键风险因素。中药化学对照品的有机杂质测定通常采用药典收载或文献报道的高效液相色谱法,这些方法通常仅规定"... 由于中药化学对照品多数来源于动植物药材,很容易混有结构类似物,故有机杂质测定是可能影响其化学对照品赋值准确性的关键风险因素。中药化学对照品的有机杂质测定通常采用药典收载或文献报道的高效液相色谱法,这些方法通常仅规定"以十八烷基硅烷键合硅胶为填充剂",无适宜色谱柱的品牌信息,或者实验室无文献所用的色谱柱品牌,而目前市场上已有800多种品牌的C18柱,生产工艺的不同导致不同品牌C18柱的选择性有差异,甚至差异显著。这很容易出现由于色谱柱选择不适宜而导致测定结果不准确的风险。该文采用国外色谱柱分类数据库指导对照品纯度考察时色谱柱的理性选择,尽可能减少色谱柱盲选可能导致的纯度结果不准确的风险。首先,用数据库挑选2根选择性差异显著的色谱柱(选择性因子F≥6)进行平行实验,以尽可能反映采用不同品牌色谱柱可能出现的分离效果差异。如果这2根色谱柱的分离效果及纯度测定结果无显著性差异,则可以交叉验证该对照品纯度测定的准确性。否则需要从数据库中选择另外1根与之前试验中分离效果更好、选择性相似的色谱柱进行纯度结果验证。在N-反式-p-对香豆酰基酪胺和表儿茶素没食子酸酯首批对照品的纯度考察中,使用了上述策略并验证了其有效性和科学性,计划推广应用至更多的中药化学对照品,特别当其可能含碱性或弱酸性化合物时,更应该尝试采用本文推荐的色谱柱选择策略交叉验证其纯度测定结果的准确性。 展开更多
关键词 中药化学对照品 色谱纯度 色谱柱理性选择策略 色谱柱分类数据库 N-反式-P-对香豆酰基酪胺 表儿茶素没食子酸酯
下载PDF
数据库“路径法”无限级分类节点算法设计与实现
13
作者 吴承辉 《长春工程学院学报(自然科学版)》 2011年第3期118-121,126,共5页
在计算机信息存储操作中,分类对于数据的快速检索和定位发挥至关重要的作用。以MS SQLServer服务器端代码为例,分析在数据库中无限级分类的设计原理,实现算法,并编写存储过程、函数等,直接在服务器端实现此操作过程。数据库服务器端代... 在计算机信息存储操作中,分类对于数据的快速检索和定位发挥至关重要的作用。以MS SQLServer服务器端代码为例,分析在数据库中无限级分类的设计原理,实现算法,并编写存储过程、函数等,直接在服务器端实现此操作过程。数据库服务器端代码具有执行效率高、速度快、耗费资源小等优点,结合"路径法"的算法思想,可以达到较为理想的分类效果。 展开更多
关键词 无限级分类节点算法 数据库分类设计 路径法 存储过程
下载PDF
高校图书馆数据库评估指标体系构建 被引量:3
14
作者 阮建海 何官峰 +3 位作者 阎勇 李春艳 李启任 秦廷伟 《现代情报》 2009年第12期148-151,共4页
在探讨数据库评估现状的基础上,从"用户中心"的视角,将数据库划分为学习型、研究型和学习研究型3种类型。针对这3种类型数据库,提出并构建了适用于高校图书馆的数据库评估指标体系,对数据库评估指标体系中各一级指标从定性和... 在探讨数据库评估现状的基础上,从"用户中心"的视角,将数据库划分为学习型、研究型和学习研究型3种类型。针对这3种类型数据库,提出并构建了适用于高校图书馆的数据库评估指标体系,对数据库评估指标体系中各一级指标从定性和定量两个方面进行了阐释和探讨。 展开更多
关键词 数据库 评估指标体系 数据库分类 用户中心
下载PDF
专题数据库的选题与子库设计 被引量:12
15
作者 王晓燕 《图书馆建设》 北大核心 2002年第6期41-43,共3页
专题数据库建设是党校系统数字图书馆工程的重要任务,本文从用户检索传统专题文献的习惯、路径入手,立足计算机及其互联网的全库技术、整合技术、推进技术、超文本连接技术等的开发和应用,提出了专题数据库建设的选题原则与子库设计的... 专题数据库建设是党校系统数字图书馆工程的重要任务,本文从用户检索传统专题文献的习惯、路径入手,立足计算机及其互联网的全库技术、整合技术、推进技术、超文本连接技术等的开发和应用,提出了专题数据库建设的选题原则与子库设计的思路。 展开更多
关键词 子库设计 数字图书馆 专题数据库 选题原则 数据库分类
下载PDF
数据库信息分类中贝叶斯网络模型的应用
16
作者 李大鹏 胡莹 《山东大学学报(工学版)》 CAS 2004年第5期68-71,共4页
数据库信息分类中 ,朴素贝叶斯分类模型是一种简单而有效的分类方法 ,但它的属性独立性假设使其无法表达属性变量间存在的依赖关系 ,影响了它的分类性能 .而一般贝叶斯网络模型则由于能表达属性变量之间的依赖关系而越来越受到人们的重... 数据库信息分类中 ,朴素贝叶斯分类模型是一种简单而有效的分类方法 ,但它的属性独立性假设使其无法表达属性变量间存在的依赖关系 ,影响了它的分类性能 .而一般贝叶斯网络模型则由于能表达属性变量之间的依赖关系而越来越受到人们的重视 ,但一般贝叶斯网络分类模型结构的学习算法是一个NP完全问题 .本研究在一种简化的贝叶斯网络分类模型的基础上 ,利用其多项式时间复杂度的结构学习算法 ,将其应用于数据库信息分类 ,实现了学习效率和分类精度的一种折衷 .实验结果表明 ,这种分类方法有着比较高的数据库信息文本检索性能 . 展开更多
关键词 数据库信息分类 朴素贝叶斯 贝叶斯定理 依赖关系
下载PDF
数据库数据分类压缩算法研究 被引量:2
17
作者 顾明 《电子测试》 2021年第11期65-66,12,共3页
本文在将数据按照数值、时间戳和质量码进行划分的基础上,以各种数据的特征形态为依据,综合运用包括LZ78和LZW在内的两种LZ系列数据压缩算法完成了本文数据压缩算法的构建,从而使实时数据库数据的压缩质量和效率得以显著提升。
关键词 数据库数据分类 数据特征形态 压缩算法
下载PDF
基于分类模板数据库的电气铭牌识别 被引量:3
18
作者 胡洋 石煌雄 +1 位作者 蒋作 潘文林 《现代电子技术》 2021年第2期96-100,共5页
电气铭牌文本行多,识别难度较大,当前技术均难以实现有效准确的识别。为解决这一问题,提出一种基于分类模板数据库的方法辅助电气铭牌识别。根据电气铭牌文本行分布情况,将识别分为不可变区域和可变区域识别。每类铭牌不可变区域相当于... 电气铭牌文本行多,识别难度较大,当前技术均难以实现有效准确的识别。为解决这一问题,提出一种基于分类模板数据库的方法辅助电气铭牌识别。根据电气铭牌文本行分布情况,将识别分为不可变区域和可变区域识别。每类铭牌不可变区域相当于一张图像,所以将文字识别转化为图像分类问题。通过对不可变区域建立分类模板数据库,引进卷积神经网络对电气铭牌图像进行分类。经实验验证,该方法能准确高效地识别电气铭牌的不可变区域,从而大幅提升了电气铭牌识别的准确度。 展开更多
关键词 电气铭牌识别 分类模板数据库 文本行 文字识别 辅助识别 图像分类
下载PDF
蛋白质结构分类数据库
19
作者 于晓丽 《重庆理工大学学报(自然科学)》 CAS 2010年第11期61-65,共5页
对最具代表性,应用最为广泛的3个结构分类数据库SCOP、CATH、FSSP进行了描述和评价。针对目前的分类数据库普遍存在的不足,介绍了一种基于多结构比对的蛋白质结构分类的方法。
关键词 蛋白质结构数据库 结构分类数据库 多结构比对
下载PDF
建立全国统一标准的ICD-10国际疾病与手术操作分类数据库的构想 被引量:5
20
作者 潘兆石 林月萍 《中国医院统计》 2000年第4期247-248,共2页
关键词 ICD-10国际疾病 手术操作分类数据库 全国统一标准
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部