期刊文献+
共找到250篇文章
< 1 2 13 >
每页显示 20 50 100
Web使用模式研究中的数据挖掘 被引量:55
1
作者 张娥 冯秋红 +1 位作者 宣慧玉 田增瑞 《计算机应用研究》 CSCD 北大核心 2001年第3期80-83,共4页
Web使用模式挖掘是利用Web使用数据的高级手段,是对Web使用数据的深层次分析,从而挖掘出有效的、新颖的、潜在的、有用的及最终可以理解的知识,以帮助管理决策。综述了Web使用模式的数据挖掘研究技术的内容、现状和研究的方向。
关键词 数据挖掘 事务数据库 WEB 用户访问模式 INTERNET
下载PDF
元搜索引擎中检索结果排序的优化方法 被引量:10
2
作者 文坤梅 卢正鼎 +1 位作者 陈莉 邓曦 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第3期49-51,共3页
提出了一种新的基于概率模型的排序优化方法 .利用贝叶斯规则 ,结合各组成系统平均执行性能的信息 ,推导出一种新的相关度计算公式 ,较好地解决了结果融合中相关度规范化和均衡化的问题 .经实验验证 ,该方法对结果进行了最优化排序 ,其... 提出了一种新的基于概率模型的排序优化方法 .利用贝叶斯规则 ,结合各组成系统平均执行性能的信息 ,推导出一种新的相关度计算公式 ,较好地解决了结果融合中相关度规范化和均衡化的问题 .经实验验证 ,该方法对结果进行了最优化排序 ,其实际执行性能超出了现有的任何一个组成系统的性能 . 展开更多
关键词 元搜索引擎 概率模型 结果优化排序 排序融合
下载PDF
不产生候选的快速投影频繁模式树挖掘算法 被引量:11
3
作者 何炎祥 向剑文 +1 位作者 朱骁峰 孔维强 《计算机科学》 CSCD 北大核心 2002年第11期71-75,共5页
Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especia... Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especially when there exist prolific patterns and/or long patterns.In this study, we introduce a novel frequent pattern growth (FP-growth)method, which is efficient and scalable for mining both long and short frequent patterns without candidate generation. And build a new project frequent pattern growth (PFP-tree)algorithm on this study, which not only heirs all the advantages in the FP-growth method, but also avoids it's bottleneck in database size dependence. So increase algorithm's scalability efficiently. 展开更多
关键词 事务数据库 快速投影频繁模式树挖掘算法 数据挖掘 频繁项集
下载PDF
一种全新的全文索引模型——后继数组模型 被引量:11
4
作者 刘学文 陶晓鹏 +1 位作者 于玉 胡运发 《软件学报》 EI CSCD 北大核心 2002年第1期150-158,共9页
提出了一种新的全文索引模型——后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.
关键词 全文索引模型 后继数组模型 文本数据库 数据模型
下载PDF
XML与Web数据集成及技术实现 被引量:15
5
作者 周彦晖 邹显春 张为群 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第3期255-259,共5页
由于HTML缺乏规范的数据表达能力 ,基于Web的数据集成往往很困难 .要使存在于Web上的数量巨大的数据易于共享、处理 ,利用XML (eXtensibleMarkupLanguage)技术可以很好地实现 .现有的XML技术包括XML解析器、文档对象模型、XSL等都可以... 由于HTML缺乏规范的数据表达能力 ,基于Web的数据集成往往很困难 .要使存在于Web上的数量巨大的数据易于共享、处理 ,利用XML (eXtensibleMarkupLanguage)技术可以很好地实现 .现有的XML技术包括XML解析器、文档对象模型、XSL等都可以很好地应用到各种平台下的Web应用程序中 。 展开更多
关键词 数据集成 可扩展标注语言 万维网 文档对象模型
下载PDF
全文索引的研究 被引量:10
6
作者 徐小刚 王俊杰 于玉 《计算机工程》 CAS CSCD 北大核心 2002年第2期101-103,共3页
在倒排表模型的基础上,从加快索引创建速度和改进索引动态结构两个方面着手,提出并实现了一种高效的索引创建算法和相应的索引模型,经过测试,新系统的索引创建速度可以和数据复制速度相提并论。而在空间效率上,也得到了一定程度的提高。
关键词 全文索引 倒排表模型 Pat数组 文本数据库 研究
下载PDF
基于HTML模式代数的Web信息提取方法 被引量:8
7
作者 李石君 于俊清 欧伟杰 《计算机研究与发展》 EI CSCD 北大核心 2006年第9期1644-1650,共7页
高效地生成提取Web信息的包装器有着广阔的应用前景,同时也是至今没有得到有效解决的难题.为此,提出了基于HTML文档的模式代数,该代数包括一致模式集等重要概念以及模式的加法运算.在此基础上,提出了一种提取Web信息的新方法,该方法采... 高效地生成提取Web信息的包装器有着广阔的应用前景,同时也是至今没有得到有效解决的难题.为此,提出了基于HTML文档的模式代数,该代数包括一致模式集等重要概念以及模式的加法运算.在此基础上,提出了一种提取Web信息的新方法,该方法采用在整个训练例子中学习表示各属性提取规则的一致模式集,再由多个模式组成的一致模式集提取数据,适用于提取具有缺省属性、多值属性、属性具有多种不同顺序的表结构网页和层次结构网页,其有效性在原型系统中通过实验得到验证. 展开更多
关键词 WEB信息提取 包装器归纳学习 WEB挖掘
下载PDF
基于Web的时间序列模式挖掘 被引量:7
8
作者 陈才扣 金远平 《计算机应用研究》 CSCD 2000年第7期32-33,共2页
序列模式挖掘是数据挖掘的重要研究课题之一,将其应用于Web环境具有重要意义。论述了Web时间序列模式挖掘问题,并给出了一种Web时间序列模式挖掘的有效算法。
关键词 数据挖掘 WEB 时间序列模式 事务数据库
下载PDF
搜索引擎指标综合特性的评价 被引量:4
9
作者 吴胜利 谭延之 施化吉 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期181-186,214,共7页
对搜索引擎的检索性能进行评价是信息检索的一个重要方面,目前已经提出和使用许多各有特色的评价指标.对于如何选择出综合特性最优的评价指标,需要准确、可靠的判断方法.文中提出基于t检验的方法,并使用该方法对5种常用的评价指标进行... 对搜索引擎的检索性能进行评价是信息检索的一个重要方面,目前已经提出和使用许多各有特色的评价指标.对于如何选择出综合特性最优的评价指标,需要准确、可靠的判断方法.文中提出基于t检验的方法,并使用该方法对5种常用的评价指标进行了试验研究,包括平均查准率(average precision,AP)、前10个文档的查准率(precision at 10 document level,P@10)、可查全水平查准率(recall-level precision,RP)、第1位相关文档的倒数(reciprocal ranking,RR)、规范化带折扣的累积收益(normalized discounted cumulative gain,NDCG).结果表明NDCG的综合特性最好,其次是AP,然后是RP和P@10,RR最差.对于任意2个评价指标所提出的方法可以给出定量的比较结果. 展开更多
关键词 搜索引擎 检索性能 评价指标 稳定性 敏感性
下载PDF
基于ActiveX文档的Web数据库应用程序技术 被引量:4
10
作者 王聪华 崔进平 《计算机应用研究》 CSCD 北大核心 2004年第11期291-293,共3页
介绍了ActiveX文档技术,阐述了基于ActiveX文档的Web数据库应用程序的运行模式及在客户端运行的必备条件,并以实例说明了ActiveX文档数据库应用程序的开发方法。
关键词 ACTIVEX文档 WEB数据库 VB 注册DLL
下载PDF
大型事务数据库中的一种快速的规则挖掘算法 被引量:4
11
作者 朱玉全 孙志挥 《计算机科学》 CSCD 北大核心 2002年第10期59-60,69,共3页
1 引言数据挖掘(Data Mining),也称为数据库中知识发现KDD,是指发掘隐藏在堆积如山的数据中的真知灼见,这基本上正在变成一种商业上非做不可的事情。关联规则(As-sociation Rules)是数据挖掘的重要研究内容,目前的绝大部分关联规则挖掘... 1 引言数据挖掘(Data Mining),也称为数据库中知识发现KDD,是指发掘隐藏在堆积如山的数据中的真知灼见,这基本上正在变成一种商业上非做不可的事情。关联规则(As-sociation Rules)是数据挖掘的重要研究内容,目前的绝大部分关联规则挖掘算法一般都分为两个阶段:①频繁项目集的发现;②规则的产生。算法的计算工作量主要集中在第一阶段上,因此,如何快速确定频繁项目集是算法效率的关键,在这方面已有许多工作与成果。但总的来讲,许多研究都是在Apriori算法或其派生算法的基础上进行的。这些算法或多或少存在如下两个问题:①算法必须耗费大量的时间处理规模巨大的候选项目集; 展开更多
关键词 大型事务数据库 规则挖掘算法 数据挖掘 知识发现
下载PDF
改进的向量质心模型在实时信息检索中的应用研究 被引量:2
12
作者 刘绍翰 王箭 黄志球 《计算机应用与软件》 CSCD 2011年第10期62-64,76,共4页
将相关反馈技术应用于信息检索中可以学习和明确用户的信息需求,并对检索结果进行信息过滤,是提高信息检索效果的有效手段之一。除了准确率和召回率之外,过滤算法的适应性、速度也直接影响用户使用信息检索系统的体验。采用向量空间模... 将相关反馈技术应用于信息检索中可以学习和明确用户的信息需求,并对检索结果进行信息过滤,是提高信息检索效果的有效手段之一。除了准确率和召回率之外,过滤算法的适应性、速度也直接影响用户使用信息检索系统的体验。采用向量空间模型表示文档的内容预处理工作少,计算简单,适用于实时信息检索。结合偏差最小的基本原理,将改进的反馈文档向量的质心应用于信息重排。以重排的应用场景,在TREC Filtering Task数据集上进行仿真,并与基于关键词检索和类质心的检索方式进行了试验比较。 展开更多
关键词 信息检索 信息过滤 相关反馈 质心分类器 向量空间模型
下载PDF
集成搜索引擎中结果排序的优化分析 被引量:3
13
作者 李永平 文坤梅 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第11期28-30,共3页
在充分理解相关度概念的基础上 ,提出了一种基于权值的结果优化排序方法 ,综合考虑用户需求 ,包括兴趣权值、人数权值和位置权值 ,并采用固定容量的网页索取模式 ,实现了一个小型集成搜索引擎的原型系统 ,对结果进行了优化排序 .经实验... 在充分理解相关度概念的基础上 ,提出了一种基于权值的结果优化排序方法 ,综合考虑用户需求 ,包括兴趣权值、人数权值和位置权值 ,并采用固定容量的网页索取模式 ,实现了一个小型集成搜索引擎的原型系统 ,对结果进行了优化排序 .经实验验证 ,其执行性能效果较好 . 展开更多
关键词 集成搜索引擎 相关性 优化排序 权值
下载PDF
基于实时数据库和XML的企业信息共享平台的研究 被引量:18
14
作者 杨徽 王汝琳 +1 位作者 齐莹素 张丽 《微计算机信息》 2004年第9期101-103,共3页
本文针对工业企业信息系统依赖于多个不同功能的子系统,而各个子系统之间的传统的数据交换方式没有一个统一的标准,造成接口众多、访问性、安全性差等多方面的结局,从而形成了一个个的“信息孤岛”,在这样的技术应用背景下,本文在对实... 本文针对工业企业信息系统依赖于多个不同功能的子系统,而各个子系统之间的传统的数据交换方式没有一个统一的标准,造成接口众多、访问性、安全性差等多方面的结局,从而形成了一个个的“信息孤岛”,在这样的技术应用背景下,本文在对实时数据库和XML技术研究的基础上,实现基于三层结构和XML的企业信息共享平台,将各个子系统的数据取出,并采用统一的数据描述格式,采用集中、共享的方式提供给企业内部的各个部门,建立起一个控制层到管理层的“桥梁”,使数据的上传与下行之路畅通无阻,为企业提供良好的数据服务环境。 展开更多
关键词 实时数据库 OPC XML SOAP WEB SERVICES
下载PDF
基于遗传算法的针灸处方寻优设计 被引量:4
15
作者 高燕 任玉兰 +1 位作者 周小平 梁繁荣 《成都信息工程学院学报》 2012年第5期449-452,共4页
几千年来针灸处方数据的积累,为现代医务工作者提供了丰富的针灸临床经验,但是,如何借鉴海量的针灸处方生成有价值、最优的针灸处方,则是现代针灸学致力于研究的重点。搜集了跨度几千年的大部分针灸处方数据,在对其进行结构化的基础上,... 几千年来针灸处方数据的积累,为现代医务工作者提供了丰富的针灸临床经验,但是,如何借鉴海量的针灸处方生成有价值、最优的针灸处方,则是现代针灸学致力于研究的重点。搜集了跨度几千年的大部分针灸处方数据,在对其进行结构化的基础上,利用遗传算法的思想对每一朝代单独聚类产生各自的适应度函数,然后再对各个朝代的适应度函数按其权重组合形成总的适应度函数,最终通过适应度函数取值的高低获得优化后的针灸处方。将算法用于开发针灸处方决策支持系统,经临床实践,其寻优结果具有较高的适用价值。 展开更多
关键词 计算机软件与理论 数据挖掘 遗传算法 针灸处方 基因编码 聚类算法 适应度函数
下载PDF
Apriori算法强项集产生的二维哈希算法 被引量:6
16
作者 何小卫 《计算机与现代化》 2003年第4期10-12,共3页
从大型事务数据库中发现关联规则是KDD中的一个重要课题,而如何求得强项集又是关联规则发现的核心问题,特别是低阶强项集求解的方法决定了整个规则发现算法的性能和速度,本文提出的二维哈希算法能较快速地求得低阶强项集,特别是在产生... 从大型事务数据库中发现关联规则是KDD中的一个重要课题,而如何求得强项集又是关联规则发现的核心问题,特别是低阶强项集求解的方法决定了整个规则发现算法的性能和速度,本文提出的二维哈希算法能较快速地求得低阶强项集,特别是在产生一阶强项集扫描数据库的同时进行二维哈希投影,有利于迅速产生二阶强项集,从而大幅度地提高强项集产生的效率。 展开更多
关键词 事务数据库 APRIORI算法 关联规则 二维哈希算法 强项集产生
下载PDF
基于XML的异构数据库集成中间件 被引量:3
17
作者 吴启明 易云飞 《河池学院学报》 2007年第5期43-46,共4页
通过实现关系数据到XML数据的转化、集成,实现了基于XML的异构数据库集成中间件解决方案。该中间件为数据共享、发布和应用以及对集成信息的访问提供了底层支持。
关键词 XML 数据库 中间件
下载PDF
网络数据库系统开发中JDBC的应用 被引量:6
18
作者 赖碧云 李小丹 章少强 《现代计算机》 2003年第1期76-79,共4页
本文首先探讨了JDBC技术支持和应用方法,然后结合实际经验,利用Java语言的平台无关性和动态性,通过JDBC进行网络数据库应用系统开发,并给出了相应的程序语句。
关键词 网络数据库系统 开发 JDBC 数据库管理系统
下载PDF
基于本体的零件库信息模型
19
作者 陈静 邓立华 +2 位作者 成阳 刘黎 龚志伟 《桂林理工大学学报》 CAS 北大核心 2011年第4期600-603,共4页
零件库是企业产品开发设计过程中积累的大量信息和知识的集合,研究零件库信息的表达对于企业资源利用具有重要意义。在分析零件库信息的内容和组织的基础上,根据GB/T 17645.42标准对零件库进行分类,构建基于本体的零件库信息模型。通过... 零件库是企业产品开发设计过程中积累的大量信息和知识的集合,研究零件库信息的表达对于企业资源利用具有重要意义。在分析零件库信息的内容和组织的基础上,根据GB/T 17645.42标准对零件库进行分类,构建基于本体的零件库信息模型。通过基于本体的零件库信息的语义表达,降低零件库信息冗余度,优化零件库信息的表达,同时本体的语义信息给零件库信息的检索和重用提供了基础模型,最后给出了以OWL语言表达的零件本体和实例。 展开更多
关键词 零件库 事物特性表 本体 信息模型
下载PDF
超媒体系统中的语义约束问题研究
20
作者 周学海 李曦 +2 位作者 龚育昌 李光亚 赵振西 《中国科学技术大学学报》 CAS CSCD 北大核心 2000年第5期538-547,共10页
提出了一种基于数据库模式的超媒体语义网络模型 ,该模型通过引入模式约束图 ,对超媒体系统中的关系约束进行了分类 ,并给出了相应的约束检测算法 ;通过引入视图机制提出了结构约束的概念 ;通过扩充模式约束图的属性 ,描述了超媒体特定... 提出了一种基于数据库模式的超媒体语义网络模型 ,该模型通过引入模式约束图 ,对超媒体系统中的关系约束进行了分类 ,并给出了相应的约束检测算法 ;通过引入视图机制提出了结构约束的概念 ;通过扩充模式约束图的属性 ,描述了超媒体特定应用领域的计算约束 ,从而从整体上对与应用领域无关至特定应用领域的语义约束进行了深入的研究 . 展开更多
关键词 语义约束 数据库模式 超媒体系统
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部