期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
面向中文文本数据库的信息抽取机制 被引量:2
1
作者 胡金化 胡运发 +1 位作者 周益群 许爱华 《小型微型计算机系统》 CSCD 北大核心 2002年第10期1161-1164,共4页
中文文本文件的句子中常包含有一些有价值的结构化数据 .本文提出了一种针对中文文本结构化信息的抽取机制 :抽取文本中的匹配模式 ,并将抽取后的匹配模式作为匹配模板放入知识库中 ,作为知识库中的规则 .并在此基础上提出了一种面向文... 中文文本文件的句子中常包含有一些有价值的结构化数据 .本文提出了一种针对中文文本结构化信息的抽取机制 :抽取文本中的匹配模式 ,并将抽取后的匹配模式作为匹配模板放入知识库中 ,作为知识库中的规则 .并在此基础上提出了一种面向文本数据库的一种新的信息查询机制 :以知识库中的规则作为基础 ,查询文本数据库中的数据时 ,先在知识库中找相应的规则 (即匹配模板 ) ,然后根据匹配模板在相应的文本数据库中查找相应的数据信息 . 展开更多
关键词 中文文本数据库 信息抽取机制 匹配模板 信息检索 知识库
下载PDF
基于数据分区的DBSCAN算法 被引量:98
2
作者 周水庚 周傲英 曹晶 《计算机研究与发展》 EI CSCD 北大核心 2000年第10期1153-1159,共7页
数据聚类在数据挖掘、模式识别、图像处理和数据压缩等领域有着广泛的应用 .DBSCAN是一种基于密度的空间聚类算法 ,在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点 .但由于直接对数据库进行操作 ,在数据量大的时... 数据聚类在数据挖掘、模式识别、图像处理和数据压缩等领域有着广泛的应用 .DBSCAN是一种基于密度的空间聚类算法 ,在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点 .但由于直接对数据库进行操作 ,在数据量大的时候就需要较多的内存和 I/O开销 ;此外 ,当数据密度和聚类间的距离不均匀时聚类质量较差 .为此 ,在分析 DBSCAN算法不足的基础上 ,提出了一个基于数据分区的 DBSCAN算法 .测试结果表明新算法不仅提高了聚类速度 ,而且改善了聚类质量 . 展开更多
关键词 空间数据库 数据挖掘 数据分区 DBSCAN算法
下载PDF
移动计算环境中数据广播访问时间优化算法 被引量:8
3
作者 孙未未 施伟斌 施伯乐 《小型微型计算机系统》 CSCD 北大核心 2003年第3期577-581,共5页
移动计算是近年来新兴的一个研究热点 ,具有极大的市场潜力和需求 .数据广播是提高移动计算系统可伸缩性的一项重要技术 ,本文对无线移动计算环境中数据广播的平均访问时间优化进行了研究和实验 .首先分析了平均访问时间的理论最小值 ,... 移动计算是近年来新兴的一个研究热点 ,具有极大的市场潜力和需求 .数据广播是提高移动计算系统可伸缩性的一项重要技术 ,本文对无线移动计算环境中数据广播的平均访问时间优化进行了研究和实验 .首先分析了平均访问时间的理论最小值 ,然后提出了向理论最小值逼近的 NASA算法 ,实验表明 NASA算法具有良好的性能 ,优于 展开更多
关键词 移动计算环境 数据广播 访问时间优化算法 无线通信 通信质量
下载PDF
语义异构生物数据源中的数据集成与更新 被引量:7
4
作者 杨森 夏燕 +2 位作者 曹顺良 邓绪斌 朱扬勇 《计算机工程》 CAS CSCD 北大核心 2008年第8期38-40,共3页
针对生物数据源的分布性、异构性和动态性等特性,探讨生物信息技术服务支撑系统整体解决方案,构建基于基因本体的信息集成模式以实现生物语义学上的数据集成。设计一种以半结构化形式规范生物元数据及基于MD5算法的增量更新技术,用以解... 针对生物数据源的分布性、异构性和动态性等特性,探讨生物信息技术服务支撑系统整体解决方案,构建基于基因本体的信息集成模式以实现生物语义学上的数据集成。设计一种以半结构化形式规范生物元数据及基于MD5算法的增量更新技术,用以解决通用扩展性和效率问题,实现生物数据仓库中数据的共享并提高管理效率。 展开更多
关键词 基因本体 半结构化 增量更新 MD5算法
下载PDF
一种基于元数据的分布式数据源定位算法 被引量:1
5
作者 华咤镇 任和 施伯乐 《计算机工程与应用》 CSCD 北大核心 2002年第14期185-187,196,共4页
随着Internet和数字图书馆这两种基础信息资源的大量涌现,用户在检索信息之前,如何选择合适的目标站点来提交查询,从而降低查询代价、提高查询效率,已经成为一个重要任务。这个问题更加一般的说法是“数据源定位”或“数据库发现”。元... 随着Internet和数字图书馆这两种基础信息资源的大量涌现,用户在检索信息之前,如何选择合适的目标站点来提交查询,从而降低查询代价、提高查询效率,已经成为一个重要任务。这个问题更加一般的说法是“数据源定位”或“数据库发现”。元数据是关于数据的数据,数字图书馆中,每个数据文档由其元数据描述,元数据是数字图书馆管理、检索数据以及在各个层面上实现互操作的重要手段。文章提出了一种基于元数据的数据源发现算法,并在召回率、检索精度等方面对这种算法作了评价。 展开更多
关键词 元数据 分布式数据源定位算法 数据库 数字图书馆
下载PDF
SQL差分
6
作者 楼荣生 《计算机应用与软件》 CSCD 2010年第7期136-147,共12页
研究定义在变化中的数据库上的查询。一个查询是一个函数,以数据库表为自变量,也以数据库表作函数值。SQL差分研究自变量变化对查询结果的影响,推导出法则以精确推断因自变量的变化而查询结果应该发生的变化,从而产生了查询差分的概念... 研究定义在变化中的数据库上的查询。一个查询是一个函数,以数据库表为自变量,也以数据库表作函数值。SQL差分研究自变量变化对查询结果的影响,推导出法则以精确推断因自变量的变化而查询结果应该发生的变化,从而产生了查询差分的概念。对构成SQL查询的各种成份如投影、选择、联接、外联接、二元集合运算等分别研究了各自的差分生成规则,也研究了这些成份相互复合所产生的查询的差分构成方法,从而使所得出的方法几乎复盖了当前使用的大部分查询语句。以此为目的,为SQL查询设计了一套完善的代数符号以使对SQL查询进行代数推导成为可能,并据此发现了SQL系统中的许多鲜为人知的代数性质,有助于为SQL构造完整的理论基础以取代关系代数。 展开更多
关键词 数据库变化跟踪 物化视图的增量修改 SQL查询表达式 可重复集合 SQL表的相等及加减法 多维联接和多维表 SQL中的线性运算 SQL代数性质
下载PDF
基于本体的论文管理系统 被引量:3
7
作者 徐骏 刘志洪 顾宁 《计算机工程》 CAS CSCD 北大核心 2004年第6期38-41,共4页
由于用户知识领域的局限性,传统的论文管理系统无法为用户提供全面而高效的关键字查询。该文设计了QOFLoDL本体描述语言,在论文管理系统中引入了用它所描述的本体库,对传统的论文管理系统进行了重新构建,提出一种新的论文管理系统... 由于用户知识领域的局限性,传统的论文管理系统无法为用户提供全面而高效的关键字查询。该文设计了QOFLoDL本体描述语言,在论文管理系统中引入了用它所描述的本体库,对传统的论文管理系统进行了重新构建,提出一种新的论文管理系统——基于本体的论文管理系统(PMSBOO),为用户提供了全面而高效的关键字查询服务。PMSBOO实现了基于知识点的协同学习,通过这种学习方式各个知识领域的用户可以进行知识共享和知识交流从而达到协同学习的目的,很大程度上提高了用户的学习效率。还在PMSBOO中提供了论文大纲提取功能,使用户通过先阅读论文大纲来对论文进行有选择的重点阅读,从而提高了用户的学习效率。 展开更多
关键词 本体 论文管理 协同学习 版本管理
下载PDF
基于事中反馈的信用卡欺诈检测与防控
8
作者 杨森 郭建奎 朱扬勇 《计算机应用与软件》 CSCD 北大核心 2008年第9期154-156,171,共4页
信用卡欺诈活动日益猖獗,如何增强欺诈检测能力来规避持卡客户、商家等的经济损失是电子商务发展中至关重要的问题。给出了一个基于事中反馈的信用卡欺诈检测解决方案,其将数据挖掘技术和反馈控制技术联合运用实现实时欺诈检测及防控,... 信用卡欺诈活动日益猖獗,如何增强欺诈检测能力来规避持卡客户、商家等的经济损失是电子商务发展中至关重要的问题。给出了一个基于事中反馈的信用卡欺诈检测解决方案,其将数据挖掘技术和反馈控制技术联合运用实现实时欺诈检测及防控,以增强欺诈检测能力来减少经济损失。 展开更多
关键词 信用卡欺诈 事中反馈 数据挖掘
下载PDF
一个基于Web资源采样特征的元搜索引擎 被引量:4
9
作者 胡金化 曾海泉 +1 位作者 张川 胡运发 《模式识别与人工智能》 EI CSCD 北大核心 2003年第1期39-45,共7页
随着Internet的快速发展,Web信息量急剧增加,Web信息检索也相应地越来越困难。本文提出利用查询采样、Web资源分类等技术,自动创建类似Yahoo!的分类层次资源特征,建立一个树型的Web资源特征检索系统。由于采样时只需采集同类信息的一部... 随着Internet的快速发展,Web信息量急剧增加,Web信息检索也相应地越来越困难。本文提出利用查询采样、Web资源分类等技术,自动创建类似Yahoo!的分类层次资源特征,建立一个树型的Web资源特征检索系统。由于采样时只需采集同类信息的一部分,避免了全部采集带来的大量物力浪费。利用创建的资源特征,在检索时选择需要的资源。然后再利用互操作机制,远程调用该资源的全文索引机制进行检索,提高了检索的查全率和查准率。同时由于要检索的Web资源特征是通过选择相关和抛弃不太相关的Web资源,也提高了查询的效率。 展开更多
关键词 Web 资源采样特征 元搜索引擎 WWW Internet 信息资源 信息服务网站 信息检索
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部