-
题名面向中文文本数据库的信息抽取机制
被引量:2
- 1
-
-
作者
胡金化
胡运发
周益群
许爱华
-
机构
复旦大学计算机科学与信息技术系上海(国际)数据库研究中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2002年第10期1161-1164,共4页
-
基金
国家自然科学基金资助项目电子图书馆的相关关键技术 ( 6 99330 10 )的资助
-
文摘
中文文本文件的句子中常包含有一些有价值的结构化数据 .本文提出了一种针对中文文本结构化信息的抽取机制 :抽取文本中的匹配模式 ,并将抽取后的匹配模式作为匹配模板放入知识库中 ,作为知识库中的规则 .并在此基础上提出了一种面向文本数据库的一种新的信息查询机制 :以知识库中的规则作为基础 ,查询文本数据库中的数据时 ,先在知识库中找相应的规则 (即匹配模板 ) ,然后根据匹配模板在相应的文本数据库中查找相应的数据信息 .
-
关键词
中文文本数据库
信息抽取机制
匹配模板
信息检索
知识库
-
Keywords
information extracting
pattern template
information retrieval
knowledge base
Chinese text database
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名基于数据分区的DBSCAN算法
被引量:98
- 2
-
-
作者
周水庚
周傲英
曹晶
-
机构
复旦大学计算机科学系
上海(国际)数据库研究中心上海
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2000年第10期1153-1159,共7页
-
基金
国家自然科学基金!(项目编号 6 9743 0 0 1)
国家教委博士点基金
-
文摘
数据聚类在数据挖掘、模式识别、图像处理和数据压缩等领域有着广泛的应用 .DBSCAN是一种基于密度的空间聚类算法 ,在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点 .但由于直接对数据库进行操作 ,在数据量大的时候就需要较多的内存和 I/O开销 ;此外 ,当数据密度和聚类间的距离不均匀时聚类质量较差 .为此 ,在分析 DBSCAN算法不足的基础上 ,提出了一个基于数据分区的 DBSCAN算法 .测试结果表明新算法不仅提高了聚类速度 ,而且改善了聚类质量 .
-
关键词
空间数据库
数据挖掘
数据分区
DBSCAN算法
-
Keywords
spatial database, data mining, clustering, data partitioning, DBSCAN algorithm
-
分类号
TP311.132
[自动化与计算机技术—计算机软件与理论]
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名移动计算环境中数据广播访问时间优化算法
被引量:8
- 3
-
-
作者
孙未未
施伟斌
施伯乐
-
机构
复旦大学计算机与信息技术系上海(国际)数据库研究中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2003年第3期577-581,共5页
-
基金
国家自然科学基金 (6993 3 0 10 )资助
-
文摘
移动计算是近年来新兴的一个研究热点 ,具有极大的市场潜力和需求 .数据广播是提高移动计算系统可伸缩性的一项重要技术 ,本文对无线移动计算环境中数据广播的平均访问时间优化进行了研究和实验 .首先分析了平均访问时间的理论最小值 ,然后提出了向理论最小值逼近的 NASA算法 ,实验表明 NASA算法具有良好的性能 ,优于
-
关键词
移动计算环境
数据广播
访问时间优化算法
无线通信
通信质量
-
Keywords
mobile computing
data broadcast
access time
-
分类号
TN929.5
[电子电信—通信与信息系统]
TN934.2
[电子电信—信号与信息处理]
-
-
题名语义异构生物数据源中的数据集成与更新
被引量:7
- 4
-
-
作者
杨森
夏燕
曹顺良
邓绪斌
朱扬勇
-
机构
复旦大学上海(国际)数据库研究中心
上海生物信息技术研究中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第8期38-40,共3页
-
基金
国家自然科学基金资助项目(60573093)
上海市重大科技项目(02DJ14013)
-
文摘
针对生物数据源的分布性、异构性和动态性等特性,探讨生物信息技术服务支撑系统整体解决方案,构建基于基因本体的信息集成模式以实现生物语义学上的数据集成。设计一种以半结构化形式规范生物元数据及基于MD5算法的增量更新技术,用以解决通用扩展性和效率问题,实现生物数据仓库中数据的共享并提高管理效率。
-
关键词
基因本体
半结构化
增量更新
MD5算法
-
Keywords
Gene Ontology(GO)
semi-structured
incremental update
MD5 algorithm
-
分类号
N945
[自然科学总论—系统科学]
-
-
题名一种基于元数据的分布式数据源定位算法
被引量:1
- 5
-
-
作者
华咤镇
任和
施伯乐
-
机构
复旦大学上海(国际)数据库研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第14期185-187,196,共4页
-
基金
国家自然科学基金资助
项目名称<电子图书馆相关关键技术>(批准号:69933010)
-
文摘
随着Internet和数字图书馆这两种基础信息资源的大量涌现,用户在检索信息之前,如何选择合适的目标站点来提交查询,从而降低查询代价、提高查询效率,已经成为一个重要任务。这个问题更加一般的说法是“数据源定位”或“数据库发现”。元数据是关于数据的数据,数字图书馆中,每个数据文档由其元数据描述,元数据是数字图书馆管理、检索数据以及在各个层面上实现互操作的重要手段。文章提出了一种基于元数据的数据源发现算法,并在召回率、检索精度等方面对这种算法作了评价。
-
关键词
元数据
分布式数据源定位算法
数据库
数字图书馆
-
Keywords
Digital Library,Source Discovery,Metadata,Vector Space Retrieval
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
G250.76
[文化科学—图书馆学]
-
-
题名信息网络挖掘与分析——机遇与挑战
被引量:5
- 6
-
-
作者
施伯乐
汪卫
肖仰华
-
机构
复旦大学
上海(国际)数据库研究中心
复旦大学计算机科学技术学院
复旦大学计算机技术学院
-
出处
《软件产业与工程》
2010年第4期16-21,共6页
-
文摘
人类社会进入21世纪以来,科学技术的飞速发展使得各类实体得以普遍互联,从而构成大量的信息网络数据。当前,人类社会正在经历的技术变革、战争模式变革以及科学研究的进一步深化都对——组织、管理、挖掘与分析相关领域不断涌现的信息网络数据——提出了强烈的需求。在这一背景下,本文提出了信息网络挖掘与分析这一问题,并系统探讨了其学术价值;探讨其对于进一步改善舆论安全、国民经济、现代信息服务业所提供的全新机遇;深入分析了这一研究的开展所面临的严峻挑战。
-
关键词
信息服务业
网络挖掘
人类社会
网络数据
科学技术
技术变革
科学研究
战争模式
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名SQL差分
- 7
-
-
作者
楼荣生
-
机构
复旦大学上海(国际)数据库研究中心
-
出处
《计算机应用与软件》
CSCD
2010年第7期136-147,共12页
-
文摘
研究定义在变化中的数据库上的查询。一个查询是一个函数,以数据库表为自变量,也以数据库表作函数值。SQL差分研究自变量变化对查询结果的影响,推导出法则以精确推断因自变量的变化而查询结果应该发生的变化,从而产生了查询差分的概念。对构成SQL查询的各种成份如投影、选择、联接、外联接、二元集合运算等分别研究了各自的差分生成规则,也研究了这些成份相互复合所产生的查询的差分构成方法,从而使所得出的方法几乎复盖了当前使用的大部分查询语句。以此为目的,为SQL查询设计了一套完善的代数符号以使对SQL查询进行代数推导成为可能,并据此发现了SQL系统中的许多鲜为人知的代数性质,有助于为SQL构造完整的理论基础以取代关系代数。
-
关键词
数据库变化跟踪
物化视图的增量修改
SQL查询表达式
可重复集合
SQL表的相等及加减法
多维联接和多维表
SQL中的线性运算
SQL代数性质
-
Keywords
Tracking changes in DB Incremental update of materialized view SQL query expression Repeatable set Equality and addition and subtraction of SQL tables Multi-dimension join and multi-dimension table Linear operations in SQL SQL's algebra properties
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名梯级水电站建设决策支持系统
- 8
-
-
作者
孙星明
-
机构
复旦大学计算机系
国际数据库研究中心
-
出处
《计算机应用》
CSCD
1999年第3期43-44,共2页
-
文摘
本文讨论了水电站投资决策支持系统中的关键技术,即确定一条河流上各待建电站的最优建设顺序的算法,同时指出了本决策支持系统对其他建设项目也适用。
-
关键词
梯级水电站
决策支持系统
算法
-
分类号
TV74
[水利工程—水利水电工程]
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名基于本体的论文管理系统
被引量:3
- 9
-
-
作者
徐骏
刘志洪
顾宁
-
机构
复旦大学计算机与信息技术系上海(国际)数据库研究中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第6期38-41,共4页
-
基金
国家自然科学基金资助项目:"基于本体的协同学习关键技术研究"(60173028)
IBM共享大学研究SUR项目:"协同学习平台及应用"
-
文摘
由于用户知识领域的局限性,传统的论文管理系统无法为用户提供全面而高效的关键字查询。该文设计了QOFLoDL本体描述语言,在论文管理系统中引入了用它所描述的本体库,对传统的论文管理系统进行了重新构建,提出一种新的论文管理系统——基于本体的论文管理系统(PMSBOO),为用户提供了全面而高效的关键字查询服务。PMSBOO实现了基于知识点的协同学习,通过这种学习方式各个知识领域的用户可以进行知识共享和知识交流从而达到协同学习的目的,很大程度上提高了用户的学习效率。还在PMSBOO中提供了论文大纲提取功能,使用户通过先阅读论文大纲来对论文进行有选择的重点阅读,从而提高了用户的学习效率。
-
关键词
本体
论文管理
协同学习
版本管理
-
Keywords
Ontology
Paper management
Cooperative learning
Edition management
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于事中反馈的信用卡欺诈检测与防控
- 10
-
-
作者
杨森
郭建奎
朱扬勇
-
机构
复旦大学上海(国际)数据库研究中心
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第9期154-156,171,共4页
-
文摘
信用卡欺诈活动日益猖獗,如何增强欺诈检测能力来规避持卡客户、商家等的经济损失是电子商务发展中至关重要的问题。给出了一个基于事中反馈的信用卡欺诈检测解决方案,其将数据挖掘技术和反馈控制技术联合运用实现实时欺诈检测及防控,以增强欺诈检测能力来减少经济损失。
-
关键词
信用卡欺诈
事中反馈
数据挖掘
-
Keywords
Credit card fraud Concurrent feedback Data mining
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TH693.4
[机械工程—机械制造及自动化]
-
-
题名一个基于Web资源采样特征的元搜索引擎
被引量:4
- 11
-
-
作者
胡金化
曾海泉
张川
胡运发
-
机构
复旦大学计算机与信息技术系上海(国际)数据库研究中心
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2003年第1期39-45,共7页
-
基金
国家自然科学基金资助项目(No.60173027)
-
文摘
随着Internet的快速发展,Web信息量急剧增加,Web信息检索也相应地越来越困难。本文提出利用查询采样、Web资源分类等技术,自动创建类似Yahoo!的分类层次资源特征,建立一个树型的Web资源特征检索系统。由于采样时只需采集同类信息的一部分,避免了全部采集带来的大量物力浪费。利用创建的资源特征,在检索时选择需要的资源。然后再利用互操作机制,远程调用该资源的全文索引机制进行检索,提高了检索的查全率和查准率。同时由于要检索的Web资源特征是通过选择相关和抛弃不太相关的Web资源,也提高了查询的效率。
-
关键词
Web
资源采样特征
元搜索引擎
WWW
Internet
信息资源
信息服务网站
信息检索
-
Keywords
Web Resource Trait, Query-Based Sampling, Interoperability, Meta Search Engine, Resource Classification
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
-