基于数据网格的书法字k近邻查询被引量：3

Answering k-NN Query of Chinese Calligraphic Character Based on Data Grid

下载PDF

导出

摘要提出一种在数据网格环境下的书法字k近邻查询方法.当用户在查询结点提交一个查询书法字和k时,首先以一个较小的查询半径,在数据结点进行基于混合距离尺度的书法字过滤,然后将过滤后的候选书法字以“打包”传输的方式发送到执行结点,在执行结点并行地对这些候选书法字进行距离(求精)运算,最终将结果书法字返回到查询结点.当返回的书法字个数小于k时,扩大半径值,继续循环,直到得到k个最近邻书法字为止.理论分析和实验表明,该方法在减少网络通信开销、增加I/O和CPU并行、降低响应时间方面具有较好的性能. In this paper, a novel k-Nearest Neighbor （k-NN） query over the Chinese calligraphic character databases based on Data Grid is proposed. First when user in the query node submits a query character and k, the character filtering algorithm is performed using the hybrid distance metric （HDM） index. Then the candidate characters are transferred to the executing nodes in a package mode. Furthermore, the refinement process of the candidate characters is conducted in parallelism to get the answer set. Finally, the answer set is transferred to the query node. If the number of answer set is less than k, then the query procedure is re-performed by increasing the query radius until the k nearest neighbor characters are obtained. The analysis and experimental results show that the performance of the algorithm is good in minimizing the response time by decreasing network transfer cost and increasing parallelism of I/O and CPU.

作者庄毅庄越挺吴飞

机构地区浙江大学计算机科学与技术学院

出处《软件学报》 EI CSCD 北大核心 2006年第11期2289-2301,共13页 Journal of Software

基金国家自然科学基金No.60533090 国家杰出青年基金No.60525108 高等学校中英文图书数字化国际合作计划~~

关键词中文书法字 K近邻查询类超球数据网格 Chinese calligraphic character k-nearest neighbor query cluster hypersphere data grid

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1施伯乐,张亮,王勇,陈智峰.基于视觉相似性的中文古籍内容检索方法[J].软件学报,2001,12(9):1336-1342. 被引量：10
2杨东华,李建中,张文平.基于数据网格环境的连接操作算法[J].计算机研究与发展,2004,41(10):1848-1855. 被引量：8

二级参考文献11

1张炘中.计算机汉字识别技术[J].语文建设,1992(10):34-38. 被引量：5
2I Foster, C Kcsselrnan. The Grid: Blueprint for a New Computing Infrastructure. San Francisco, CA: Morgan Kaufmann, 1998
3A Chervenak, I Foster, C Kesselman, et al. The data grid:Towards an architecture for the distributed management and analysis of large scientific datasets. Journal of Network and Computer Applications, 2001, 23:187～200
4Wolfgang Hoschek, Javier Jaen Martinez, Asad Samar, et al.Data management in an international data grid project. In: Proc of the 1st IEEE/ACM Int'l Workshop on Grid Computing. Berlin:Springer-Verlag, 2000. 17～20
5B Segal. Grid Computing: The European data grid project. The 2000 IEEE Nuclear Science Symposium and Medical Imaging Conference, Lyon, France, 2000
6Heinz Stockinger. Distributed database management systems and the data grid. The 18th IEEE Symp on Mass Storage Systems and the 9th NASA Goddard Conference on Mass Storage Systems and Technologies, San Diego, CA, 2001
7J Smith, A Gounaris, P Watson, et al. Distributed query processing on the grid. In: Proc of the 3rd Int'l Workshop on Grid Computing. Berlin: Springer-Verlag, 2002. 279～290
8M Nedim Alpdemir, Arijit Mukherjee, Norman W Paton, et al.Service-based distributed querying on the grid. UK e-Science Programme All Hands Conference, Nottinghan, UK, 2003
9Z Ives, D Florescu, M Friedman, et al. An adaptive query execution system for data integration. In: Proc of the 1999 ACM SIGMOD Int'l Conf on Management of Data. New York: ACM Press, 1999. 299～310
10Nick Roussopoulos, Hyunchul Kang. A pipeline n-way join algorithm based on the 2-way semijoin program. IEEE Trans on Knowledge and Data Engineering, 1991, 3(4): 486～495

共引文献16

1刘莉,张亮,张琪,周向东,施伯乐.相关反馈在古籍页面图像内容检索中的应用[J].计算机工程,2003,29(z1):10-12.
2章夏芬,庄越挺,鲁伟明,吴飞.根据形状相似性的书法内容检索[J].计算机辅助设计与图形学学报,2005,17(11):2565-2569. 被引量：12
3石柯,林海华,徐彬.AnyQuery:网格环境下基于服务的分布式查询处理系统[J].小型微型计算机系统,2006,27(8):1432-1438. 被引量：6
4申德荣,于戈,聂铁铮,寇月.支持多领域动态数据集成的数据库网格系统[J].软件学报,2006,17(11):2302-2313. 被引量：10
5庄毅,庄越挺,吴飞.基于数据网格环境的k近邻查询[J].计算机研究与发展,2006,43(11):1876-1885.
6庄毅,庄越挺,吴飞.基于混合距离树的海量书法字索引[J].计算机辅助设计与图形学学报,2007,19(2):233-239. 被引量：1
7章夏芬,庄越挺,吴江琴,吴飞.Hierarchical Approximate Matching for Retrieval of Chinese Historical Calligraphy Character[J].Journal of Computer Science & Technology,2007,22(4):633-640. 被引量：4
8蔡红云,张建勋,田俊峰,何欣枫.校园网格环境下异构数据库的集成与分布式查询[J].广西师范大学学报（自然科学版）,2007,25(4):298-301. 被引量：7
9印桂生,于翔,宁慧.一种基于网格的增量聚类算法[J].计算机应用研究,2009,26(6):2038-2040. 被引量：4
10杨志芹.基于信息抽取的古籍知识检索系统研究[J].情报科学,2009,27(8):1219-1221. 被引量：2

同被引文献34

1张英朝,张维明,肖卫东,黄金才.信息网格中基于本体的信息共享全局视图构建方法研究[J].计算机研究与发展,2004,41(10):1856-1863. 被引量：9
2刘健,杨文宇,余健明,宋蒙.一种基于改进最小生成树算法的配电网架优化规划[J].中国电机工程学报,2004,24(10):103-108. 被引量：56
3章夏芬,庄越挺,鲁伟明,吴飞.根据形状相似性的书法内容检索[J].计算机辅助设计与图形学学报,2005,17(11):2565-2569. 被引量：12
4张涛,柳重堪,张军.卫星时变拓扑网络最短路径算法研究[J].计算机学报,2006,29(3):371-377. 被引量：24
5廖巍,熊伟,王钧,景宁,钟志农.可伸缩的增量连续k近邻查询处理[J].软件学报,2007,18(2):268-278. 被引量：10
6陈继东,孟小峰,赖彩凤.基于道路网络的对象聚类[J].软件学报,2007,18(2):332-344. 被引量：29
7林澜,闫春钢,蒋昌俊,周向东.动态网络最短路问题的复杂性与近似算法[J].计算机学报,2007,30(4):608-614. 被引量：17
8章夏芬,庄越挺,吴江琴,吴飞.Hierarchical Approximate Matching for Retrieval of Chinese Historical Calligraphy Character[J].Journal of Computer Science & Technology,2007,22(4):633-640. 被引量：4
9于海彦,郝忠孝.时空数据库中基于TPR-树的反向最近邻查询[J].哈尔滨理工大学学报,2007,12(3):87-90. 被引量：3
10Dijkstra E. A note two problems in connection with graphs[J]. Numerical Mathemat, 1959,1: 269-271.

引证文献3

1张鸿,顾进广.数据网格环境下的多媒体资源检索[J].计算机工程,2011,37(8):275-277. 被引量：1
2王树西,吴政学.改进的Dijkstra最短路径算法及其应用研究[J].计算机科学,2012,39(5):223-228. 被引量：91
3章夏芬,张龙海,韩德志,毕坤.自适应书法字图像匹配和检索[J].浙江大学学报（工学版）,2016,50(4):766-776. 被引量：7

二级引证文献99

1曹端广,张子民,周英,李锦,邢华桥.三维输油管线信息管理与安全预警系统研究[J].测绘地理信息,2022,47(4):128-131. 被引量：1
2刘喜勋,何苗.一边多权图的邻接矩阵实现技术和Dijkstra算法的改进[J].自动化与仪器仪表,2016(7):186-189. 被引量：1
3陈萱华,杨玲,李学亚.最短路径算法在自动测评系统中的应用[J].计算机与现代化,2012(12):1-3. 被引量：1
4陈晓宁,董洁霜,耿丽华.实用小城镇公交线网规划方法研究——以浙江平阳县水头镇为例[J].交通与运输,2012,28(H12):122-124. 被引量：2
5詹子娜,金龙哲,白楠.基于避险设施的矿井应急救援决策系统研究[J].中国安全科学学报,2013,23(10):164-169. 被引量：3
6廖兴宇,汪伦杰.改进型Dijkstra算法在最优路径选择中的应用研究[J].现代计算机（中旬刊）,2013(11):3-8. 被引量：2
7黄震,薛文科,李鹏,李剑平.Dijkstra算法在停车诱导系统中的应用[J].计算机时代,2013(12):38-41. 被引量：5
8张玉杰,田硕.Dijkstra优化算法在停车场车位引导系统中的应用[J].计算机测量与控制,2014,22(1):191-193. 被引量：19
9袁彬,刘建胜,钱丹,罗大海.一种基于改进Dijkstra的物流网络路径优化算法分析[J].制造业自动化,2014,36(9):86-88. 被引量：10
10王树西,李安渝.Dijkstra算法中的多邻接点与多条最短路径问题[J].计算机科学,2014,41(6):217-224. 被引量：120

1庄毅,庄越挺,吴飞.基于数据网格环境的k近邻查询[J].计算机研究与发展,2006,43(11):1876-1885.
2承健.提笔忘字[J].个人电脑,2005,11(4):168-168.
3王自营,邱绵浩,安钢,王凯.基于一类超球面支持向量机的机械故障诊断研究[J].振动工程学报,2008,21(6):553-558. 被引量：10
4庄毅,翁建广,庄越挺,吴飞.一种基于双重距离尺度的高维索引结构[J].浙江大学学报（工学版）,2007,41(3):380-385. 被引量：3
5高晶,王韶霞.基于Cuboids特征的多类超球面支持向量机动作识别研究[J].廊坊师范学院学报（自然科学版）,2012,12(2):29-32.
6杨颖娴.改进的二叉树支持向量机在人脸识别中的应用[J].科学技术与工程,2012,20(20):4930-4934. 被引量：1
7庄毅,庄越挺,吴飞.一种基于编码的双距离树高维索引[J].中国科学（E辑）,2007,37(12):1491-1503. 被引量：1
8李太白,唐万梅.一种改进的SVM多类分类算法在入侵检测中的应用[J].重庆师范大学学报（自然科学版）,2012,29(5):63-66. 被引量：8
9李力.无线传感网中一种基于支持向量机的异常事件检测方案[J].计算机应用与软件,2015,32(2):272-277. 被引量：4
10吴石,林连冬,肖飞,渠达.基于多类超球支持向量机的铣削颤振预测方法[J].仪器仪表学报,2012,33(11):2414-2421. 被引量：13

软件学报

2006年第11期

浏览历史

内容加载中请稍等...

基于数据网格的书法字k近邻查询被引量：3

参考文献2

二级参考文献11

共引文献16

同被引文献34

引证文献3

二级引证文献99

相关作者

相关机构

相关主题

浏览历史

基于数据网格的书法字k近邻查询 被引量：3

参考文献2

二级参考文献11

共引文献16

同被引文献34

引证文献3

二级引证文献99

相关作者

相关机构

相关主题

浏览历史

基于数据网格的书法字k近邻查询被引量：3