大数据时代电子政务中XML文档相似性被引量：1

Similarity of XML Documents in E-government in Era of Big Data

下载PDF

导出

摘要 XML作为电子政务应用中的数据交换标准已经被广泛研究。随着大数据时代的到来,对电子政务中XML数据的管理也显得越来越重要。在XML数据的管理中,XML文档的相似性是XML数据集成、XML数据分类的关键。为了研究XML文档的相似性,针对XML文档进行了树形变换,并提取树节点的相应特征,然后分别利用这些特征对节点进行相应的相似性计算,再将得到的相似性利用ELM(超限学习机)算法进行拟合得到最终的节点相似性。在节点相似性的基础上提出了XML文档树的相似性比较算法,从而计算得到XML文档的相似性。实验部分在给出具体的评估指标的基础上,在两个不同的数据集上给出使用文中方法所得到的精确度、召回率、F-measure值以及相应时间的对比情况,通过实验验证了所提方法的性能优势。 XML has been widely studied as the standard of data exchange in e-government applications. With the arrival of the era of big data,the management of XML data in e-government is also becoming more and more important. In the management of XML data,the similarity of XML documents is the key of XML data integration and XML data classification. In order to study the XML document simi- laxity, the XML document are transformed into tree, extracting the corresponding characteristics of the nodes of the tree, and then using these characteristics to calculate the similarity of nodes, and then the final node similarity can be obtained by the ELM（ Extreme Learning Machine） algorithm. Based on the similarity of nodes,the algorithm of similarity comparison of the XML document tree is given,which can obtain the similarity of XML documents. Based on the given specific evaluation indexes, the accuracy, recall, F -measure values and the corresponding time are obtained through experiments in two different data sets using the method proposed. The performance advanta- ges of the proposed method are verified by experiments.

作者赵震任永昌

机构地区渤海大学信息科学与技术学院东北大学计算机科学与工程学院

出处《计算机技术与发展》 2017年第1期186-189,194,共5页 Computer Technology and Development

基金教育部人文社会科学研究青年基金项目(15YJC870028) 辽宁省自然科学基金(2015020009) 辽宁省哲学社会科学规划基金项目(L15BTQ002) 辽宁省社科联2015年度辽宁经济社会发展立项课题(2015lslktglx-01)

关键词 XML文档相似性特征提取拟合数据集成 XML documents similarity feature extracting synthesizing data integration

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1赵慧勤,赵慧玲.电子政务数据交换标准——XML语言[J].大同职业技术学院学报,2003,17(3):76-78. 被引量：1
2钟福金,辜丽川,张友华.基于语义Web服务的电子政务模型研究[J].微电子学与计算机,2010,27(3):144-147. 被引量：5
3陈桦,麻风梅,韩艳艳.基于XML的异构数据集成模式的研究[J].微电子学与计算机,2009,26(1):137-139. 被引量：14

二级参考文献12

1罗海驰.基于Web Services的电子政务体系结构及其应用[J].计算机工程与应用,2006,42(32):229-232. 被引量：7
2顾天竺,沈洁,陈晓红,李慧,张舒,吴颜.基于XML的异构数据集成模式的研究[J].计算机应用研究,2007,24(4):94-96. 被引量：40
3杨保明,刘晓东,姚兰,赵飞蓉.基于本体论的农业知识的OWL描述[J].微电子学与计算机,2007,24(5):58-60. 被引量：10
4姚全珠,赵朋飞.发布关系数据为XML文档[J].计算机工程与应用,2007,43(15):160-162. 被引量：2
5Dietz P F. Maintaining order in a linked list[C]//Proceedings of the 14th Annual ACM Symposium on Theory of Computing (STOC' 82). USA. New York: ACM Pros, 1982:122 - 127.
6Bohannon P, Xin Luna Dong, Ganguly S, et al. ROLEX: relational on- line exchange with XML[ C]//International Conference on Management of Data Proceedings of the 2003 ACM SIGMOD International Conference on Management of Data. San Diego, California, New York: ACM Press, 2003: 673.
7Berners- Lee T, Hendler J, Lassila O. The semantic web [J]. Scientific American,2001,284(5) :34 - 43.
8David Martin, Mark Burstein, Jerry Hobbs, et al. OWL - S: semantic markup for web services[EB/OL]. (2006 -03 - 15) [2008 - 06 - 01]. http://www, ai. sri. com/ daml/services/owl - s/1.2/overview/.
9Massimo Paolucci, Takahiro Kawarnura, Terry R Payne, et al. Semantic matching of web services capabilities[C]// Proceeding of the First International Semantic Web Conference (ISWC 2002). Italy, Sardinia, 2002.333 - 347.
10曾一,袁纲,张元平,肖敏,张利武,牟剑.基于Web服务的电子政务数据交换中心的设计和实现[J].计算机科学,2007,34(11):98-102. 被引量：11

共引文献17

1高晓玲.基于XML与中间件的企业数据集成模型设计与实现[J].兰州大学学报（自然科学版）,2009,45(F06):129-132. 被引量：4
2郭悦红,齐莉丽.基于WS-Security的电子商务安全支付系统[J].微电子学与计算机,2010,27(3):151-153. 被引量：4
3高晓玲,王艳.基于XML的煤矿企业数据集成模型设计与实现[J].计算机与现代化,2010(4):51-53. 被引量：3
4麻风梅.基于XML的高校信息集成平台的研究[J].现代电子技术,2010,33(8):56-58. 被引量：1
5苌程,李善平.基于ETL的金融数据集成过程模型[J].计算机工程与设计,2010,31(9):2070-2072. 被引量：5
6万仲保,肖尧.运政系统异构数据整合框架的设计及研究[J].微计算机信息,2010,26(21):128-130. 被引量：2
7陈姗,王丽娟,张光辉.ASCM系统中XML数据关系化存储研究[J].河南农业大学学报,2011,45(2):230-235. 被引量：1
8邢杰,董伟,姚路明.基于关键词统计的国内电子政务研究现状分析[J].情报杂志,2012,31(1):115-118. 被引量：3
9汤全武,毕利.基于参数相似度的语义Web服务组合研究[J].微电子学与计算机,2012,29(5):113-118.
10张婕.用于实现语义互操作的映射研究[J].现代情报,2012,32(8):170-172. 被引量：5

同被引文献6

1李健,洪岩.基于Webservice的短信发送平台的设计与实现[J].信息技术与信息化,2010(2):43-46. 被引量：11
2涂雨晨.基于WebService的数据共享设计[J].科技广场,2012(5):36-38. 被引量：6
3李凤云,黄迎春,冯永新.基于WebService的SOA实现技术研究[J].科技视界,2012(23):17-19. 被引量：25
4彭玢,代洁.基于中间库与WebService平台信息交互接口设计[J].计算机与数字工程,2013,41(11):1801-1803. 被引量：22
5董凌峰,李永忠.基于云计算的政务数据信息共享平台构建研究——以“数字福建”为例[J].现代情报,2015,35(10):76-81. 被引量：19
6方柯,夏雨.浅谈WebService技术[J].河南科技,2014,33(6X):2-2. 被引量：2

引证文献1

1朱佳,李庆坤.基于WebService的数字城管对接机制完善[J].信息技术与网络安全,2019,38(6):97-101.

1杜新林,刘丹,董妍.XML文档相似性的常用方法比较[J].长春大学学报,2009,19(6):30-31. 被引量：3
2李大川,忻展红.大型呼叫中心人工呼入量的最小二乘支持向量机模型[J].控制理论与应用,2009,26(7):815-818. 被引量：2
3刘丹,宁云隆,于聪梅.XML文档相似性的比较[J].中国科技博览,2009(11):64-64.
4李帅,王华,王新军,石钊.树形变换的PSO组播路由算法[J].小型微型计算机系统,2009,30(8):1500-1506. 被引量：1
5赵慧,谭敏生,陈琼.基于节点相似性的网络信任模型研究[J].网络安全技术与应用,2011(12):23-24.
6张娜,张东站,段江娇.CS-XMLSim:一种XML文档分类的改进方法[J].心智与计算,2010,0(3):168-175.
7杨晓童,黄桂兰,高芳萍,买尔娅古丽·艾合买提.基于网络节点相似性的链路预测研究[J].中国科技纵横,2016,0(3):255-256.
8陆翠明,李芳,Athena I Vakali.XML文档相似性的仿真研究[J].计算机仿真,2005,22(12):300-302. 被引量：1
9郑凤妮.复杂网络中基于节点相似性聚类的网络社团发现方法研究[J].计算机与现代化,2013(5):231-234. 被引量：3
10吴大鹏,周之楠,张炎,王汝言.消息内容保护的间断连接移动自组织网络转发机制[J].电子与信息学报,2015,37(6):1271-1278. 被引量：11

计算机技术与发展

2017年第1期

浏览历史

内容加载中请稍等...

大数据时代电子政务中XML文档相似性被引量：1

参考文献3

二级参考文献12

共引文献17

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

大数据时代电子政务中XML文档相似性 被引量：1

参考文献3

二级参考文献12

共引文献17

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

大数据时代电子政务中XML文档相似性被引量：1