期刊文献+

支持实体识别的XML编码方案

XML coding scheme for entity recognition
下载PDF
导出
摘要 提出了XML文档的一种start-end-type(SET)编码方法,SET编码基于起止编码的思想,并把起止编码的三元组(start,end,level)改进为四元组(start,end,level,type),增加了表示XML文档中结点类型的type值。对四元组中的前3个值提出了新的实现算法,而第4个元素type值由前3个元素的值自动计算出来。SET编码不仅可以快速判断出结点之间的祖先/后代、父亲/孩子关系,而且还可以根据type值快速判断出XML文档中各结点的类型。经过实验测试,SET编码不仅具有良好的编码性能,还能根据各结点类型对XML数据进行实体识别,为进一步研究根据实体类型对XML数据进行查询提供条件。 In the present paper,a start-end-type(SET)coding method in the treatment of XML document is proposed based on the idea of start-end coding,and the start-end coding triplets(start,end,level)is developed into a four-tuple(start,end,level,type),which increases an XML document type node as the type value.This paper also proposes a new implementation algorithm for the first three values of the four tuple,and the type values of the fourth elements can be calculated automatically by the first three elements.SET coding not only can quickly determine the relationship between ancestor and descendant,or father and son of nodes,but also the type of XML document based on type value.After the experiment,SET coding not only has good coding performance,but also can recognize the of XML data entity according to node types,it can be the basis for the further study of XML data query according to the entity type.
出处 《沈阳师范大学学报(自然科学版)》 CAS 2016年第4期473-478,共6页 Journal of Shenyang Normal University:Natural Science Edition
基金 辽宁省教育厅科学研究一般项目(L2012388)
关键词 大数据 起止编码 SET编码 深度优先遍历 实体结点 big data start-end coding SET coding depth first traversal entity node
  • 相关文献

参考文献5

二级参考文献36

共引文献219

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部