-
题名一种对移动Web访问日志中层次数据的提取方法
- 1
-
-
作者
高丽峰
高丽萍
李梦颖
-
机构
四川大学计算机学院
北京南瑞智芯微电子科技有限公司
-
出处
《现代计算机》
2015年第8期47-53,共7页
-
基金
四川省科技厅项目(No.2013GZ0015)
-
文摘
提出一种基于可视分析的层次数据提取方法,实现对移动Web访问日志中层次数据的精确高效提取。通过数据样本建立数据字典,确保没有信息遗漏,并根据字典统计样本并记录相关数据,建立数据网络权重图。可视化该网络,并以可视分析的方法确定数据间的层次结构,并以此构建数据层次结构有向图,结合结点权重进行拓扑排序,使用得到的拓扑序列更新数据字典。将待提取日志与数据字典中的关键词依次进行正则匹配,并保存提取结果。对移动Web访问日志中User-Agent域中的浏览器信息进行数据提取,实验表明该方法能够很好地确定层次数据间的层次关系,实现数据的精确提取。
-
关键词
数据提取
可视分析
层次数据
移动web访问日志
User—Agent
-
Keywords
Data Extraction
Visual Analysis
Hierarchical Data
Mobile web Access Log
User-Agent
-
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
-