期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于聚类分析的数据文件格式分析方法 被引量:2
1
作者 刘杰 常兴山 +1 位作者 孙锋 周建辉 《武汉理工大学学报》 CAS 2022年第1期93-99,共7页
在实际工作中经常需要进行文件格式分析,以方便数据资源共享与交换,而目前数据文件格式分析方法存在解析效率低下等问题。为此提出基于聚类分析的数据文件格式分析方法,该方法应用聚类思想,通过同类型不同文件同一字节位置的聚类、文件... 在实际工作中经常需要进行文件格式分析,以方便数据资源共享与交换,而目前数据文件格式分析方法存在解析效率低下等问题。为此提出基于聚类分析的数据文件格式分析方法,该方法应用聚类思想,通过同类型不同文件同一字节位置的聚类、文件组内不同字节位置的聚类,获得数据文件字节重复度分布并分析相应的聚类分布特征;将数据文件的文件头部分、文件数据体部分及分界处的重复度分布特征作为文件格式分析的依据,并提出以字节组聚类分析的方法提升文件格式分析效率。基于文件存储结构和聚类分布特征,制定了聚类分析的文件样本选取原则;同时开发了相应的格式解析辅助工具软件,该软件能自动进行选定文件合理性判断、自动分组等,简化了相应的格式解析处理过程。应用该方法和开发的工具进行了型号为Agilent GC 6890N MSD 5793N的质谱仪产生的MS数据文件格式解析试验,实验结果表明,该方法分析得到的文件格式准确、效率明显提高,通过对该方法复用,可以有效促进大型科研仪器数据资源共享,提高数据资源利用率。 展开更多
关键词 聚类分析 仪器资源共享 数据文件格式分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部