为满足全国烟草生产经营管理一体化平台建设对行业信息分类与编码的需求,按照“流程、实体、服务”三类数字对象对信息系统进行解构,结合烟草行业业务实际情况,提出层级互信息聚类算法(Hierarchical Mutual Information Clustering,HMI...为满足全国烟草生产经营管理一体化平台建设对行业信息分类与编码的需求,按照“流程、实体、服务”三类数字对象对信息系统进行解构,结合烟草行业业务实际情况,提出层级互信息聚类算法(Hierarchical Mutual Information Clustering,HMIC),通过对文本数据进行自然语言处理,计算不同数字对象在不同分类层级的互信息,利用层次聚类算法对数字对象进行聚类,从而得到烟草行业信息分类,并在此基础上进行信息编码。将HMIC与常用聚类算法进行对比测试,结果表明:①所构建的HMIC模型的信息分类效果最好,其整体信息熵比使用欧氏距离的聚类算法降低约8.2%,比仅使用互信息矩阵的聚类算法降低约2.5%。②从信息量的角度对分类编码进行研究,能够更好地区分不同类别之间的差异,提高信息分类与编码的可用性。该技术可为指导信息系统项目全生命周期建设提供支持。展开更多
针对单一成像系统获取RGB-D数据时视场过小难以满足大视场成像需求的问题,提出了基于空间信息聚类的RGB-D数据拼接融合方法。根据RGB-D数据中蕴含的空间信息定义物点距离,利用simple linear iterative clustering(SLIC)方法实现空间信...针对单一成像系统获取RGB-D数据时视场过小难以满足大视场成像需求的问题,提出了基于空间信息聚类的RGB-D数据拼接融合方法。根据RGB-D数据中蕴含的空间信息定义物点距离,利用simple linear iterative clustering(SLIC)方法实现空间信息聚类。将场景分割成若干平面子块,每个子块具有单应性,可以进行准确的单应性矩阵计算,进而实现将小视场RGB-D数据准确拼接融合生成大视场RGB-D数据。实验结果表明,所提方法能够改善图像变换过程中产生的扭曲变形及拼接过程中在重叠区域产生的错位。峰值信噪比(PSNR)和结构相似性(SSIM)两个定量评价指标说明基于空间信息聚类的RGB-D数据拼接相较于全局拼接,结果质量得到了提升。展开更多
链路预测的任务是挖掘网络中缺失的链接或预测一对节点之间存在链路的可能性。如何有效准确地预测不完整复杂网络中的缺失链接是一个具有挑战性的问题。综合考虑节点的集体影响以及边的聚类信息对所预测边的贡献,提出一种新的链路预测算...链路预测的任务是挖掘网络中缺失的链接或预测一对节点之间存在链路的可能性。如何有效准确地预测不完整复杂网络中的缺失链接是一个具有挑战性的问题。综合考虑节点的集体影响以及边的聚类信息对所预测边的贡献,提出一种新的链路预测算法CELP(link prediction algorithm based on collective influence and edge clustering information),并结合节点的社区属性,基于设计的贝叶斯网络提出其在标签网络的扩展算法CELP*。来自各个领域的多个测试网络的实验结果表明,与典型的链路预测方法及近期的部分指标相比,所提算法在保持同等AUC水平的同时,提高了预测精度,也进一步肯定了局部节点信息和链路信息对于链路预测工作的重要性。展开更多
文摘为满足全国烟草生产经营管理一体化平台建设对行业信息分类与编码的需求,按照“流程、实体、服务”三类数字对象对信息系统进行解构,结合烟草行业业务实际情况,提出层级互信息聚类算法(Hierarchical Mutual Information Clustering,HMIC),通过对文本数据进行自然语言处理,计算不同数字对象在不同分类层级的互信息,利用层次聚类算法对数字对象进行聚类,从而得到烟草行业信息分类,并在此基础上进行信息编码。将HMIC与常用聚类算法进行对比测试,结果表明:①所构建的HMIC模型的信息分类效果最好,其整体信息熵比使用欧氏距离的聚类算法降低约8.2%,比仅使用互信息矩阵的聚类算法降低约2.5%。②从信息量的角度对分类编码进行研究,能够更好地区分不同类别之间的差异,提高信息分类与编码的可用性。该技术可为指导信息系统项目全生命周期建设提供支持。
文摘针对单一成像系统获取RGB-D数据时视场过小难以满足大视场成像需求的问题,提出了基于空间信息聚类的RGB-D数据拼接融合方法。根据RGB-D数据中蕴含的空间信息定义物点距离,利用simple linear iterative clustering(SLIC)方法实现空间信息聚类。将场景分割成若干平面子块,每个子块具有单应性,可以进行准确的单应性矩阵计算,进而实现将小视场RGB-D数据准确拼接融合生成大视场RGB-D数据。实验结果表明,所提方法能够改善图像变换过程中产生的扭曲变形及拼接过程中在重叠区域产生的错位。峰值信噪比(PSNR)和结构相似性(SSIM)两个定量评价指标说明基于空间信息聚类的RGB-D数据拼接相较于全局拼接,结果质量得到了提升。
文摘链路预测的任务是挖掘网络中缺失的链接或预测一对节点之间存在链路的可能性。如何有效准确地预测不完整复杂网络中的缺失链接是一个具有挑战性的问题。综合考虑节点的集体影响以及边的聚类信息对所预测边的贡献,提出一种新的链路预测算法CELP(link prediction algorithm based on collective influence and edge clustering information),并结合节点的社区属性,基于设计的贝叶斯网络提出其在标签网络的扩展算法CELP*。来自各个领域的多个测试网络的实验结果表明,与典型的链路预测方法及近期的部分指标相比,所提算法在保持同等AUC水平的同时,提高了预测精度,也进一步肯定了局部节点信息和链路信息对于链路预测工作的重要性。