摘要
数字经济时代,越来越多的企业开展数字化转型,对企业数据管理也日渐重视。企业主数据是企业数据管理的重要内容之一,企业主数据是否唯一,严重影响企业基于大数据决策的质量。本文主要研究了目前常用的识别重复企业主数据方法的不足,提出了一种基于主数据关键特征值的企业重复主数据识别方法,该方法主要由主数据初步无损去冗余压缩,主数据分词及词汇调整信息量计算,主数据词汇编码,主数据关键特征值计算,疑似重复主数据识别五步组成。相比传统识别方法有更高的识别准确率。该方法已在企业使用,取得了较好的应用效果。
出处
《江苏通信》
2024年第4期44-46,共3页
Jiangsu Communication