实体识别是数据量质融合管理中的一项关键技术,对能否提高数据质量起着决定性作用.其目的在于识别出数据中表示同一对象的不同形式;以及同一形式所代表的不同对象.随着大数据研究技术的发展,大数据上的实体识别问题受到了广泛关注.因此...实体识别是数据量质融合管理中的一项关键技术,对能否提高数据质量起着决定性作用.其目的在于识别出数据中表示同一对象的不同形式;以及同一形式所代表的不同对象.随着大数据研究技术的发展,大数据上的实体识别问题受到了广泛关注.因此,在大数据的信息集成背景下,给出了一个基于Map-Reduce框架的大数据实体识别算法(entity identification in big data based on Map-Reduce,EIBM).该算法首先通过属性值计算记录间的相似程度,而后基于图聚类的方法进行实体识别从而输出得到最终结果.最后,在Hadoop平台上对真实数据集和人造数据集进行了多组实验,实验结果验证了算法的并行程度和对于处理大数据的有效性与高效性.展开更多
[目的/意义]对大数据时代国内外个人信息保护的研究热点和演化趋势进行了总结和回顾,旨在为相关领域的研究提供参考和启示。[方法/过程]运用文献计量法和科学知识图谱法,基于CNKI和Web of Science数据库,以ITGInsight为主体工具,再辅之G...[目的/意义]对大数据时代国内外个人信息保护的研究热点和演化趋势进行了总结和回顾,旨在为相关领域的研究提供参考和启示。[方法/过程]运用文献计量法和科学知识图谱法,基于CNKI和Web of Science数据库,以ITGInsight为主体工具,再辅之Gephi、Excel、SATI等科学计量与知识网络分析软件,对大数据领域国内外个人信息保护研究领域的热点分布、主题演化以及研究内容进行分析。[结果/结论]大数据时代国内外个人信息保护相关研究主题分布广泛、演化规律较为复杂,呈现出显著的变化趋势,在未来的研究中,需要综合考虑技术、法律、政策等多个方面的因素,以构建更加全面、系统的个人信息保护体系。展开更多
文摘实体识别是数据量质融合管理中的一项关键技术,对能否提高数据质量起着决定性作用.其目的在于识别出数据中表示同一对象的不同形式;以及同一形式所代表的不同对象.随着大数据研究技术的发展,大数据上的实体识别问题受到了广泛关注.因此,在大数据的信息集成背景下,给出了一个基于Map-Reduce框架的大数据实体识别算法(entity identification in big data based on Map-Reduce,EIBM).该算法首先通过属性值计算记录间的相似程度,而后基于图聚类的方法进行实体识别从而输出得到最终结果.最后,在Hadoop平台上对真实数据集和人造数据集进行了多组实验,实验结果验证了算法的并行程度和对于处理大数据的有效性与高效性.
文摘[目的/意义]对大数据时代国内外个人信息保护的研究热点和演化趋势进行了总结和回顾,旨在为相关领域的研究提供参考和启示。[方法/过程]运用文献计量法和科学知识图谱法,基于CNKI和Web of Science数据库,以ITGInsight为主体工具,再辅之Gephi、Excel、SATI等科学计量与知识网络分析软件,对大数据领域国内外个人信息保护研究领域的热点分布、主题演化以及研究内容进行分析。[结果/结论]大数据时代国内外个人信息保护相关研究主题分布广泛、演化规律较为复杂,呈现出显著的变化趋势,在未来的研究中,需要综合考虑技术、法律、政策等多个方面的因素,以构建更加全面、系统的个人信息保护体系。