-
题名基于组织机构代码数字档案的大数据方法研究
- 1
-
-
作者
孙玉琳
丁又可
孟繁林
董胤
韩泓波
彭立志
-
机构
山东华质信息服务有限公司
济南大学信息科学与工程学院
-
出处
《信息系统工程》
2015年第8期47-49,51,共4页
-
基金
国家自然科学基金(61472164)
山东省自然科学基金(ZR2012FM010)
-
文摘
组织机构代码工作经过20多年的发展已经积累了上千万份档案,随着国家商事制度的改革,商事主体数量和规模日益增多,组织机构代码数字档案势必呈现爆发式增长,如何实现数字档案的管理,同时对档案内容进行深度挖掘,为国家、管理部门提供有价值的、具有决策性质的信息是需要重点考虑的问题。本文基于已有组织机构代码数字档案数据库工作,在大数据平台Hadoop上,使用Map Reduce程序实现对组织机构代码数字档案的数据库操作,并通过实验验证了相较于传统的关系型数据库Oracle,大数据在管理组织机构代码数字档案数据库中的优势;此外,本文根据组织机构代码数字档案的特点,在自然语言处理的基础上,提出了一种基于深度学习理论挖掘组织机构代码数字档案的技术方法。
-
关键词
组织机构代码数字档案
大数据
云计算
数据库
深度学习
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-