为包管这一机制的高效运转,pg电子官网历时近三年时间从需求调研到计划设计,再到落地实施,为河南地税计划建设了全局型的数据治理系统,该系统以“聚合数据、统一平台、开放效劳、智能应用”为目标,以“一套标准、一个货仓、三其中心”为主要建设内容,充分利用大数据技术,解决多方数据融合、杂乱数据治理、数据开放共享、甜睡数据叫醒等问题,推动了河南地税税收治理和效劳的连续立异。
随着云盘算、大数据、移动互联网的飞速生长,信息化建设的重心从IT时代的治理与控制为主转变为DT时代的效劳与引爆发产力为主。大数据开启了这次重大的时代转型,就像望远镜让我们能够感受宇宙,显微镜让我们能够视察微生物一样,大数据正在改变我们的生活以及理解世界的方法,成为新发明和新效劳的源泉。
——一套标准建设
统一的数据标准与规范是数据治理事情的基础和前提,pg电子官网在执行总局标准的基础上,为河南地税增补制定了基础数据规范、数据集陈规范、数据模型规范、数据效劳规范以及数据治理规范等5大类25个标准规范,夯实了数据治理事情的基础。
——一个货仓建设
数据货仓接纳“Hadoop+MPP+RDB”的漫衍式数据库与古板关系数据库相结合的混淆架构,基于 Hadoop实现海量结构化和非结构化涉税数据的全量存储和批量离线盘算,基于MPP数据库实现海量结构化数据的深度加工和庞大关联盘问,基于古板关系数据库实现数据集市高并发的交互式盘问。
数据货仓在统一数据标准与规范的基础上,将税务部分业务系统数据、第三方涉税数据、日常治理情报数据、互联网涉税数据以及其他来源的种种结构化和非结构化的涉税数据进行整合,形玉成局统一的数据资产,并凭据业务域对数据进行分主题建模,pg电子官网特别针对自然人的税收治理为河南地税建设了自然人主题库,涵盖自然人的基础类、资产类、收入类、支出类、税务类、社会统筹类等六大类信息。
同时,依托MapReduce、Spark漫衍式盘算引擎、Storm流式盘算引擎以及MLlib机械学习库等大数据组件,为数据货仓提供强大的数据挖掘与剖析能力。
——三其中心建设
在一个数据货仓的基础上,pg电子官网为河南地税建设了数据治理系统的三其中心,即:数据治理中心、数据开放效劳中心以及数据应用立异中心。
数据治理中心将数据治理历程流程化、可视化和体系化,建设完成数据标准治理、收罗治理、加工治理、存储治理、质量治理、应用治理、知识治理、元数据治理、宁静治理和运维监控治理等十大功效,固化了数据治理的事情流程和岗责体系,实现了数据全生命周期的治理。
数据开放效劳中心,接纳微效劳架构,将数据治理系统中的数据资源、盘算资源和存储资源进行效劳化封装,基于用户认证和授权体系,通过OpenAPI的方法实现资源的开放共享,以满足税局内部、第三方系统的种种数据效劳需求。
数据应用立异中心在开放数据效劳的基础上,构建纳税人画像、基因图谱、税务搜索、盘问统计、模型评估等大数据立异应用,实现数据深层价值的挖掘。
pg电子官网在河南地税数据治理系统建设历程中,依托移动互联技术,将数据治理事情逐步向移动智能终端延伸,拓展了数据治理事情的时间和空间。