威尼斯-WWW.37000cm.COM|创新 合作 共赢

icon
../../hdupf/gimg/202107/20210728090413_772665.png
icon

NEWS

新闻中心

大数据时代数据建模的重要性

作者:深圳弘博创新培训 来源: 百家号 更新于:2022年01月26日 03时 阅读:0

进行全面的业务梳理,改进业务流程

在业务模型建设的阶段,能够帮助我们的企业或者是管理机关对本单位的业务进行全面的梳理。通过业务模型的建设,我们应该能够全面了解该单位的业务架构图和整个业务的运行情况,能够将业务按照特定的规律进行分门别类和程序化,同时,帮助我们进一步的改进业务的流程,提高业务效率,指导我们的业务部门的生产。

建立全方位的数据视角,消灭信息孤岛和数据差异

通过数据仓库的模型建设,能够为企业提供一个整体的数据视角,不再是各个部门只是关注自己的数据,而且通过模型的建设,勾勒出了部门之间内在的联系,帮助消灭各个部门之间的信息孤岛的问题,更为重要的是,通过数据模型的建设,能够保证整个企业的数据的一致性,各个部门之间数据的差异将会得到有效解决。

解决业务的变动和数据仓库的灵活性

通过数据模型的建设,能够很好的分离出底层技术的实现和上层业务的展现。当上层业务发生变化时,通过数据模型,底层的技术实现可以非常轻松的完成业务的变动,从而达到整个数据仓库系统的灵活性。

帮助数据仓库系统本身的建设

通过数据仓库的模型建设,开发人员和业务人员能够很容易的达成系统建设范围的界定,以及长期目标的规划,从而能够使整个项目组明确当前的任务,加快整个系统建设的速度。

数据建模,通俗地说,就是通过建立数据科学模型的手段解决现实问题的过程。

数据建模也可以称为数据科学项目的过程,并且这个过程是周期性循环的。具体可分为六个步骤:

1、制订目标

制订目标的前提是理解业务,明确要解决的商业现实问题是什么?

2、数据理解与准备

基于要解决的现实问题,理解和准备数据,一般需要解决以下问题:

需要哪些数据指标(即特征提取)?

数据指标的含义是什么?

数据的质量如何?

数据能否满足需求?

数据还需要如何加工?

探索数据中的规律和模式,进而形成假设。

需要注意的是,数据准备工作可能需要尝试多次。因为在复杂的大型数据中,较难发现数据中存在的模式,初步形成的假设可能会被很快推翻,这时一定要静心钻研,不断试错。

数据建模后需要评估模型的效果,因此一般需要将数据分为训练集和测试集。

3、建立模型

在准备好的数据基础上,建立数据模型,这种模型可能是机器学习模型,也可能不需要机器学习等高深的算法。选择什么样的模型,是根据要解决的问题(目标)确定的。

当然可以选择两个或以上的模型对比,并适当调整参数,使模型效果不断优化。

4、模型评估

模型效果的评估有两个方面:一是模型是否解决了需要解决的问题(是否还有没有注意和考虑到的潜在问题需要解决);二是模型的精确性(误差率或者残差是否符合正态分布等)。

5、结果呈现

结果呈现主要关注以下三个方面: 模型解决了哪些问题? 解决效果如何? 如何解决问题?具体操作步骤是什么?

6、模型部署

通过大量数据解决了一个或多个重要的现实问题,需要将方案落实下去,一般情况下需要通过线上技术环境部署落实,从而为后面不断优化模型、更好地解决问题打下基础。

交由工程人员部署技术环境,需要数据建模团队撰写需求文档,并确保工程人员理解需求文档的内容,才能达到较好的模型部署效果。

从以上内容可以看出建立数据模型的重要性和基本步骤,但是目前能真正地为企业解决实际问题的数据专业人员比较匮乏。

为了便于国内广大数据从业者学习相关认证,DAMA中国以国际数据管理协会(简称“DAMA国际”) DAMA数据管理知识体系为基础,结合国内实际需求,对DAMA国际数据管理专业人员认证( CDMP )的考试语言、考试形式、考试内容、证书类型等进行了适当本地化重构。

重构后认证考试分为数据治理工程师( CDGA )和数据治理专家( CDGP ),DAMA中国承担认证考试命题工作,并定期组织中文考试,对考试通过者由DAMA中国颁发认证证书。证书有效期为三年,获得CDGA认证才能申请CDGP认证考试。

帮助数据管理从业人士获得企业数字化转型战略下的必备职业能力,促进开展工作实践应用及实际问题解决,形成企业所需的新数字经济下的核心职业竞争能力。

    XML 地图