前言
什么是数据治理呢,在真正接触数据治理的工作前,我觉得这是一个宏观而抽象的概念。在前言中,我提取了Boss直聘上一个制造业的岗位JD,这个JD的描述其实写的非常好,涵盖了DAMA的数据治理的大部分要求,具体如下:

我们想要从事数据治理的工作,或者说,把数据治理的工作做好,一定要先自己理解清楚,数据治理是要干什么的。如果不能清楚自己的工作之于整体公司战略的价值所在,只专注于自己手中的一小块工作,这样既没有成就感也没有获得感,不知道自己所处何为,很难了解数据治理的价值所在。
这也是本篇文章写作的目的。
基本概念
数据治理是一种行为,是对数据管理工作履行职权和实施管控的行为。
所谓管控,指的是从规划到实施,再到监管与执行。
数据驱动型的组织会主动考虑将数据需求作为战略制定、工作规划与技术实施的一部分。
为了使得数据成为资产,并且让组织能干从中获益,组织需要明确以下目标并从技术与业务两个方向去驱动,具体的目标如下所示:
其一、我们希望使组织能干将其数据作为资产进行管理。
其二、我们希望能够定义、批准、传达和实施数据管理的原则、制度、程序、指标、工具和职责。
其三、我们希望数据治理能够监督和指导制度合规、数据使用和管理工作。
为了实现以上的目标,我们需要从业务驱动、技术驱动的两个方面出发,来推进具体工作的落地执行。
业务驱动数据治理
我们时常谈及安全服务于业务,也时常意识到业务是我们的生命线,但是数据治理驱动业务,其实对于普通的知识工作者来说,是很难意识到的。
但是实际情况是,缺乏可信的数据资产或者不可靠的数据,会导致企业在运营的过程中造成用户的信任问题,从而影响客户的选择,最终指向企业的利润变化。
所以业务驱动数据治理并不是一个玄而上的,而是具体又现实的挑战。
具体而言,良好的数据治理会反哺业务,体现在了降低风险与优化流程两个方面:
其一、在风险管理方面,监督风险数据对财务和声誉的影响,可以应对法律和监管问题;同时在数据安全方面,我们可以通过对数据的有效性、可用性、完整性、一致性以及可审计性进行控制,从而达到对数据资产的保护;此外,我们也可以通过数据治理,来使用制度和合规性监控来控制隐私信息。
其二、在优化流程方面,良好的数据治理可以让我们更好的面对监管合规,做出更高效的响应;并且在通过数据治理后,我们能干提升数据的质量,最终实现对业务绩效的提升;同时,我们通过建立术语定义表以及定义和定位组织内部的数据,可以提升我们提供其他元数据的能力。同时,我们良好的数据管理,可以帮助我们在与供应商的合约上面提高数据控制能力(前司之前在做的一个项目体现了其价值)。
因为数据治理与业务是结合,所以数据治理是持续性的,并非一次性的,它聚焦于从其数据中获取价值并降低相关风险。
这种持续性的过程,需要一个良好的运营框架去迭代运转,从而持续为组织创造价值。
技术驱动数据治理
随着AI时代的来临,大语言模型极大的解放了生产力。
相较于之前,譬如Dify、Coze的工作流的出现,可以帮助我们进行更好的文档管理,并进行数据治理的记分。
当现有的技术水平无法满足数据治理的要求时,技术会在需求中发展,而开源技术的公布,一定程度上推进了整体行业数据治理水平的发展。
一些常识
以数据为中心的组织
以数据为中心的组织必须意识到,数据不应该被当作为业务流程或者应用的附属,而是目标(高质量数据)。
因此以数据为中心的组织必须认可以下观点:
数据应当被当做公司的资产进行管理。
数据管理的最佳实践应该是在整个组织层面得到激励。
公司数据战略必须直接与整体业务战略保持一致。
数据管理流程应得到持续改进。
数据治理的运营模型
数据治理的运营模型分为三种:集中式模型、复制式模型、联邦式模型。
.png)
在集中式模型下,一个数据治理机构监督所有主题域中的全部活动,而在复制式模型下,每个业务单元采用同样的数据治理运营模型和标准;在联邦式模型下,一个数据治理组织与多个业务单元协调一致的定义和标准。
如何进行数据资产估值
数据生命周期的每个阶段都涉及成本。数据只有被使用才会产生价值,同时也会产生相应的成本。只有数据的收益超过获取、存储产生的成本的时候,使用数据才会产生成本。衡量数据资产的价值包括:
其一、替换成本。在灾难或数据泄漏中丢失的数据的替换或恢复成本,包括组织内的交易、域、目录、文档和指标等数据。
其二、市场价值。企业在并购时作为商业资产的价值。
其三、识别商机。利用数据识别出的机会可以获得的收入价值,包括通过数据用于交易或出售所获得的收入。
其四、销售数据。可以打包出售的数据。
其五、风险成本。根据可能受到的处罚、补偿成本、诉讼花费计算的价值。
这里面涉及一定的会计原则,需要在相关的机构帮助下进行会计审计。