随着大数据的价值被广泛重视,怎样评估组织 的数据管理能力并识别进1步改进的清晰路径成为关注的焦点。受到能力成熟度模型的启示,研究者们开发了数据管理能力成熟度模型并试图针对各种数据应用场景进行细化。
能力成熟度模型(Capability Maturity Model,CMM)最初源自软件定制管理,由美国卡内基梅隆大学软件工程研究所(The Software Engineering Institute,SEI)于20世纪80年代提出。这一模型将软件定制区划为5个成熟度级别(maturity levels),除了第一级以外,每个级别都由几个关键过程域(key proCEssareas)组成,关键过程域表明组织应该关注的领域,以改进软件定制的过程。每个关键过程域分为5个部分,称为共同特征(common features)。共同特 征指定了关键实践(key practice),当这些关键实践被实行,就能够实现关键过程域的目标(goals)。
CMM认为软件定制不是一蹴而就的过程,而是要求组织明确必须开展什么方面的工作,并理清这些工作之间的先后顺序,因此,每个成熟度级别就对应着在持续改进过程中组织达到的新的阶段。根据CMM的架构,能够标准化、模块化的判断组织软件过程的成熟度,并将其与行业内其他组织的实践状态进行比较。同时,组织还能够使用CMM来规划对软件定制过程的改进。该模型问世以来受到广泛关注,不仅被用在软件定制领域,还被改造以辅助各种业务过程。
数据管理能力成熟度模型在数据管理领域,研究者们试图在CMM的基础上构建数据管理能力成熟度模型(Data Management Maturity,DMM),用以规范和引导组织的数据管理过程。这些模型遵循了CMM的基本理念和结构,在可进1步细分的关键过程域基础上,区分不同的成熟度水平,有的还定义了一系列指标,以方便组织评估目前的数据管理状况。在组织应该关注的数据管理关键领域的区划上,各个模型虽有重合,但由于所关注的数据管理实践不同,包含的关键要素也不尽相同。
其中,IBM的数据管理能力成熟度模型形成于2007年,在《数据治理统一流程》一书中,给出了11个子域。而SEI作为CMM的创建机构,在2014年将数据管理能力成熟度的核心数据管理实践分为6类。同样在2014年,面向金融保险行业数据管理的公益性组织EDMcouncil也提出了数据管理能力评估模型(TheDataManagementCapabilityAssessmentModel,DCAM)。中国信息技术标准化技术委员会制定的模型则结合国内数据管理的具体情况,将其总结为数据标准、数据安全、数据质量等八大过程域,并在2018年作为国家标准开始实施。此后,针对科研机构和政府组织的数据管理活动,研究者们又尝试构建了科研数据管理能力成熟度模型和政府大数据管理成熟度模型。这些模型能够用于指导不同层面的数据管理活动,如KevinCrowston和JianQin等利用雪城大学的模型分别对单个研究项目以及涉及多个机构研究人员的大型研究项目中进行的数据管理过程进行了评估,依据评估的结果,项目组成员能够清晰的明确数据管理过程的优缺点。
综上所述,公共安全数据管理是政府机构和相关组织面对的长期任务,必须围绕核心工作逐步提升管理水平。能力成熟度模型提供的结构框架适用于描述公共安全数据管理领域的关键问题及成熟度阶段。但要构建出真正符合公共安全数据管理实践的能力成熟度模型,识别特定关键过程域是核心问题之一。科研数据以及政府公共数据管理能力成熟度的相关研究在过程域的区划上尽管不尽相同,但对数据质量、安全管理等领域保持了共同的关注。除此之外,某些关键域尽管在名称上有差别,但具体含义仍然是统一的,如澳大利亚ANDS提出的IT基础设施实际能够对应雪城大学的存储服务与保存等,可见,各模型在关键域上还是有一定的一致性,这为公共安全数据管理关键过程域的识别与合并提供了参考。除此之外,在构建方法上,通过对代表性文献和案例进行内容分析得到了较为广泛的应用,如雪城大学的研究人员在构建科学数据管理能力成熟度模型以及中国人民大学的研究人员在形成政府大数据治理成熟度评测指标体系时,都采用了类似的方法。因此,本文也将基于这一思路进行研究设计。