跳转到主要内容
如何选择最合适的数据集成方法?

如何选择最合适的数据集成方法?

2022年8月23日 69次秝妤

一份可以填补数据集成领域空白,为其提供指导的最新指南,正在孕育而生……

 

根据The Open Group架构论坛最近的调查显示,62%的组织正在使用或计划使用特定的数据集成方法,例如数据虚拟化、数据编织(Data Fabric) 或数据网格(Data Mesh)。如果是你,你会如何为组织选择正确且合适的方法?

 

当然,像这样的问题并不是一拍脑袋就可以想出答案的。您肯定想了解不同方法如何在特定情况下发挥作用,想阅读相关的案例研究,想和有类似问题的人交谈,以求了解他们在做什么或已经做了什么,并与你想做的事进行对比,也希望能够遵循专业标准和最佳实践。

 

作为制定标准和最佳实践的起点,The Open Group的这份即将面世的指南可以让我们对当今企业的数据集成状况以及企业和解决方案架构师面临的问题产生扎实的了解,可以用来指导未来的架构师。

 

数据集成当前状态

 

该调查最初由The Open Group架构论坛的一些成员完成,并根据反馈进行了轻微修改,最终由企业架构师协会®的成员完成。截至目前,总共已收到600多份回复。

 

商业领袖大多将数据视为战略性企业资产,但数据使用通常由业务部门进行本地化。有些数据在云端,有些在本地,总体数据质量好坏参半:很棒或很糟糕,大多数介于两者之间。经常有具有不同管理制度的“质量”数据岛屿。

 

受访者表明了以下几个改进点:

• 治理和管理(47%)

• 加快数据的发现和交付速度-例如DataOps(20%)

• 创建数据平台(18%)

• 自助服务(7%)

• 系统保护数据(3%)

• 文化、数据和内容建模、筒仓、技术能力和理解价值(5%)

 

以上整合数据来自公司职能和业务部门的数据库,通常出现在电子文档中,但有时也会来自实时传感器或社交媒体。信息要求主要由CIO和业务分析师指定,有时也会由业务部门指定。质量特征由部分可能包括个人身份信息(PII)的数据指定的,但不是全部数据。

 

约29%的受访者拥有企业综合信息共享环境,如数据仓库、数据湖或档案;17%的受访者在内部和外部拥有应用程序和服务之间的点对点接口;16%的受访者拥有业务线数据筒仓;36%的受访者具有超过2个的以上环境。然而,62%的人正在使用或计划使用特定数据集成方法,例如数据虚拟化(37%)、数据结构(27%)或数据网格(23%)。

 

问题与痛点

 

调查通过自由问卷的形式,向受访者询问他们所认为的数据集成最大的问题和痛点,回复主要分为五个方面:

 

1. 业务部门缺乏信任

由于不了解具备的商业价值,因此业务部门之间并不想共享数据,就会导致其他人很难找到所需的数据,进而让主题专家进行阐释。

 

2. 公司层面缺乏奉献

企业数据集成不被视为可以影响投资的商业创新。

 

3. 异构源和工具堆栈

不同格式具有不同的处理需求,不同的数据平台,具有不同语言和操作系统的Web服务,以及具有不同界面的SaaS提供商。

 

4. 数据模型相互冲突

通常,企业没有数据模型。包括来自遗留和开放系统的数据,以及本体论和分类学上未规范化和/或与内部数据不一致的外部数据都是尚未标准化的。

 

5. 缺乏数据管理文化

通常,组织都没有数据治理工作组,也没有直接与数据相关的政策。因此,就会存在数据质量问题,例如来自不同来源的差异数据和重复记录。

 

关于数据集成指南

 

为了帮助架构师应对和解决以上这些问题,The Open Group数据集成工作组将采用The Open Group标准编写出最新的《数据集成指南》。

 

自1995年首个版本发布以来,TOGAF®标准已被超过80%的世界领先企业采用为架构框架和首选开发方法。2019年和2020年,The Open Group分别增加了DPBoK™(数字化从业者知识体系)标准,旨在助力个人或组织开发和管理数字化程度持续提升的产品,以及已纳入敏捷实践的O-AA™标准,均旨在帮助组织成功实现数字化转型。这三项标准也是The Open Group数字组合标准的核心。

 

对于数据集成领域来说,这一时刻具有深刻含义。在计算机和人工智能的推动下,数据结构、数据网格和数据操作等新兴技术得以发展。然而,数字组合标准为传统与敏捷企业架构以适应数字时代提供了坚实的框架,但它们并没有为数据集成提供具体指导,最新指南的发布将填补这一空白。

 

数据集成工作组是The Open Group架构论坛的一部分。此前,工作组对企业和解决方案架构师进行了调查,并发布了关于数据集成技术标准的白皮书,指南的制定是其发展计划的下一阶段。为了编写指南,工作组将研究趋势和实际案例,并审校其他相关的标准。这项工作将由架构论坛成员在其他机构特邀专家的协助下进行。

 

Dr.Chris Harding

Lacibus Ltd.的创始人兼负责人

 

Chris Harding是Lacibus Ltd.的创始人兼负责人。在担任The Open Group开放平台3.0™论坛主任期间,他成立了一家以虚拟数据湖和以数据架构为基础的公司。

 

多年来,Chris一直在The Open Group任职,支持其成员在数据通信、目录互操作性、网络、面向服务的架构、云计算等领域的活动。他是《The Open Group指南:商业云计算》的主要作者,帮助制作了The Open Group的众多出版物,并撰写了多篇博文。他对企业架构一直持有极大兴趣,并作为TOGAF支持数字企业工作组的成员,参与了TOGAF®标准的早期开发。目前,他现在的主要重点是数据平台领域,关注了与此相关的几项行业信息,并参加了The Open Group数据集成工作组。

 

在此,非常期待有意向或兴趣的相关人士,可以加入到这份指南的调研和编撰工作中,一同为数据集成领域的发展与实践献计献策。