(1)V1.0:使能
用平台工具提升数据处理的操作效率、降低技术操作门槛,这是一种让技术人员将数据使用起来的层次。
(2)V2.0:更快
将技术、数据、文化这三个要素在数据中台中进行统一,提升企业业务应对变化的能力(数据中台战略核心是让业务人员利用可重复的技术方法快速试错),这是一种让企业人员更快地使用数据、试错的层次。
(3)V3.0:智能
让数据智能有效地用起来,一方面数据操作系统更智能地理解含义,自动操作数据全链路;另一方面在数据应用上不断创新和深挖,这是一种让数据自己生产起来、繁衍生息的层次。
标签类目体系方法论的第一性原理是“树形结构的标签树”,这一基础原理可通过4个核心二级理论来具体阐述:
设计标签类目体系需要从“根目录”开始梳理。“根目录”所对应的数据粒度为“对象”。对象分为实体对象和关系对象。因此存在两大类标签类目树:实体树和关系树。
树的枝干部分对应的是标签类目体系中的类目,即标签分类。类目是一种分形结构,可不断分化下去;也可根据场景需要,截取任意一个子系统作为独立的标签类目使用。类目是对标签的分类,而非对对象的分类。
树的叶/花部分对应的就是对象的各种属性,即标签。标签在数据库表中映射为字段,是经过大量数据应用实践验证的最合适的数据资产粒度。将根、枝干、叶/花串联在一起就构成了一棵标签树的基本结构。
2.3.1 叶和花就像动态标签、静态标签
(1)动、静标签的区别:动、静标签的区别在于某一对象个体在该标签下的标签取值是否会经常变化。
(2)动、静标签的联系:静态标签的取值可能会影响动态标签的取值。如性别取值为女,很可能会影响一些行为动作类标签取值。由大量动态标签的取值可以推测和推算出静态标签的取值。如通过大量的消费、浏览、收藏类标签取值可反过来推测性别标签取值。
2.3.2 叶和花似基因,影响群体形状
类目树上的叶/花就像基因片段一样,一一映射、影响着种群个体的属性表现,取之不一;而种群中正常个体的基因类型都一样多,标准统一。
2.3.3 标签类目体系实质上是对对象属性的模式设计
某一类对象的标签类目体系设计实际上完成了对该类对象属性的模式设计。设计好的标签类目体系就像模具一样,能将该类对象下具体个体的形象特征快速地刻画出来。
2.3.4 打标签和标签设计的区别
打标签类似于对具体实例树的某一片叶子涂上颜色,即标注标签值或计算标签值;而标签设计则是在模板层面的形状设计,两者不在同一纬度。
2.3.5 元标签
叶/花本身是对对象的属性刻画,同时也存在一些属性是对叶/花进行属性刻画,这些用来刻画标签的标签称为元标签。
标签体系设计师一种对对象统一进行本质刻画的数据描述办法:把个体观察升级为群体观察,而非过去对个体现象的归纳,更具有面向未来的场景化适应能力。
关系树连接不同实体树,但动态标签不能简单地直接从关系树上摘下叶子粘贴到实体树上。需要经过对象角度的转化和统计形式的转化。
实体对象的动态类别标签往往经过统计或算法计算,是对一系列明细行为数据再加工所得。因此从实体对象树上的一片“有颜色”动动态叶往往可回溯出一大片具体的明细行为叶,甚至打开一片具体的关系实体树森林。
实体对象的标签会随着与之相关的关系对象的增多而相应地增加和丰富起来。每新增一种动作、行为、连接,即关系树,就会在实体树上映射转化出一片新类型的叶子。
如标签在业务中被广泛使用,则价值地位非常稳固,且会在数据资产体系中得到相应的服务保障,如数据治理、资源优先、运营营销等;但如果标签只被使用一两次就被搁置,或完全没有业务使用,则会因为营养不足而凋零下架。将没有复用价值的标签下架是必须考虑的标签生命周期过程,否则企业很容易面临数据资产爆炸的风险,即数据项越来越多,管理运营成本巨大。
每一种实体对象、关系对象都会形成一棵独立的类目树,对企业数据资产用标签类目体系的方法梳理后,一般会整理出非常多的树结构。关系树结构一旦形成就会比较稳定,而不太会发生形态变化,而实体树结果会随着关系树的新增、消亡而发生相应的树形变化。
企业需要重点维护的就是使用频繁、具有复用价值的实体树,业务关系是现象,而实体往往是商业本质。
标签类目树和生命进化树一样,受到能量、环境影响而不断分化、形成丰富的标签簇,标签簇会经历优胜劣汰,自然选择。按照建设数据资产的目的和节奏不同,有两种模式可供参考借鉴。
如果企业构建资产的目的是形成数据资产的完整规划,指导数据收集、整理、加工、挖掘等各阶段工作,并愿意花费较长时间来实施数据资产的整体规划,那么可选用这种模式
无论采用那种方法,都需要从根部到基础树干,到细分枝干,再到树叶,体现的是一种整体规划思路。
如企业构建资产的目的是支持业务场景,特别是使多个业务场景间能快速复用标签资产,需要快速减到数据成效,那么可选择该模式。
直接从对象经典类目树上任务部分截取所需的部分分支,拼装上根与叶子即可。因为标签类目体系是一种分形结构,整体和局部有同构性,任何一个局部分支都可剪切出来作为独立的类目树。
在进化过程中,重要的不是都某一条线的极致进化,而是不断分化的分支。企业应梳理出全集团多业态多部门尽可能多的数据,不断进行能量映射和基因交叉,形成丰富有趣的标签簇,并通过标签类目体系方法进行有序整理和组织,使数据资产不仅能满足将来各种场景的需求,还具有非常旺盛的自我迭代能力和很好的可延续性。
通过标签类目体系方法论所形成的数据资产库包括资产清单和资产实体:
分析服务经常会运用在业务系统中OLAP分析型数据操作中,过程如下:
数据分析就是对某一对象全体在某一属性标签上的取值处理,即对有颜色树叶在某一纬度切面上不同变形;取值分布就是颜色分布变形为不同数据轴上的数量表示;求平均就是将各种颜色在数量上差异变形为最终的调和色彩。
圈选服务经常会运用在对特定目标对象的操作中,先确认并选中对象,圈选服务创建好后生成API或交互界面,具体业务系统或业务人员可调用API或通过界面系统操作来使用该服务。