华为云大数据轻模式体验:忘掉底层烦恼,专注数据开发( 五 )


通过上述四个步骤 , 将业务数据化需求进行抽象化 , 就可以输出企业标准化数据中台设计 。 完成数据模型体系的建设 , 对于未来同行业的解决方案建设也有了参考价值 。 通过主题设计可以很快的完成信息架构的设计 , 针对不同类型的信息 , 还可以指定数据类型 。
在主题设计完成后 , 就可进行数据建模 。 首先根据之前的主题设计进行建模 , 这里提供关系建模和维度建模两种建模方式 , 关系建模符合 3NF , 主要是去除数据冗余 , 使数据标准化 , 当存在多个数据描述同一个情况时 , 需要使用关系建模进行合并 。 维度建模则采用数据结构化的方法进行建模 , 针对需求和指标对数据源进行维度、事实建模 , 相比于关系建模 , 维度建模紧紧围绕业务指标 , 非常直观显示出业务模型中的业务问题 。 维度建模包括维度、维度表、事实表、汇总表 。
维度表多为业务指标的环境信息 , 比如时间、空间信息等 , 这里我们建模对门店和地区维度进行建模 , 这就是典型的空间信息 。 维度表是用户用来分析数据的窗口 , 一个维度表可以对一组数据进行分类 , 且分组后的数据可以用来分析 。 我们以门店维度表为例 , 门店包括门店编码、店铺类型、营业状态、门店名称属性 。 我们如果要计算坪效指标 , 可以进行门店坪效指标的计算、某一类型门店坪效指标的计算、营业中门店坪考指标计算等 , 通过这些指标可以定义一组数据 。
事实表内容主要分为三类 , 分别是维度表外键、事实属性和度量属性 。 比如门店事实表包含地区外键、门店编码外键、经营面积、开业时间等信息 。
华为云大数据轻模式体验:忘掉底层烦恼,专注数据开发
文章图片

汇总表则可以对上述维度和事实进行归纳总结 , 得出相应的技术指标 , 我们以地区坪效指标的设计为例 。 可以看到对应属性和相关内容的汇总信息 , 地区坪效指标可以通过技术指标进行确定 。
华为云大数据轻模式体验:忘掉底层烦恼,专注数据开发
文章图片

DGC 将指标分为业务指标和技术指标两类 , 业务指标模块主要是以文字的形式定义某一指标 , 并以此为参考指导技术指标实现 , 我们以坪效为例 , 坪效位于进销存管理中 , 根据坪效的定义 , 坪效就是门店销售额与门店面积的比例 。 通过这一文字定义 , 我们来到技术指标中 , 完成坪效这一指标的技术定义 。 我们也可以对员工的销售额与绩效关系进行统一的界定 , 对于需求调研层面的人员来讲 , 这些只需要文字描述就可以快速完成各种指标和属性的确定 。
华为云大数据轻模式体验:忘掉底层烦恼,专注数据开发
文章图片

通过以上的需求建设和管理 , 需求方很快的就将自己的业务需求确定好 , 整个过程都是可视化的 , 接下里再进一步的对指标进行运算分析 , 最终形成有实际意义的指导数据 , 这里则通过技术指标完成对业务指标的具体实现 , 包含原子指标、衍生指标、复合指标 。 原子指标是最基础的算子 , 是纬度在模型中某一个属性或属性的简单运算 , 在坪效计算中 , 主要用于坪效计算的就是门店的经营面积以及实际门店产生的销售额 。 这两个指标构成了坪效计算的原子指标 。
衍生指标则是对原子指标添加了一个纬度 , 对原子指标进行限定 , 使得这些原子指标更具参考价值 , 在坪效指标计算中 , 我们可以按照时间原子指标进行限定 , 从而衍生出新的指标 。 比如过去一年的某一地区的销售额、过去一年某一门店的销售额、过去一年某地区的经营见面等 , 这些衍生指标还可以进一步运算 , 得到复合指标 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。