Bootstrap

数据治理与OneData 体系

数据治理问题

OneData 体系

OneData 是阿里巴巴多年大数据开发和治理实践中沉淀总结的方法论,包含 OneModel, OneService, OneID 三个概念。

 

OneModel 统一数据构建和管理

将指标定义细化为:原子指标、时间周期、修饰词(统计粒度、业务限定, etc),通过这些定义,设计出各类派生指标; 基于数据分层,设计出维度表、明细事实表、汇总事实表。

OneService 统一数据服务

基于复用而不是复制数据的思想,能力包括:

  • 利用主题逻辑表屏蔽复杂物理表的主题式数据服务

  • 一般查询+ OLAP 分析+在线服务的统一且多样化数据服务

  • 屏蔽多种异构数据源的跨源数据服务

OneID 统一数据萃取

基于统一的实体识别、连接和标签生产,实现数据通融,包括:

  • ID自动化识别与连接

  • 行为元素和行为规则

  • 用户画像和标签生产