【转】什么是数据标准


转自 微信公众号 数据学堂,地址 https://mp.weixin.qq.com/s?__biz=MzkyMDE5ODYwMw==&mid=2247486657&idx=1&sn=0a6184b597aeb631eba151d333f729a0&chksm=c197c065f6e0497358f5b80f96e921fa4a96bf13c005ec4d8627b4dd4d3a1247222919b3c321&scene=21#wechat_redirect

1 轨距标准

火车的通行需在事先铺设好的铁轨上运行,全球各国的铁轨宽度也不一致就会影响全球联运的业务。
世界上最通用的轨距为1435mm,这个结论是从铁轨的内侧测量得出来,也简单称为准轨,也是世界上使用频率最高的。
运力可以满足当前基本所有载重量的列车。

 由于中、朝、韩为标准轨距,可以将各国铁路相联结,实现火车的直通。另外,部分欧洲部分国家使用的是宽轨:如俄罗斯早期使用的是1520mm的轨道,致使行驶在“泛欧亚铁路干线”上的火车无法成为“欧亚直通车”,极大地限制了经哈萨克斯坦进入中国的欧亚铁路的国际联运业务。

 综上,因铁轨的标准不同,难以实现国家之间的火车直通,货物运到边境就要卸车或者更换车轮,然后继续运输,大大提高了运输成本。

2 数据标准

是指针对省联社各重要数据制定的规范性文件,以确保这些重要数据在全社内外共同使用和交换的一致性和准确性,是实施数据治理、提升数据质量的重要基础。数据标准按照数据加工程度划分为基础类数据标准统计类数据标准两大类型。

基础数据标准:是指银行运营和管理所产生和使用的具有共同特征的基础性数据。基础数据标准的层级关系梳理如下表:

信息主题 信息大类 信息子类 信息小类 信息项
客户

机构

个人




公共信息 基本信息 中文简称
开户证件类型
开户证件号码
......
管理信息 ......
联系信息 ......
关联信息 ......
风险信息 违约类型
违约金额
五级分类
......
财务信息 ......
...... ......
个人客户 ...... ......
机构客户 ...... ......
机构 ...... ...... ...... ......
财务 ...... ...... ...... ......
产品 ...... ...... ...... ......

指标数据标准:市值银行内部管理以及外部监管需求,在基础性业务信息基础上按照一定的计算和统计规则进行组合的业务信息。

业务主题 子主题
资产负债管理 资本管理,资产负债综合统计,资金交易分析,净息差分析,流动性分析...
风险管理 资产质量分析,信用风险分析,操作风险分析,授权管理分析...
监管合规 1104报表,任航金融统计制度,人行反洗钱监测,外汇管理局报送...

无论是基础数据标准还是指标数据标准,都包括业务属性、基数属性和管理属性。

属性分类 基础数据标准 指标数据标准
业务属性

标准中文名称

标准英文名称

业务定义

业务规则制定依据

......

标准中文名称

标准英文名称

业务定义

计算口径

纬度

值域

关联指标

统计规则

制定依据

......

技术属性

数据类型

格式

精度

度量单位

......

管理属性

标准定义部门

标准相关部门

标准应用部门

可信数据源

......

数据标准不统一导致数据无法流通,就像铁轨的宽窄不一导致火车无法通行。

 此外,还会存在一些列问题:

a)信息项冲突

b)信息项缺失

 A系统有的信息在B系统中没有。

 c)异常值

 上图引发的问题:谁才是公司的实际控制人 ?

数据标准不一致,也会给业务带来极大不便。如:

管理层提了一个需求:我们需要看上一个月逾期账户的数量

营销部门的统计口径:统计全社账户逾期天数>0的账户数量,得到结果 132

信息部门的统计口径:统计全社账户逾期天数>=1的账户数量,得到结果100

这种情况下,很难决定哪个数据是正确的。假如该组织有关于“上一个月逾期账户的数量”该指标的数据标准可供查阅,则可以明确其标准的统计口径为:统计全社账户逾期天数>=1,且逾期金额>0的账户数量,得出结果90,正确!

3 数据标准总结

a)管理办法流程制度

b)数据标准定义规范

c)技术平台工具支撑

数据标准是一套由管理规范、管控流程、基数工具共同组成的体系,通过这套体系逐步实现信息标准化的过程。通过一整套的数据规范、管控流程和技术工具来确保的各种重要信息。同时,数据标准实施以来语全社各部门之间的共识,以及业务和技术之间的配合。例如 产品、客户、机构、账户等在全社内外等使用和交换都是一致、准确、有效的。