圆桌讨论嘉宾:

数据质量峰会嘉宾车春雷

车春雷

建设银行数据管理部数据标准处处长

数据质量峰会嘉宾

邹建东

江苏省中医院数据中心主任

数据质量峰会嘉宾万鹏

代国辉

药明康德集团文件管理部主任

数据质量峰会嘉宾谭海华

谭海华

大数据共享技术专业委员会主任

数据质量峰会嘉宾

汤武昌

Netpartners 总执行长

数据质量峰会嘉宾Aisan Baird

Aisan Baird

Syncsort数据质量产品全球负责人

数据质量峰会嘉宾万鹏

Shinjiro Nakayama

Agrex 数据质量业务总监

圆桌讨论:数据质量在当下的迫切性及对各领域的影响

本文根据【DQMIS2018第二届数据质量管理国际峰会】圆桌讨论现场对答内容整理而成。

数据质量管理国际峰会演讲嘉宾邹建东

讨论话题:数据质量在当下的迫切性及对各领域的影响

  简单来介绍数据质量智库,数据质量智库是我们这个峰会在发展过程中衍生出来的智囊团,是旨在汇聚中国数据质量领域的一些前沿思想以及实践经验,推送技术干货解读行业热化,来整体提高国人对数据质量的认知水平和实操能力的智库群。

  在首批专家招募中也收到了各领域专业人士的积极响应,其中也包括学术界的学术机构还有产业界的、银行、金融、医院专家的参与,还有一些技术服务商包括来自美国、日本以及中国本地的数据质量专家,我们从整个反馈当中也看到了数据质量市场在茁壮的成长,并受到越来越多的关注。

  接下来的圆桌讨论我们也请到了智库专家的代表,他们来自各个领域甚至不同的国家,在这里共同探讨数据质量在当下的影响。

主持人:从中国产业界的问题开始,首先我想从中国产业界的问题开始,先问一下建行的车处长,金融作为传统产业数字化转型比较活跃的行业,您觉得数据质量在当下的紧迫性以及受影响的方面会有哪些呢?

车春雷: 金融行业是在这些行业里面监管行业最严的一个行业,目前在国内是数据治理最难的行业。实际上金融行业每天都往政府、各级监管层去报送数据,监管是我们的合规,是我们的第一要素,这是第一点;现在金融业大家谈的最多的一个词就是金融科技,在国内尤其是在中国大陆的银行,支付宝和微信对其产生了很大的竞争力;不管是我们的银行,还是支付宝、微信,后面支撑的都是互联网公司,都是叫数据公司;对银行,我们要管理好,要创造价值,但这并不是同业之间的竞争,尽管互联网对我们的竞争很大。不管是从外部监管还是从市场内部竞争,都是必须要把数据踏踏实实做好的。

主持人:传统产业数字化转型会遇到诸多问题,而作为改革的重头戏,医疗也是大众关注的重头戏,接下来的问题我想问一下江苏省中医院数据中心的邹建东主任以及药康明德文件管理部的代国辉主任,你们对医疗数字化趋势下的数据质量的理解及其应用的重点难点会有哪些?邹主任您先说。

邹建东:我是来自医院的,近段时间我比较焦虑的就是数据中心如何治理?数据是非常混乱,牵扯到几方面。第一个在很多方面缺乏标准,特别是中医,在不同的流派对于同一个术语有不同的表述,这是一个问题:标准如何?第二个就算有标准,标准和标准之间也会有很多的冲突,也导致我们在实际应用过程中会产生困惑。标准不一样,这一次按照这个统计来进行分析,下一次按照另外一个统计进行分析,就会带来很多的问题。这是我们的需求,我们算是发展中的国家,需求巨大,希望在座的各位将来能够参与到医疗数据管理过程的创建中来。

主持人:代国辉主任您的观点。

代国辉:我们从两个方面来说。第一个从行业,从医药这个行业来说,它的强监管是这个行业通用的要求,我们要遵从;第二个我们作为一个数据质量公司,高质量的数据能够把我们的公司做的更好,这样也是证明我们研究能力的一个体现。接触GDPR的时间也不久,然而目前对数据质量的要求却是非常高的。除了刚才提到的数据完整性,我们也对比了其他的,除了数据质量的通用性的要求外,我们在数据质量方面除了数据本身也会有流程上强制性要求。流程上要想做这个事情,那你这个人首先就要经过培训,培训之后必须要参加试验,做试验记录必须要参加考试,考试一百分之后你才能够具有写试验记录的资格。如果99分你都通不过,确保写的人有这个能力去做到这个事情,这是从写。他所写的东西,按照同步性的要求,都是要求当天试验当天书写完毕,这个压力很大。从规则上来说必须这么做,写完之后必须要有组长或者是相关人员进行审核,审核时间必须要在一周之内完成,这个做完之后又面临第二轮的审查,更高级的管理人员会对这个试验所做的过程进行内部审查,内部审查之后公司合规部门会进行合规层面的抽查。一旦合规抽查出了问题,那就是要记录合规的重大扣分项,如果一旦记录就会影响整个团队年底的绩效考核,这是内部的监控。

  当然,外部不论是FDI还是CFDI以及客户也会对我们的数据质量进行相应的审计和审查。尤其是现在突出的飞行监查,不给你准备时间,如果你的准备工作中没有做好,那在飞行监查的时候就会暴露出来。我们从人员、流程,我们所使用的设备、系统都要经过验证的,设备没有验证设备是不允许使用的,计算化系统是要经过验证才能使用的。这个行业要求比较多,也希望在这个行业中能够跟更多的同志有交流,希望把数据质量做好。

主持人:好的谢谢两位的分享。听完产业大咖对数据质量的理解及应用分享,接下来我想把问题抛给不同国家的数据质量技术专家们,首先问一下华矩科技的董事长CEO谭海华先生,您对中国目前数据质量发展的趋势重点及市场的应用方向怎么理解?

谭海华:刚才我也讲到这个方向,我可以明显感觉到这两年数据质量是非常热的话题,发展的非常快。大家在提到了专业度,包括需求也越来越专业、丰满。从整个市场来看,我们是增长的势头,这是在我们中国的情形,谢谢。

主持人:谢谢谭总。中国的大数据技术也是近几年才开始火起来的,而数据质量更是滞后国外发达国家很多年,下面我们也听一下分别来自美国、马来西亚、日本这三个国家的数据质量技术专家怎么看待这个问题。第一个我们先问到马来西亚Nepartners的CEO汤武昌先生,汤总您好!请问目前数据质量在马来西亚发展的现状如何,在哪些行业哪些应用上会比较常见呢?

汤武昌:我们在马来西亚数据质量到了这个阶段还蛮好的。我们在14年前,已经逐渐发展数据质量的行业,那个时候我们就已经觉得这是很重要的部分。因为我们看到很多问题衍生都是因为数据质量所造成出来的,比如说我们分析表的错误率、还有用户的经验,那时候我们已经很迫切的要把这样的好东西介绍给我们的用户。不过我们发觉我们很多时间都是用在教育方面,在上世纪的时候,我们的成果在那个时候不是很好;到了这个世纪,我们觉得我们的成果大多数都是来自于罚款。在金融业,马来西亚有一个中央银行,因为他们需要准确的数据来做分析、监管之类的行动,他们要求每一个银行的报表都有一定程度的准确性,所以罚款就是一个必然的步骤。刚才邓博士和Aisan Baird谈到的GDPR,那个罚款是蛮高的,在马来西亚也是蛮高的,这个就造成了迫切性。金融业对数据管理的迫切性,我们是很高兴看到这个进展,对我们来说是久了一点。那时候就是皇帝不急太监急,现在还好,我们希望数据质量的知识可以更广泛的传播给其他的客户。

主持人:好的,谢谢汤总。之前的演讲中我们有了解到GDPR的问题及应对方案,那么接下来我想问一下美国Syncsort的数据质量产品全球总监 Aisan Barid 先生,Aisan所负责的产品Trillium Software已经连续12年蝉联国际知名评测机构Gartner发布数据质量工具魔力象限领导者,而过去20余年的时间Aisan也潜心研究数据质量领域。那么请问Aisan,数据质量技术其实已经风靡美国十几二十年,而近几年才慢慢在中国崭露头角,您能分享一下美国目前数据质量的发展状况及市场的应用趋势吗?

Aisan Baird:谢谢,我们看到很多质量管理应用正在蓬勃的发展,不仅在于金融行业,几乎是在每一日的日常应用当中。比如说零售,我想我们可以用数据质量来促进零售商店的运营。如果你想找到某一个客户,他们上网搜寻这个零售商的商品,如果有就会来到商店进行购买,比如说你要买一瓶酒,他们就会有记录,下一次购买者他去了另外一个地方,零售者就会得到这个记录,他在这个时候买了这瓶酒,下次去到另外一个地方,我们就可以用这样的数据进行引导销售。数据质量的应用在很多行业都有,包括像支付行业,洗钱是一个很严重的问题,我们需要了解我们的客户,要充分了解我们的用户能够去验证这些支付活动。另外在导航方面也有用到数据质量应用,当今我们想要快速到达一个地方,驾驶员就可以输入他们的地址通过导航快速到达这个地方,这就依赖于准确的数据,这就需要有很好的数据管理和治理。这一方面也需要用到大数据,大数据推动了很多分析,我们会用到各种的数据,数据用于不同的用途,组织任何机构有时候也需要呈现这些数据来谈谈我们能够用这些数据做些什么,这些盲从我们也需要有很好的数据,也需要有很好的数据治理来去得到有效的应用数据。

  最后一个应用就是手机的应用,通过手机应用我们会给出关于我们的数据,这些应用开发者他们会使用这些数据来改善他们的性能,能够呈现出更加完整的关于用户的数据。在数据收集的过程中,如果我们能够有很好的数据管理,就能够让我们对用户有更好的洞察力。不管英美还是是中国数据的发展,都是因国情而异, 并且大家都能够从数据过程管理当中获得受益。

主持人:谢谢Aisan。Last but not least, 最后一个问题我们问一下来自日本Agrex公司的数据质量业务总监 shinji 先生,日本作为我们的邻国,在数据质量的发展上有表现出很大的差异吗?主要的应用会在哪些方面?

Shinjiro Narayama:中日之间的数据应用没有太大的差异,中国正在快速的发展,特别是他的人工智能甚至是比日本的要先进很多,我们也从中国学到了很多关于技术、深度学习、人工智能方面的知识。关于数据质量最重要的是大数据,实际上在1997年有这样一个对话,大概是20年前,为什么韩国软件这么棒,为什么三星公司这么棒,还有业务外包。我觉得业务外包在中国非常流行的,BPO包括客服中心,还有业务外包,我们有这个主数据,它包含了三十万条地址,这个数据是非常准确的。另外在日本也有关于明确的数据在这方面一共有超过70万个数据,它应该是覆盖了90%的日本人口。我们的业务就包括提供这种主数据。在20年前Agrex还不是那么大的公司,他们对日本的数据也不是特别了解。我们就给他们提供了一个设计提案,我们还派人去波斯顿进行讨论,告诉他们关于日本数据的发展情况,包括所含有的地址、数据、名字方面的数据信息。实际上我们与他们建立了非常好的关系,我们几乎引进了很多的客户来到日本,我们的客户还包括微软,包括(英),我们也希望进一步的拓展伙伴关系。

主持人:谢谢Shinjiro Narayama,圆桌讨论至此结束。