数据质量峰会嘉宾邓勇

邓勇

嘉宾介绍:
• 现已出版专著1部,参编著作6部,主持国家社科基金课题青年项目1项,北京市社科基金课题1项,参与国家社科基金项目和省部级课题10余项。
• 在《新华文摘》、《中国行政管理》、《上海交通大学学报》、《公法研究》、《中国机构改革与管理》等权威和核心期刊发表CSSCI论文和中文/科技核心论文60余篇,在《人民日报》、《人民法院报》、《检察日报》、《健康报》和《中国医药报》等国家级报刊发表法治评论100余篇,接受中央电视台、新华社、《经济日报》、《法制日报》和香港有线电视台等媒体采访80余次。
• 2017年被北京市法学会列入“首都法学法律高级人才库”专家。

峰会演讲目录:
• GDRP法规解读
• 医疗大数据的安全风险
• 医疗大数据的技术防护
• 医疗大数据的制度保障

嘉宾演讲稿一键下载

《通用数据保护条例(GDPR)》背景下 — 医疗大数据质量管控思考

本文根据邓勇先生在【DQMIS2018第二届数据质量管理国际峰会】现场演讲内容整理而成。

数据质量管理国际峰会演讲嘉宾邓勇

  尊敬的各位来宾、领导大家好,非常感谢会务组的要求,今天我将从医疗的角度为大家介绍GDPR背景下医疗大数据质量管控的思考。我自己是一位大学老师,同时是一名职业律师,今天的报告将从四个方面为大家做简要的介绍,重点会对医疗大数据的安全风险以及技术防护,再一个就是制度保障这三个方面给大家做一个介绍。

GDRP法规解读

数据质量管理国际峰会演讲嘉宾邓勇分享内容

  首先我们了解一下背景,GDPR是今年5月25日正式实施由欧盟颁布实施的,目标保护欧盟公民免受隐私和数据泄露的影响,同时重塑欧盟的组织机构处理隐私和数据保护的方式。我们中国目前也在起草中国个人数据保护法,但还没有实施。GDPR新规会影响哪些企业,到底是不是一个区域性的?还是全球性的?下面我们来看一下详细法规的解读。

  下面的这些公司应该遵守GDPR的新规:

第一个在欧盟境内拥有业务;不管公司注册在欧盟还是在中国,还是其他国家,只要你在欧盟境内发生了业务,你就得遵守我的游戏规则。
第二个在欧盟境内虽然你没有业务;但是存储或者是处理欧盟的个人信息,你也要遵守游戏规则。
第三个超过250名员工或者是没有超过250名员工;按照你的数据处理方式,若是影响到数据主体的隐私和权利,或者是包含了某些类型的敏感个人数据,包括姓名等等。
GDPR的新规几乎适用于所有的公司,普华永道提供了一个调查结果显示:92%美国公司都认为它将成为最重要的数据保护措施,国内立法的过程中也将参考GDPR。

第二个方面,哪些类型的数据将会受到它的保护:
第一个就是公民的基本身份信息。
第二个是网络数据,比如说IP地址、标签等。
第三个医疗保健和遗传数据。
第四个生物识别数据,如指纹、虹膜等。
第五个种族或民族数据。
第六个政治观点以及性取向。
怎么判断我们中国的企业是否要适用GDPR:

数据质量管理国际峰会演讲嘉宾邓勇分享内容

  是否是个人数据?如果不是,那就不适用;如果是,它第一个追问你是否有自动化的处置。如果你没有,那你是否构成或旨在构成存档系统;如果都不是,那就不适用。如果是,第二个追问是否在欧盟境内设有机构,如果说是,那对不起就得适用GDPR。第三个追问是否为欧能境内提供个人产品或者是服务,如果是,就适用。第四个是否对欧盟境内在欧盟境内的行为进行检测,如果是,就适用,这张图是最言简意赅的。

  既然是法,肯定要有法律责任,我们来看一看它的法律后果是怎么样的:

  如果某一项行为或者每一单行为违反到GDPR的规定,将会受到高达两千万欧元的严重处罚,或者是企业上一年全球年营业额的4%,而且是以较高者为准。根据Ovum公司提供的调查报告显示:52%的受访IT决策者预计他们会因为违规行为而面临罚款,管理咨询公司欧盟在第一年可能会收到高达60亿美元的罚款金额。

医疗大数据的安全风险

  具体到医疗大数据安全风险这方面我们来看一下,在2016年已经正式公布了关于促进和规范健康医疗大数据应用发展的指导意见,这样的意见不仅是约束到我们的医院,还约束到我们的企业包括相关的行政部。接下来就以解放军总医院301医院的做法给大家做一个交流,医疗大数据到底存在哪些安全的问题。

数据质量管理国际峰会演讲嘉宾邓勇分享内容

  首先就是医疗数据的泄露事件不断发生。2016年两百多名艾滋病患者的信息泄露,这样的泄露将会影响到后续的学习、生活、工作;2016年深圳多家医院万条产妇数数据泄露而遭遇推销;我们的信息在不知情的时候就泄露了。在过去几年,统方是一个巨大的腐败点。统方,每一个医院每个月用药的量是多少、高峰期是多少、哪一种治疗方案最多、哪一种药品用的最多这些信息都被泄露出来了,保险公司、药品、推销商等等就盯着一个个进行公关,最后导致的就是塌方式的腐败。

  再一个大数据环境下数据安全风险及影响增大。数据集中、量大目标明显,泄露后果更为严重,医院系统就被黑客攻击过,造成医院很长时间用不了。

  应用环境多元化,泄露风险增加。泄露后果既涉及到个人隐私,也涉及到医院泄密,还可能涉及到国家机密。

  坚持规范有序安全可控是国家发展医疗大数据的基本原则。国办发文强化标准和安全体系建设,强化安全管理责任,妥善处理应用发展与保障安全的关系,增强安全技术支撑能力,有效保护个人隐私和信息安全,这样的政策文件就是我们在座的每一个企业创业的法宝,是跟质量安全相关的,我们都会让他引用这个文件,这个文件是最具体的政策依据。

  安全是医疗大数据的核心基础和首要问题,我们要做到万无一失,一失万无,安全保护是一个复杂的技术问题和管理问题,既需要我们在座的每一位IT人士投入到这一项研发当中,也需要各行各业的监管者履行好管理的职责。

数据质量管理国际峰会演讲嘉宾邓勇分享内容

  在不同语境下的医疗大数据安全问题特点有怎样的表现形式。左边是场景,比如说区域的卫生,它典型在数据共享的居民服务,典型的居民公共卫生居民健康档案这方面,居民健康档案经常存在数据被伪造、篡改、泄露。很多农民工到了广东一带打工,最后说我们不能录用你,我们发现你有间歇性精神疾病,他说我自己从来没有发现我是精神病患者,就是因为他的居民精神病案被篡改。国家对每一个地区的人员他有一定比例的统计要求,不能说全部都是精神正常的,但是因为国家这方面的经费投入有限以及下面的人工作不到位等等,务工人员全部出去了,不在家里面,没办法,索性加几个,最后导致的结果公民的权利受损,一告一个准,一投诉政府就败诉。它的安全重点就是防护网络攻击和隐私保护。

  第二个场景在区域卫生数据管理与再利用方面,典型应用在管理决策和第三方数据共享,国家卫计委有专门的数据统计中心,像这些主要关注的就是决策问题和隐私保护、数据资源开发利用问题。

  第三个医院数据中心,主要防止滥用和篡改,它的得益者就是保险公司和药品研发公司。 第四个医院数据整合与再利用,涉及到科研应用与管理决策,这样的领域要做好隐私保护、数据资产保护。得数据者得天下,马云当时和国家食药监总局合作,要求由他的企业来运作国家药品大数据库,他投了好几个亿把数据库建立起来了,但是最后受到民众的质疑:凭什么一家民营公司可以运作国家药品大数据库,可以知道国家这么多关系到老百姓的安全问题或者是隐私性问题?你一家公司在这里经营,你有什么样的资格资质?在网民的一再质疑和媒体监督下,最后把这个项目叫停了。如果这个项目没有被叫停,后面产业链条疏忽是无法想象的,我们对药品的了解基本上通过百度,但百度的精准性都是存质疑的。

  我们今天要讨论的焦点在医院数据的整合和再利用,医疗大数据它的使用方式主要包括两个方面。

数据质量管理国际峰会演讲嘉宾邓勇分享内容

  第一个通过应用系统来使用,裸数据的访问服务。业务系统的使用主要有三个系统:病例检索系统、患者随访系统、专病数据库系统。这个相对来说安全防护比较容易,因为它有专业的公司为它提供技术规范并有技术保护。但是裸数据访问服务就不安全了,数据整合、数据预处理、数据分析建模以及可视化处理等等。很多病人的信息,包括临床手术的信息就是被这些相关的商业公司给拿走了。医院院长很头痛,他说:我怎么确保我的数据不因为某一个医生的腐败或者是泄露,或者是不小心而影响到我的交易。

  主要的安全风险包括隐私暴露、数据盗取、数据遗失、非法利用。防外,既要防止我们的合作单位泄露出去,也要防止外部的厂商怀有某一种目的来使用,我们一定要有相应的技术保证不把数据泄露出去。

数据质量管理国际峰会演讲嘉宾邓勇分享内容

  医疗大数据环境下的安全管理难点:

  第一个数据使用者的多元化;包括各类业务研究员、内部服务技术人员、外部合作人员。

  第二个使用方式的多样化;这个过程中是使用很多公司或者是国家指定的软件,这样多样化的软件工具也造成了监管困难。再就是本地处理:需求多,我们的系统都是跟着主任科室跑,主任说我要达到什么样的效果,你就必须按照我的要求来改。

  第三个就是数据需求的多样化;数据需求随机性大,缺乏明确的用户决策、隐私、去隐私数据共存,我们的数据都是拿闪盘来拷贝,大家觉得很不方便,但是又担心我们的数据上传到像百度云盘会发生泄露,所以现在没有绝对的安全,只有相对安全。

  第四个方面就是技术防护的多元化;传统数据库以及文件数据等等这方面,这种安全需要建立相应的防护体系,重点就是数据安全,包括物理、系统、网络、应用、数据以及管理的。

医疗大数据的技术防护

  接下来讲一下我们怎样从技术的角度来防范因为人不可靠。

数据质量管理国际峰会演讲嘉宾邓勇分享内容

  第一个要建立集中化的平台与服务机制;统一平台,改变数据管理使用各自为政局面,数据资源集中管理,避免分散流失,处理能力统一提供,减少脱机下载,数据安全统一防护,降低安全风险,第四个数据服务有序开展,规范数据利用。

  第二个去隐私,降低数据敏感度;第一个要去除或者是变换医疗数据中的患者识别信息,不同应用目的对患者识别信息有不同需求,不能说所有的信息都必须要经过处理。第三个就是结构化数据,直接替换,在这里我可以告诉大家,你可以直接参观北京清华长庚医院,他在数据保护方面做的是最好的,不管是患者的名字也好,性别也好,婚史也好,都保护的很好。比如医学影像数据,读取数据文件进行结构化替换,模拟影像,使用模板遮蔽。

  第三个按资源授权分解相应的安全风险,化整为零,原始医疗数据内容全、范围广,但每个研究主题明确,所需数据范围有限,为不同的专科、病种建立数据资源库,为每个临时研究抽取建立临时数据资源,按照独立的数据资源授权,这都是通用的手段,按需操作,绝对不全给你。

  第四个建立安全围墙,最终目的防止你拷贝,通过数据处理部署服务器,杜绝服务器从本地复制。第二个固定运营,数据难以批量下载。第三个,封锁USB端口和邮件,控制数据复制,这是通常的做法。

  第五个,数据库审计追踪使用行为,每一步操作都会留下痕迹,记录,而且你的ID都会被锁定,数据利用监重于控。

  第六个,堡垒机实现运维监控,实现对运维操作的记录与回放,实现对运营权限的统一和管理。

  第七个网络隔离划分安全区域,安全不同的安全等级划分网络,通过防火墙限制访问权限。

  第八个物理安全防止底层漏洞,这种安全相对是好操作的,但是信息量很大,我现在担任三甲医院的顾问,我们发现信息系统少则七八十万,多则上千万,因为我们要代表医院去审这个钱,到底值不值这么多的钱,为什么第二年、第三年你要提高价格,说实在的那里面的猫腻太多。还有机房安全、机构安全,服务器和网络连接等等。

  第九个,我们作为企业要紧密的跟国家行业组织保持联系,像我们华矩科技,他主要是对综合医院提供数据治理服务,服务旨在解决医疗大数据质量、标准化与结构化问题。现在很多医院都存在同种病症叫法不一的问题。具体的数据录入问题影响正确的对码造成医疗纠纷;第二个,错误数据发现慢,处理时间长;第三个,没有及时维护标准病种数据库;第四个,没有全面智能的医疗术语业务规则,病种名称编码难匹配,医院的业务一定要跟信息中心的主任搞好关系,而且是志同道合的,帮着他解决问题的态度,而不是我一上来就说医院永远是这个时代最稳健、最朝阳、最不会垮的实体企业,而且这个企业是红底的,我每个月要给两百多名三甲医院的校长授课,通过法务培训才能上岗,否则当地人民不认。

  解决方案:自动化数据的清洗与配备。具体方法涉及到数据质量诊断和清洗标准化、数据补全与去重、校对及匹配,这些没有什么绝技的,都是需要实打实的跟着医院,特别是三甲医院信息科主任去交流、思考,获得软件的系统,并马上请律师进行著作权保护推广。

医疗大数据的制度保障

  制度保护,管理技术相辅相成。建立安全制度,规定能做什么,不能做什么,规定职责和安全责任,规定如何做的流程,规定违规后的处罚,落实安全制度更重要,检查是否按制度落实,定期检查审计日志,另外有相关的规章制度,三甲医院会请我们给他制定办法包括手则。

  再就是安全风险评估和建立持续改进的机制,平台相应的风险和防护成本之间。我告诉大家,现在医院在有关信息化建设和信息化管理这方面投入是不计成本的,这是一项死任务。特别是国务院和国家卫计委现在已经大力的提出互联网医疗这样的一个政策,依靠专业的组织进行质量管控。2017年国家卫计委在中国卫生信息学会下面建立了一个健康医疗大数据医疗质量管理监督专业委员会,这个委员会和我们今天的主题是密切相关的,我们企业但凡想要跟国家对接上这样的关系,一定要积极参与到这样的行业活动中去,职责也是非常明确的。

  数据安全是医院开展医疗大数据应用的基础性问题。医疗大数据具有用户类型复杂、访问权随机使用方式多样,技术多元化等特点,安全防护难度大医疗大数据的安全管理需要针对风险特点、多种技术并用,技术管理并重监、控、管相结合,实现方便应用与风险防控的统一,为我们医疗大数据安全保驾护航,这今天我要讲的,谢谢大家。