中国经济导报记者|荆文娜
近日,《2016年度国家人口与健康科学数据共享平台科技资源》在京发布。据悉,这是国家人口与健康科学数据共享平台自2002年运行以来,首次向社会公布大数据资源。本次发布的数据量高达49.1TB、2.8亿条,包括生物医学、基础医学、临床、公共卫生、中医药学、药学、人口与生殖健康七大类。
相关专家认为,随着国家“十三五”规划纲要把大数据作为基础性战略资源,全面实施促进大数据发展行动,大数据资源越来越凸显其巨大潜在价值。作为国家级健康数据平台,把标准和共享放在国家的高度推进,对于国家政府的决策、病人就诊和医改体系完善,以及科学研究等方面都会提供强有力的科技支撑。
鼓励大数据发展政策频发如何利用好是关键
中国医学科学院北京协和医学院校长曹雪涛院士介绍,2016年对中国医药界来说是不平凡的一年,特别是国家出台了一系列关于医疗健康大数据指导原则和相关文件。2016年6月,国务院办公厅颁发了《关于促进和规范医疗科学大数据应用发展的指导意见》,首次把生物学资源和医疗大数据作为国家的基础战略资源,也将其纳入了国家大数据战略的布局。2016年8月,全国卫生与健康大会召开,又进一步提出要完善人口健康信息服务体系。2016年10月,“健康中国2030规划”发布,规划中也将医疗健康大数据应用创新与发展列入了国家一项重要任务。
中国工程院院士、共享平台管理中心主任刘德培院士告诉中国经济导报记者,此次发布的数据较为详尽地反映了我国居民健康状况。以我国国民体质与健康数据库的建设为例,抽样调查了16个省份的48个县市居民,其中4省还进行了二次跟踪调查,指标涉及12大类、240余项,还包括生理信号和图像类数据。
北京协和医院原副院长陈杰表示,以我们研究数据库多年的经验来看,理想的健康大数据应该是科学的、真实的,应涵盖个人由正常到病态的全过程健康信息。以建立个人健康档案为例,从每次健康查体,到医院就诊看病,档案应该始终伴随其始终,应是一个系统而全面的档案,且需人人享有。每次数据都能溯源,既真实、科学,又系统,这样将数据集中,形成数以几十万、上百万计的大数据,将来再从中找出规律。通过看一个人的病,与看100个人后提出的规律是不一样的。这样的大数据,未来无论从科学决策还是寻医问药方面,都会起到科学决策的作用。
据了解,目前国家人口与健康共享平台上有7大类36亿条数据,这是一个极为庞大的体量。下一步,医改将在保持改革连续性的基础上更加强调前瞻性和创造性,我们又应如何利用好大数据?
首都医科大学宣武医院神经内科副主任宋海庆向中国经济导报记者介绍:“我来自临床一线,宣武医院神经内科在国内是比较有影响的,除了医疗工作外还有大量的研究及管理工作,如北京市脑卒中的指控中心就在宣武医院。”像这类工作都需要大量数据的支持,特别是在研究中,都希望研究样本量要大、数据要多,将患者一个个信息最终汇总形成数据库。随着技术的进步,数据传输、存储、分析都便利了,有大数据工具可帮忙解决问题。如在流程管理上,把过去简单的电子病历系统通过前结构化和后结构化的手段将其完全数据化,这样就形成医院内部较完善的大数据库,可同时满足临床、管理及科研工作。“大数据对我们医生特别是临床医生,也都要做研究,这是一个很好的工具,降低研究门槛,使我们管理做得更好。大数据对我们来讲是个很大的机会,前景也很诱人。”宋海庆说道。
打通壁垒使数据“活”起来才是理想的大数据
尽管健康大数据有众多优点,但大数据在医疗健康行业的应用还较为年轻,也面临数据安全、互联互通等问题,需要各行业协调发展。
国家人口与健康科学数据共享平台管理中心常务副主任尹岭坦言,人口健康大数据发展难题是隐私保护和共享。共享平台首次向社会公开发布数据资源,有利于进一步推动人口与健康科学数据共享,促进相关领域的科学研究成果和数据红利得到充分释放,带动生物医学数据资源整合与共享,为推进健康中国建设,实现健康中国2030的战略目标发挥更大作用。
尹岭举例说,有从事家庭信息采集平台的企业反映,在其平台上已聚集了几十万的数据,希望继续扩大,但请示时相关领导认为把家庭个人信息放在企业平台上不安全。有时在保护隐私的同时,也一定程度上阻碍了数据的共享。这种情况下,通过国家级的人口健康平台为13亿人搭建家人健康“银行”,做科研时可隐去隐私部分,保证个人及家庭的数据信息安全。刘德培介绍,为保护数据提供者权益和个人隐私,共享平台在建设过程中,自动为每个数据集提供唯一标识,并为数据提供者创立电子注册证书。在数据导出时,去掉个人姓名等关键信息,实现个人隐私安全。
“要正确面对隐私保护和共享。希望更多的企业从事家人及个人的健康数据采集,也希望利用人口健康平台为大家提供服务。”尹岭期望。
而宋海庆则认为,目前其最大的问题是在数据的使用上。宣武医院为了工作及科研需要,也建立了很多数据库,包括与脑防委合作的脑卒中筛查,在6~7年时间积累了大量数据。最初只是为了做科研写学术论文,但时间久了发现这些数据非常有价值。比如做脑血管病筛查,筛查后患者的健康信息被分层。最高危的患者一定是医生甚至外科医生手术最关注的;次高危人群则要与许多健康资源对接。“这部分数据如果仅是为了医生分析数据撰写论文,显然是极大的浪费。如果能通过国家级的人口大健康平台,将数据整合,或通过完善的对接代码,将每个机构孤立的数据通过平台打通,使用上才能更方便患者。”宋海庆深有体会地感慨道。“如在进行数据筛查时,发现心脑血管病高危患者,就可以向北京市急救中心开放共享数据,这样患者就可以得到更加及时的救助。”
数据开放是政策观念问题,目前各单位都有很多顾虑。而大数据如果真的只是堆放在那里,距离满足科研的需要还是远远不够的,最终还需要各种资源的融会贯通,通过制定规则和进一步规范,使数据“活”起来,才是真正理想中的大数据。
除此之外,陈杰还坦言,从技术层面讲,目前既懂医学又懂技术的“两栖”人才非常短缺,这个问题非常迫切。我国人口众多、病种齐全,资源非常丰富,如何将其变成科学的能够展示的数据,让大家广泛使用,需要足够的“两栖”人才队伍。从国家层面重视,将人才队伍建设好还是非常重要的。