与医疗健康相关的信息,均可被归入医疗大数据的范畴,数据来源可以是医疗和科研机构,亦可来源于个人甚至政府。其应用场景十分广泛,如药品研发,精准医疗,医保控费,个人健康管理,个性化用药,甚至分级诊疗、远程医疗等。从以太的经验来看,中国医疗大数据的应用各环节有一些共同的痛点。
数据孤岛
首先从机构层面看,在政府政策主导下,当前已经有70%以上的医院实现了医疗信息化,基础设施建设层面已经初见成果。
然而当前仅有不到3%的医院实现了数据互通:传统系统厂商数量众多,据不完全统计,当前国内HIS系统厂商超过500家,PACS系统厂商超过200家,厂商为医院单独设计实施系统,且不同系统会出现不同版本。使用传统方式聚合一家系统需耗时2-6个月,对医院数据采集和聚合耗时费力。尽管有移动医疗、远程医疗的一些创业公司会部署新的系统获取数据,然而众多互联网医疗产品的接入,造成了医患双方的额外负担。
其次,从个人角度来看,当前常见的直接获取个人数据的渠道主要有两个:可穿戴设备的佩戴或移动设备的使用,上门检测获取用户数据。然而这两种获取渠道对于用户来说都处于市场导入期,存量市场微乎其微,导入和说服成本巨大。
比如2016年中国的可穿戴设备仅有200亿市场规模,从使用习惯的角度而言,即使是美国2015年的数据,也仅有3%的美国人保有可穿戴设备。此外,用户的使用习惯和意愿也是数据获取的大敌,2015年美国市场研究公司NPDGroup的一份调研指出,超过40%的运动手环用户会在半年内弃用该设备,无法获得周期性可持续的数据。
上门检测用户数据当前常见的是血液检测和基因检测,从服务切入,未来通过数据积累应用到科学研究、医药用品研发、用户个人健康管理等场景,然而由于该类服务成本高,用户接受度低,数据获取也受到诸多限制。
事实上,针对前文提出的机构数据痛点,当前已经有一部分创业公司开始对数据进行整合,打造数据中间件。然而由于医疗机构之间的壁垒、检测水平、试剂选取等原因,数据口径和相关指标无法直接使用的情况依旧存在。个人数据源层面,不同数据分析厂商也会造成标准不统一的问题。
在具体实施层面,对于这些稀缺的个人数据如何整合,如何对不同领域和议题下的主题进行定义以及统计口径的协调将成为应用前的重要环节。在商业环境当中,这也将面临利益分配、如何分工合作以及伦理问题。
工具的缺失
医疗大数据能够发挥作用,还要看实际的应用和解读,如何正确解读数据,让数据对临床、个人健康、公共卫生、医疗保险等领域进行指导是医疗大数据最终落地的必备环节。
在任何垂直应用场景中,“know-how”都是很重要的一环。好的医疗数据领域的分析师也应当兼具垂直领域的专业知识和数据分析的基本能力,能够将业务和数据实现有效的整合。然而作为最匹配的复合型学科生物统计学在国内尚属起步阶段,由于数据市场上整体数据分析人才的缺失,能够落地到垂直领域的人数愈发受到限制。
其次是工具层面的短板,笔者在做数据工作的时候,有一个定性的发现:SAS、R、MATLAB等相对高门槛的工具在医疗行业里应用非常广泛,学科的限制导致了对工具的高要求,然而可视化的报表,直观的展现方式,能够有效提升分析的效率,“让专业的人做专业的事”。
隐私的边界
数据分析之后,如何落地,如何对患者体现价值也是当前数据应用的问题。对政府的部分数据更多反推至政策的制定当中,药品研发数据的最终落地和验证周期会更长。数据的价值如何对个体患者的体现,可否是个体用户可感知的输出,实际的作用如何去评估和衡量都是医疗大数据面临的问题。
此外,医疗数据采集、加工和应用的过程中,对于用户隐私的保护也十分重要,基于患者的属性,如检测指标和结果等,可直接对用户行为进行预判,如个人信息泄露带来的虚假推销等问题,因此,关注数据如何应用到个人层面的同时,信息泄露问题也是留意的重点之一。
第三方数据厂商打入医疗机构,并且使数据能够得以有效应用也面临推广的压力:高度资源导向型的医疗行业,行业、院校、机构、地域均面临重重壁垒,即使是上市公司也依旧无法打入某些区域,商务拓展难度和落地难度极大,一方面难以获取有效数据源,另一方面也没有足够的场景训练自身的模型。
对于这种情况,一些创业者采取了两条腿走路的方式:比如以太协助融资成功的“数联易康”,其一方面整合自身资源,不断与卫计委和医院进行商务拓展;另外一方面有效借助商业机构的网络,打破地域限制,快速实现自身的成长。或者如“永数”,直接通过产品创新,获取全国性标杆机构的支持,绑定进行推广。
文章来源于生物谷
如有侵权请联系管理员删除
扫一扫关注公众号,看更多生物竞赛干货
复制 shengwuliansai 微信公众号搜索关注