【北大CIO班十周年】孙喆:医疗大数据的实践分享

2015-12-09 10:28:17  来源:CIO时代网

摘要:2015年11月28-29日,北大CIO班十周年年会暨首届中国行业互联网大会在北京大学与宽沟会议中心隆重举行。29日,互联网+医疗卫生分论坛在宽沟会议中心隆重举行。
关键词: 北大CIO班 CIO 大数据 医疗
  2015年11月28-29日,北大CIO班十周年年会暨首届中国行业互联网大会在北京大学与宽沟会议中心隆重举行。29日,互联网+医疗卫生分论坛在宽沟会议中心隆重举行,来自医疗行业的资深专家与CIO代表们参与了此次论坛,北京医渡云科技有限公司CEO孙喆为大家带来“医疗大数据的实践分享”,以下为演讲实录:
 
  大家好,今天很高兴有机会和大家分享一下关于医疗大数据的一些事情。因为这个话题,我发现这两年非常非常热,所有的各种医疗论坛,任何一个平台都会加上大数据这三个。那我今天就想跟大家分享一下医疗大数据,从我们自己现在开始做医疗大数据有一些实践上面的分享,也希望大家在自己的医院也好,区域建设也好,能得到一些启发。
\
  我们认为,从大数据这个事件上来讲,对于医疗机构来讲,最大的价值在于说,它从一个个人经验,推广到一个群体智慧,什么概念呢?过去医生看病,它不光是一个多么专业的专家,它其实是将过去所有的经验智慧分在他自己的脑袋里。一个病人来,他给病人的看病过程,基于自己的思维模式在处理这些病人的特征,然后来得到一个诊疗方案。
 
  所以,医生和医生的区别就在于说,他的经验程度和他对于这个专业领域的知识吸收的能力。从现在来讲,新的技术的发展,可以让我们对过往的病例做大量人群上的处理,帮我们找到人群的特征的特性,不管从疾病的因素,这样的模式,大数据最大的价值就是在做这个事。让大家有了更容易学习的机会,同时把学习成本降到最低,用系统化的方式,信息化的方式,来帮助医生找到过去可能我要花十年时间去学习的事,今天可能需要花一年的时间去学习。
 
  现在很多人都在谈大数据对于各方机构的价值应用,这张图大家也可以看见,医疗机构也好,研发机构也好,包括社会居民,他们之间是有大量的数据交互,这种数据的交互形式,从表象来讲是业务,业务的背后其实是数据分析。数据和数据分析在支撑着业务的流转。
 
  举个例子,刚才讲到的医生给患者看病这个事情,患者到医院做了大量的检查,经营数据也好,药品数据也好,这些数据医生给他做分析,帮助他找到更好的治疗方法,这个其实就是数据分析和数据的进步来推动医学现在的发展。所以我们说今天来讲,作为一家医院,大型的医疗机构,它想去在未来的十年或者二十年保存它的竞争力,构建医疗大数据也是非常非常重要的,数据驱动已经变成一个很时兴的话题,它方便跟医院现在最大的三个任务非常相关,一个是临床、一个是科研,一个是医院管理。
 
  真正在这三方面各家医院,从国内的医院来看,进展并不是很好。目前来讲,在临床这块来讲,医生的学习,或者说临床方法的治疗方案的传递,是非常非常迟缓的,每家医院都有自己的方法,之间的交互是非常低的。所以经常我去一些医院,有些医院就说那我们医院抗生素就是这样去用的,那你给我别的医院的数据,让我看抗生素怎么去使用,这种需求,有业务需求,但是过去一直没有这样的经验,所以一直认为,我的这种方法就是最保险的,也就是过去老医生一直传递下来的。
 
  第二块就是科研,现在今天的医生,因为职称的问题,包括有些大医院的专家五引领往前走,所以从科研的角度来讲,国外的也慢慢从前瞻性研究回归到回顾性研究,从过去的几百例研究,进展到几万例甚至是上十万例的研究,大样本的出现,意味着说医院的医生,他要用更新的技术,去支撑他的数据分析,才能帮助他做到更好的科研,找到更好的治疗方法。不然单纯的说,简单来讲,从国外的研究,照搬过来,在中国做本地化过程,并没有经过大量的验证,所以这也是为什么有些药品在中国使用有效性并不是很好。
 
  第三个讲医院管理,有一些医院,我了解到的,中国非常好的医院,一个院长需要的报表系统,可能要从第一天晚上8点多跑到第二天凌晨6点钟,这个也是因为业务的复杂性造成的,同时也是因为它系统的架构也有一定的问题。所以怎么样通过数据的方式和大数据的技术,去帮助医院达到一种像互联网化产品一样,能很快速的去做分析,去做决策,这也是未来医院竞争很大的趋势。
 
  所以,很多医院的医生,有一些院长跟我谈到一个问题,最痛苦的事情就是给医生去评职称,给医生去做绩效,在今天来讲,可能没有一家医院真正的做到给医生治疗效果做评价。
 
  所以,大家的问题就是通过这个医生在我医院服务了多长时间,他的服务的有没有缺勤这些东西来凭借他的业务,再通过他的发表的文章来评价。但真正的他治好了多少病,他有没有用最低的成本解决了更多的病人的疾病问题,这个没有一家医院有能力做到这种事情。我们看看国外现在在做什么事情,UPMC,这是美国从医联体的角度上来讲,应该是前三名的医联企业。大家可以看到,它每年在信息化的投入很大,这和它的收入规模有关,今年我了解到,UPMC收入规模接近于200亿美金,它一年在信息化的投入可能是在10亿美金左右,这么大的投入在干嘛?其实大家也可以看到,它每一个人均的数据规模,每一个人均床数的数据规模,是有300M数据,这300M数据还是不含影像的。
 
  所以,他每个人均数据的含量是比我们今天大医院所含的数据规模要大,至少20倍以上。这种数据规模的背后是说他们医院管理的精细化,和他们对于病人的理解和对疾病的理解的程度是不一样的。但是回国来看,在美国2006年的时候,它的数据规模也只有今天的大概15分之一。今天中国某种程度上来讲,是在人家7、8年之前的规模水平上。这种数据规模,我们也可以预见,中国在未来十年内会发展的非常迅速。
 
  所以,海量数据上升对医院,对于区域的卫生管理部门,怎么去做好数据筹划是非常非常重要的事情。UPMC在做两件事情,可以值得大家去借鉴,一个是他们所谓的临床大数据,他们也在提Big Data,第二个是他们讲的科学大数据,Big Science,这两个方面其实从两个维度去看,临床来讲就是今天很多企业,包括医院也在做的,我要去优化我的医疗流程,降低我的成本,做到更好的信息化。科学大数据指的更多的是跟数据相结合,跟生物统计相结合,来做一些个性化医疗的,也是这块发展起来。
 
  所以,在UPMC大家已经看到,它在和大量的企业、高校也在合作,像病理诊断,包括像临床的疾病管理,模拟,以及大家非常熟知的IBM做的等等。这些东西某种程度上来讲,至少我个人认为,这是未来医疗发展很大的趋势,新的技术会带来新的服务形态。
 
  我们说构建医疗大数据这个平台的要素是什么?我觉得从今天中国的医院现状来讲,其实四个方面,第一个也是大家谈的很多的,谈的都超过了五年以上的时间,解决信息孤岛的问题,这个是一个很基础的事情,但今天来讲,在中国的大医院当中,有非常好的集成能力,刚才谈到ESB总线的建成集成医院的屈指可数。第二个来讲,数据处理,这个可能是中国医院更感兴趣的,大家看下面有三块数据,一块是优化的数据,这就是我们经常看到的开了什么药,或者是做什么棂查,这是最好处理的一块数据。
 
  第二个是非结构化数据,也就是医生给我们看病的时候写的包括像病程数据,这些数据是医生在做临床决策的时候最重要的数据,也是做科研最基础的数据。这块的数据可以讲今天的医院信息化,几乎没有处理这块的数据,大家提出来的做法,是用结构化病理数据来做,这是一个很好的数据原料去解决非结构化数据,带来的麻烦在于说,医院不愿意去用,因为太麻烦,而且不贴近临床看病的场景。
 
  所以,怎么让技术和系统去处理这种非结构化数据,让技术帮助医生从后台就能找到他想要的数据,这个是技术给医生带来的帮助。
 
  第三块影像数据,今天可能大家真正在用的影像数据,其实是影像学论,而不是影像本身,所以这块数据利用对于中国的医疗机构来讲,或者行业来讲是一个很大的挑战。
 
  第三个方面我们讲的是医学探索能力,我们把所有的数据都处理好。也是变成大家想要的结构化的数据和分析的数据,怎么把这个数据有机的构建起来,跟我们医院的数据相关联,跟我们医生的诊疗行为相关联,这个事情是我们在基础之上做的事情。在这个核心的医学探索能力之上,才谈得上说,我们要去做一些应用服务,应用服务包括科研也好,医院管理也好,临床也好,这个是中国的医院和医疗机构最擅长的事情,我们对于需求的事情是内部缺失,对业务的缺失,需要做很好的关联。
 
  今天我主要分享我们所做的一家医院的案例,也是让大家直观的理解,它是怎么做的事情。这是我们国家很顶级的三甲医院,大家可以看到,他从09年就基本上把信息化做的差不多了,它的主要业务系统超过了60个以上,这个还不包括像APPS这种系统,只是说串联它业务流程有关联的系统60个,这些系统它所生成的电子化的就诊记录超过了2000按人次,从规模上来讲,也是一个年门诊量大概在300万左右的医院。它的电子病历有7000万条等等这些数据。
 
  它碰到的问题其实代表这个行业存在的问题,第一个,即使它已经有了自己很好的平台,但是它依然还有一些系统是存在一些信息孤岛的问题。第二个,非结构化数据无法优化,无法去做数据分析。第三个,数据分析非常耗时耗力。第四个,新型的应用服务还其实还非常缺失,系统满足了现在看病的基本流程,像新型的服务,非常非常少。第五个来讲,医院、机房、空间有限,不可能无限扩张。第六个,数据安全的需求,这个也是所有人都会谈到的问题。第七个,医院在信息化过程当中会扮演厂商绑架,厂商不配合,进展受制约。
 
  接下来第一个场景,有医疗数据第一个场景,其实最直接的从医生来讲,医生可以做数据分析,做科研,这是他一个很大的业务需求。而往往我们现在在推动数据整合的,不管在政府的角度上来讲,还是站在第三方企业来讲,其实都没有真正结合医院的需求,医院的需求就像刚才陈老师讲的一样,它只有从内才能发出新生。所以,科研需求的产生,是医院自己的需求,所以它有很强的动力,让它的数据变得很优,去支撑这个业务形态。
 
  在这之上,它会衍生出来我要做好科研,我单纯有临床数据不够,所以他会有集成,CRF的数据,这是什么?这就是大量医生在做的临床的研究的报表,它其实背后要去支撑它的是随访。
 
  所以,很多医院都在做随访,但其实随访的把数据集中起来,大规模做的医院非常少,你必须得把这些数据跟它的科研系统,跟它的业务团队绑定在一起。在这个之上,它就由于随访就产生了对院外的客户服务的管理平台,所以这就是它一个很大的业务模块。由此之后,又会出现说,有了科研数据平台,也要有项目管理,也牵扯出,有点类似于院线在做的偏向管理的一些OE系统这块的业务,这块就是医生数据,包括医生的评价和科研。就会看到说,医院出现协同工作的平台,医生和医生之间要做沟通心理研究,医生和医生之间要划出位置。由此之上,还有对于内容数据要有搜索引擎,又会产生对这些内容的整理之后变成一种医生之间的学习。
 
  所以,我认为,像现在互联网其实很多公司都在做其中的一些内容,但其实这些需求业务的本身,从医院自身的需求来讲,它是有一根主干,是可以自然长出这些业务场景出来。所以消息中心、业务平台、就会出现医院怎么去做管理,怎么去做指控,这些业务场景在于说,这些系统完善性的角度,右边那一块临床辅助决策,这个美国那边IBM在做这个,这一块其实没有这些数据,没有这些业务场景,单纯的去做临床辅助决策,很多数据不够,数据没法分析,这个是我们在这家医院的时候,去建设这个大数据平台的一条道路,也仅供大家参考。因为它有自己的思维模式,并不一定复制到其他医院都可行。
 
  我们看到说在这家医院里,它的应用平太就会集成所有的数据,不管是住院的、门诊的、急诊的,它的his、lis、pacs、emr所有的系统都要到这个平台来,这个做法跟传统企业可能不太一样。就包括刚才说到的,ESB,像所有的总线,像所有的技术,我们用了大量的技术解决这个问题,我们很多从数据库底层去做的,数据库底层去做的好处就在于说,我给你绕开其他厂商,从应用层面控制的事情。这个经验也可以供大家参考,有数据库底层其实某种程度上更快的集成方法。
 
  第二个来讲,在我做完数据的集成之后,做的是数据处理,数据处理可以看到,左边就是就是一诉五史,大段的文本数据,大段的EMR数据,基本都是这样的。基于现在大的互联网公司都有类似的技术,但是要场景化,要医疗化,用自然的语言把它变成一些灵活的数据,这样的好处,医生可以按照这个解读,我依然可以让你享受到优化数据的用法,但是不要求你说就像填表一样的填电子病历,这样对大家很大的不负责任。
 
  第三个来讲,我们在构建探索能力的时候,要解决两个问题,第一个问题就是说,我要把所有数据的关联都做起来,也就是说举个例子,我要去看青光眼,合并糖尿病的病人的特征,那我就要去找到它相关的疾病都有什么,相关的症状都有什么,它的人群是什么,所有的这些分析,我们不能像过去的方式一样,把它做的是一个报表系统,我要全部写死,要完全开放给医生,医生你想做什么样的分析,我这个平台上全部都支撑你。同时,效率要达到秒级,大家用惯了微信,用惯了百度,用惯了谷歌,一下子回到院内,要一下检索两个小时以上的东西,这对大家来讲是很痛苦的事情。
 
  所以,新的技术是可以去做这个事情。第三个从疾病的治疗的方法,刚才大家也看到了,一家医院陈列了这么多数据,两千万个人次的数据,回过头来讲,一个人的治疗候诊什么样,除了把病例能磨炼以外,对于医院来讲,医生来讲并没有好的方法去知道治疗过程是什么样。所以这个是我们现在做的时间轴类的应用,它的核心是以疾病为维度,让系统自动去识别整个这个人的治疗过程是什么,系统会自动按照医学的特性、疾病的特性,去产生很多的疾病本身的指标,这些指标是电子病例本身都不存在的。
 
  所以,我们就用这种方式帮助医生更好的理解疾病的治疗过程,从中去总结,去优化现在的治疗方案。
 
  这是科研平台的一些简单的示意,在线的医生可以把这个方案做完,刚才前面讲这么多,我并没有放技术的片子,或者技术方案。技术方案特别巧刚才黄总介绍了,我们用的基本上都是这一套,这也是一个发展趋势,整个医院也要慢慢逐步的开放,引进大数据的技术,来推动它,像包括现在大家可能比较多的,像Docker这些新的开元的技术,对医院来讲,一没有被商业软件所绑定的风气,第二来讲,它的前瞻性会比传统的商业产品要更灵活,如果医院有一定能力的话,用这种方式,某种程度上会更前沿,会更能贴近发展的方向。
 
  我的分享基本上很简单,基本上把我们做的事情向各位领导汇报了一下,这是我们简单的介绍。团队其实我们做这样事情的团队,大部分是互联网出来的人,百度、谷歌出来比较多,BAT出来的比较多,包括像301、GE,也有一些同事是从这些机构出来的。大家现在合作的对象一般是以国内最好的三甲医院,大型三甲医院为主,基本上都是各地全国最顶尖的医院。说实话,对大数据的事情来讲,只有顶尖医院,会是第一批尝鲜的人,它会更感兴趣,用大数据推动这个事情发展,由上而下一层一层去传递,传递更多的是一种服务,一种模式。感谢大家,这是我的分享。

第二十八届CIO班招生
法国布雷斯特商学院MBA班招生
法国布雷斯特商学院硕士班招生
责编:fanwei