收藏本页 打印 放大 缩小
0

数据分析 让医疗开支更趋合理

——访美国田纳西州蓝十字蓝盾组织数据科学家Dr. Brandon Cosley

发布时间:2017-06-14 13:29:36    作者:王薇    来源:中国保险报·中保网

□本报记者 王薇

Brandon Cosley是美国田纳西州蓝十字蓝盾组织预测性分析团队的一名数据科学家。他致力于开发统计模型和高级分析解决方案,推进成员参与并提高运营效率。他的主要工作是进行预测性的数据分析,的角色是带领团队进行数据建模,对新产品进行评估,包括在开发过程中对用户的数据进行优化。

在2017 Teradata大数据峰会峰会上,Brandon Cosley做了《超越距离,获取医疗保健服务的地理空间应用》的主题演讲,分享了本人及其团队利用数据分析,优化医疗服务资源的经验。如利用数据分析,让医疗服务的地理分布更加合理,帮助客户减少不必要的急诊开支,以降低医疗费用,提高医疗效率等。在接受媒体采访时,Brandon Cosley又详细介绍了双蓝组织和他的工作。

为患者看病的账单付款

记者:您能分享一些侧重数据以及数据分析的成功项目吗?

Brandon Cosley:我们主要是为客户看病的账单付款。7年前,我们发现账单上这些数据可以用来甄别那些对某类疾病有高风险的人群。我们希望通过对这类数据的收集,来发现这些人群,帮助他们更好地管理自己的生活方式,以便降低罹患这些特殊疾病的风险。于是我们便打造了这个预测分析团队。

后来,这个团队继续发展,收集和应用了更多的大数据。到今天,我们现在还是收集了很多来自患者的账单,我们觉得我们可以更多地应用这些数据来触及到数以百万计的这些患者。

但是我们的一个比较大的增长是始于三年前,那时候美国奥巴马政府颁布了患者保护与平价医疗法案。因为政策的变化,政府就要求像蓝十字蓝盾这样的医疗管理机构,要用自己的大数据去触及到更多患者,来帮助他们管理好医疗费用,进一步刺激了我们的需求。所以蓝十字蓝盾机构经历了两次大的增长,第一次大的增长是我们突然发现我们有这么多数据,可以用这些数据去减少某些医疗诊断的费用。第二次大的增长是联邦政府颁布了新法,所以改变了对我们这样机构的要求,让我们不得不去受法律的要求去进行数据收集。

记者:除了做费用管理外,还有没有让用户知道用药或者是临床上的一些护理方面的指导?

Brandon Cosley:我们是有这样的一些工具或者服务。我们开发了很多工具帮助用户,如果他们要去找服务提供方的话,我们有这样的工具帮助他们找价格不同的服务提供方,这样客户既可以找到服务质量好的医生,也可以找到价格不贵的医生。

另外,我们还有一些费用预计工具,或者找医生工具,可以把医生的具体地址找出来,给客户提供这种洞察。但是这种数据的工具其实一直在演变之中,还没有发展到很完善的程度。

记者:你们是否会分析治疗用药的剂量或者用户用药的反应,类似这种医疗的数据?

Brandon Cosley:我们没有每个人的用药史。我们知道这个人去看医生,但是我们不知道他的用药史是什么。另外,还有些用户会在我们的保险范围之外去购买一些药,保外的公司的药物用药史,并不会跟我们进行共享。所以这部分导致我们在药物的历史上的信息并不是全面的收集状况,是有限制的。

但是我们的项目可以帮助识别到哪些用户可能未来会在哪些疾病上有风险,跟他们进行沟通,或者给他们发信息,告诉他们某些药可能快用没了,或者应该及时去药房添药了,这样的信息我们是有的。我们帮助客户去管理他们的医药费用。所以我们更多是一种医疗服务的公司,而不是药物服务的公司。这两者是有区别的。

另外,说到节省成本,我们会跟客户宣传一些知识,比如用一些仿制药可能会更便宜,而不是用品牌药。但这种节省费用的做法并不是大数据驱动的,更多是一种教育宣传驱动的。而且我们的数据挖掘都是基于客户拿着他的报销账单来找我们报销,这种报销的数据来进行数据挖掘。从这些数据挖掘中,我们可以发现哪些行为其实是成本非常高但是低效的行为。有些用户出现的是非紧急情况,但去急诊室看医生,这个导致的费用就非常高。所以我们就会用数据挖掘的方式去发现这些人到底是谁,然后把他们列入我们的宣教项目之中进行宣传,告诉他们怎么样用更低廉的办法来达到他们的目标,这样我们作为一个机构就不用付这么多钱了。

记者:您能不能在解释一下报销数据,比如这些数据中是不是包含了比如血液检测数据等?

Brandon Cosley:我想澄清一下关于报销数据。报销数据只是针对于在我们支付账单的时候需要的一些信息,我们知道哪个人哪天去看了哪个医生或者是哪个医疗服务提供方,这些信息是有的。我们也会用不同的代码来标识,他是初次诊断、二次诊断还是三次诊断,这些数据也是有的。但是没有具体的,比如他抽血的信息或者别的信息。如果要获得这些数据,我们要跟一些特定的实验室来建立合同关系,从他们那里获得这些患者的血液信息。所以我们除了要有每个人的报销信息,我们还要分别跟不同实验室来签合同,拿到这些人的一些具体的医疗信息。我们还要跟一些健康中心签合同,拿到这些人的免疫信息。因为在美国这些不同的医疗服务提供方是非常分散的,并不是集中式的。所以我们有的时候要跟私企签合同,有的时候跟政府签合同,分别拿到不同的这些报告。

我们企图是希望建立好一个网络,把所有信息都放进去,但是在美国目前是非常分崩离析的,只能从支离破碎的各个不同的方向来获得这些报告。

高效整合数据

记者:你们在提供这些数据产品时,使用了哪些Teradata产品,比如数据仓库?另外这个过程中的挑战是什么?

Brandon Cosley:我们自己的数据是叫做临床数据库,我们是把这些报销数据正式化、正常化、结构化之后,放到临床数据库中。放进去之后,这些分析师就可以从中提取它们,来进行一些分析。我们觉得临床数据库的做法是非常有效的,因为Teradata可以很高效地把这个数据进行整合,这点我们非常高兴。所以我们也在不断扩大使用Teradata的环境,包括使用Teradata的这些应用场景的规模也在扩大。

还有什么样的新产品呢?比如我们会用到Teradata的数据集分析的工具,我们还会用到Teradata的合作伙伴Fuzzy Data提供的数据,来进行更先进的统计上的建模。所以我们利用的就是Teradata这种可以同时处理的能力,他们的速度非常快,他们给我们提供的带宽也很足。这两点就使得我们的领导层不断地对使用Teradata作为供应商的关系进行更多的投入。

记者:Teradata给你们带来什么?

Brandon Cosley:Teradata有非常高效的平台,这个平台的功能不只是建立数据库而已,它还会给我们提供更多的数据建模的功能,它的软件优化也做得非常好。而且它可以在一个数据库的环境中,用很快的速度来计算数据。这是它给我们带来的价值,就是以很快的速度计算非常复杂的那些已有的数据。

记者:你们同Fuzzy Logic(一种工具软件)进行合作研究,能不能介绍一下这个项目的背景?

Brandon Cosley:我们是最近买了Fuzzy Logic的产品,跟他们一起进行对用户案例的研究,把这个运用于我们的药品数据,进行建模,来看一下有哪些人群很可能会对鸦片等精神类药物滥用。我们使用这个模型去找到这些人是谁,对他们进行教育。另外我们也会跟政府一起来解决公众健康方面的担忧。

这个项目的成果就是我们用了Teradata的数据库和Teradata数据挖掘的工具,来建立一个预测性的分析平台。经过测试之后,它可以给我们提供快速的分析、洞察,以及把这个结果交付到不同的业务中去。这样的话我们这些教育扩展团队的人也可以从数据中直接获得指导,来接触这些人群。

未来会考虑基因测试

记者:你们最近正在进行的有意思的项目有哪些?

Brandon Cosley:我们团队有七个分析师,每个人的责任和每个人的建模都不一样。举一个例子,有一个项目是进行预测性建模来看一下花费成本,比如每个人他可能会在自己的健康上花多少钱。每个人在健康上花费的方式都是很零星的,所以在这上面建模比较困难。因此我们就希望建立基于个体疾病的模型,这个人要花多少钱,等每个疾病的模型建立出来,把他们统一成为一个大的模型,这样可以算出来这个人在医疗上要花多少钱。

第二个项目是我们很多用户,因为他们受到的医疗教育并不是很全面,所以他们在使用美国医疗系统的时候,产生了很多低效情况。这个项目主要是想去找到这些低效人群,对他们进行教育宣传,让这些人可以更高效地使用美国医疗系统。

第三个项目是我们希望跟成员互动的方式能够更加智能。我们刚刚建立了一个企业级的公司内部项目,希望跟成员互动的方式更加个性化,我们会对他们进行分层,对每层进行分析,建立预测性的模型,根据他们是谁来调整宣传教育资料的内容,使这些内容更个性化。比如我以前就收到过相关怀孕建议的宣传单,但这肯定是对我没有任何用处的。所以我们希望跟成员互动的材料能够更加个性化、定制化,更加智能化地跟成员进行互动。

记者:您能介绍一下你们团队成员的相关背景吗?

Brandon Cosley:我们团队的技术、背景和技巧非常多元,有些是经济计量学的,有些是量化行为分析的,有些是药学的,有些是临床实验的,还有政治科学家,但是每个人都具有量化分析的背景,都具有统计学的数据建模的背景,这是他们的通用特点。个性在于大家的经验和背景不一样,非常多元。所以我们在找人的时候,并不是专门寻找某一种类型的技巧或者只是在某个领域擅长的人。

另外,由于大家的背景都非常多元,所以我们看待数据的方式都是不同的,这使得我们作为一个团队有很强的创新能力,大家在同一组数据中得出来的洞察不一样。

记者:我很好奇一件事情,刚才您提到会根据用户个体的疾病的预测,来预测他们在医疗方面的支出。考量的因素会不会考虑基因检测?基因检测在美国很流行吗?

Brandon Cosley:基因测试在美国人气越来越旺,我们现在并没有和任何一个有这些数据的服务提供方建立合同关系,我们自己也没有去收集这样的数据。但是未来我觉得这是非常有意思的一个方向,我们也可能会找这种服务提供方给我们提供基因检测数据。

但是我们的确会使用用户报销数据中的家庭数据,比如我们知道他和谁是亲属,他们亲属如果有一些疾病的因子的话,这个因子也会注入到这个人的模型中,增加他可能患某种疾病的风险。比如他妈妈如果糖尿病的话,在我们的数据建模中,就会增加他得糖尿病的几率。

记者:基因检测会涉及基因敏感性的问题。

Brandon Cosley:你说的这个敏感性是肯定存在的,所以说我们迄今也没有开始进行基因检测或者收集基因检测数据,也许以后永远不会收集,只是因为它存在一些道德上的挑战。但即使不进行基因检测的话,所有我们已经收集到的数据也是非常敏感的。因为我们了解每个人的疾病史以及疾病相关的一些健康成果,怎么样使用这些数据,是否以道德的方式使用,这是很大的问题。我们有很多内部的政策,外部政府也会给我们一些监管的要求,要求我们小心谨慎地、保护性地使用这些数据,怎么样使用这些数据,是否将这些数据反馈到我们用户那里。

简介:

蓝十字与蓝盾协会,美国蓝十字蓝盾医保组织,由蓝十字蓝盾医保联合会 (双蓝联合会) 和39家独立经营的蓝十字蓝盾地区医保公司组成,是美国历史最悠久、规模最大、知名度最高的专业医疗保险服务机构。作为一家非盈利机构(Non-for-profit),在纳税上会有优惠,同时对其盈利的使用也有一定要求。

作为双蓝组织成员,田纳西蓝十字蓝盾组织服务于350万会员,每年处理2.8亿账单的报销,有超过11000个客户群。除商业条线外,田纳西双蓝组织同政府的合作包括两类:一种是为美国大约65周岁的老年人提供的医疗服务,另外是服务于低收入人群的业务。该组织是在该州执行这一业务的主要企业,同时帮助政府管理这些患者。

田纳西蓝十字蓝盾组织的预计分析的团队主要工作是基于已有数据进行先进的分析及预测性建模。同时,团队还负责数据挖掘的创新,通过新产品来获得更多的数据。另外,通过新的方式来对数据建模,也是其创新工作之一。