欢迎来到萍乡财经杂文网!

萍乡财经杂文网

你想看的都在这里
萍乡财经杂文网
当前位置:

刘艺晗生活照华山医院:试水人工智能,如何填补从数据到临床应用的空白区?

来源:萍乡资讯 时间:09-11 07:01:51浏览4次

快速浏览特殊主题

2019

第二阶段

<  。<  。滑动以查看下一张图片> >;

这是一个特殊的话题

第2条

全文字数:2800多字

黄宏

复旦大学华山医院信息中心主任

大数据预测分析基于大数据的应用方面  。当然  ,预测分析本身也很可能使用人工智能的三大基石之一——算法  ,而人工智能的另一个基石是数据  。因此  ,这两者可以说是相互依存、不可分割的 。大数据预测侧重于数据的宽度和广度  ,以及对现实世界的认知和验证 ,以及认知系统本身的完善和表达  。人工智能注重算法的高效率和计算能力的支持  。两者的结合将有效加快智能医疗的步伐  。

在华山医院的cdr(临床数据仓库)基本建设完备后 ,医院的临床数据量就一直在高速增长着  ,如今已经成为一个海量的大数据仓库 。作为华山医院信息中心主任  ,我一直思考着一个问题——如何才能让这些数据更好地为临床科研和医院管理进行服务 ,发挥出这些数据的真正的价值 ?

从数据到诊所填充空白色区域

我们都知道 ,目前关于cdr有几个不同的定义:根据himss标准  ,cdr是一个为医疗执业者提供患者临床信息实时事务处理的数据库;gartner则认为  ,cdr是一个以患者为中心、颗粒化的健康数据集合体  ,其数据通常收集自多源的it系统  ,用以支持多重应用  。一般认为  ,cdr是一个整和各种临床来源数据的实时数据库  ,用以统一方式呈现患者个体数据视图 。它为医师提取单个患者的数据而优化 ,而不是为识别患者群体的共同特征或者促进特定临床科室的管理而优化  。总而言之  ,cdr就是临床数据库 。关于它的突出特性  ,我根据华山医院的实际情况  ,做了以下归纳总结:(1)cdr集成了实时的院内各子系统数据;(2)是以患者为中心的  ,具有时间轴  ,面向医生的诊疗过程和流程的  。而对于临床大数据平台  ,我对数据的管理和应用要求做了如下总结:

(1)大数据收集和聚合——多源异构数据的收集和聚合;

(2)大数据治理——用统一的数据标准规范多源异构数据;

(3)大数据计算——大数据计算的基本环境和功能;

(4)大数据挖掘分析——多源异构数据的挖掘与分析;

(5)大数据利用——以医生和管理者为核心  ,是医疗服务、科研管理、医院治理等的辅助决策支持应用  。

很明显  ,目前的cdr和真正的临床大数据应用平台之间  ,还有一段空白需要填补  ,作为医院信息化系统的建设者和管理者  ,我认为面对要求  ,cdr的建设目标和方案是很难满足的  ,这也是正是医院的信息中心和临床应用之间难以直接对接的主要原因  。我一直在思考如何填补上这段空白  。与此同时  ,我院神经外科的孙一睿博士 ,却在为临床科研缺少数据和分析工具而发愁 。根据他以往的经验  ,对于临床数据的的研究流程共分为6步:业务理解、数据理解、数据准备、数据建模、结果评估  ,以及模型部署等  。在传统流程中  ,完成6步的总时长通常接近40周  ,也就是10个月的时间  。在这近10个月的时间里  ,研究者相当长的时间是在等待专业数据分析人员的协作  。这项工作繁冗复杂  ,从选取和清洗数据  ,到构建、整合和完成标准化  ,通常需要花费3~4个月的时间 。但难度更大的环节是数据建模  。研究者需要精通数据库分析和统计学软件  ,并且常常需要数名经验丰富的专家协助  。面对日益增长的临床业务和指数式增加的临床数据 ,孙医生也意识到  ,他需要更简单、高效的临床数据治理和分析手段 ,来对接医院庞大的临床数据仓库  ,真正发掘出这座金矿的价值  。

水质检测人工智能辅助诊断技术

来自信息部门和临床科室的共同的需求终于碰撞出火花  。在2018年 ,由我院医院神经外科周良辅院士领衔  ,在毛颖副院长、信息中心、以及神经外科急救中心胡锦教授、孙一睿博士的多方支持下  ,经过大量前期调研方案对比  ,将人工智能辅助诊断技术融入了神经外科的急诊业务流程  ,而首个测试项目  ,就是危重患者的凝血功能异常预测  。急诊外科疾病的救治过程中  ,围手术期凝血功能障碍是最重要且普遍的病理生理改变 。我们将“凝血功能危险因素分析”作为了首个研究项目  ,原因有三个:一是凝血功能障碍在神经外科急诊发病率为30%  ,二是脑外伤后发生率为40%~80%——这一高发病率为研究者带来了第三点——充足的数据量 。更具有临床意义的是  ,对凝血功能障碍的早期干预可以改善患者预后 。

孙伊瑞博士选择2015年至2017年的临床数据作为第一轮机器学习的对象 ,并以之前至2002年的数据作为验证对象  。这两轮数据共涉及11 232次紧急行动  ,300多万条数据涵盖500多个评估项目  。

首轮机器学习的结果显示  ,抗凝药服用史、性别和年龄并不明显影响围手术期(围绕手术的一个全过程)的凝血功能——在传统知识体系中  ,这些被列为影响神经外科急诊患者凝血功能异常的重要因素  。在前五大因素中  ,它们分别排名第一、第四和第五  。取而代之的实际影响因素更为复杂 。数据分析结果显示 ,包括人口学本特征、心肝肾等功能、药物干预、体温、酸碱平衡……其中  ,肝功能、肾功能和感染是主要风险因素  。

利用我们医院信息中心建立的大数据平台和分析系统  ,孙伊瑞博士已经成为gartner所描述的“平民数据科学家”——他们的工作可能是业务分析师、bi工程师、it工程师 ,他们不研究算法 ,而是使用和创建统计分析模型来完成业务分析 。

未来  ,华山医院的临床科研人员无需等待冗长的数据分析过程 ,通过便捷的自助式数据探索  ,可以实现“一键建模”  ,及时发现临床、诊疗和住院等数据中潜藏的关联和模式——就像孙一睿博士在“凝血功能危险因素分析”中发现抗凝药物并非凝血功能异常的首要因素那样  。同时 ,医学工作者将可以根据自身兴趣和研究方向  ,随时发起一场前无古人的探索  ,对数据的预测分析  ,将在几秒钟内为研究者证实或证伪每一项预判  ,并启迪研究者继续深入关乎生命的研究  。大数据已经开始影响到关乎每一个人的医学的研究模式  ,大数据预测分析工具的出现  ,帮助人们在“逼近真相”的方向上向前迈出了一大步  。在医学研究领域 ,人们很容易理解这一步的价值  ,它关乎生命 ,毋庸赘言  。在信息中心  ,从系统支撑服务向数据服务也在努力做出转型  。我们根据这个研究主题  ,对原有的数据分类做了重新设计  ,传统的数据中心的设计方法更多的是按照来源进行分类 ,很少基于数据服务对临床数据进行再分类和再加工  。我们针对出血评估这一对外科医生迫切需要的工具  ,按照临床主题即患者来源、检验、就诊记录等内容做了二次分类和索引 ,并启发我们在数据管理方面有效地从cdr1.0向2.0过渡  。1.0专注数据的大而全  ,2.0专注数据的精细和效率  。同时  ,在数据利用的过程中  ,不断检测生产系统的数据产出质量  ,对检验系统、患者就诊系统、电子病历等系统做了相应的改进  ,一定程度上带动了系统改进从需求驱动向“需求驱动+数据驱动”的转型  。同时  ,由于提升了临床数据的细分 ,医院病种库的效率也从原先几天到一天甚至几小时就能建立一个病种库 。大数据预测分析最初在行业中被视为生产力工具  ,现在随着其价值在医学研究领域的显现  ,它已经变成了一种拯救生命的工具  。医院信息部门和临床部门的紧密结合是发掘医院临床数据金矿的必由之路 。    

分享到:

请输入搜索内容

最新标签

NEWSTAGS