开年之作,气魄非凡。
北京时间2月12日,《Nature Medicine》在线刊发了由依图医疗与广妇儿联合科研团队完成的题为《使用人工智能评估和准确诊断儿科疾病》(Evaluation and accurate diagnoses of pediatric diseases usingartificial intelligence)的文章。这是全球首次在顶级医学杂志发表有关自然语言处理(NLP)技术基于中文文本型电子病历(EHR)做临床智能诊断的研究成果,也是同类文章迄今为止的最高分。
△图片来源:Nature Medicine
此篇论文由广州市妇女儿童医疗中心团队、美国加州大学圣地亚哥分校专家团队和依图医疗团队等共同完成。广州市妇女儿童医疗中心主任夏慧敏教授、数据中心梁会营博士博士、医务部孙新主任及儿内科门诊何丽雅主任团队完成了儿科智能辅助诊断的应用场景设计。
作为国内近年来医学NLP领域最为重磅的科研成果,消息一经发布即引起多方关注。《人民日报》、《参考消息》、新华社等100余家国内知名媒体进行专题报道,引发数百次转载,依图作为中国AI企业代表更是一周内2次登上《人民日报》,国家对于医疗AI产业关注可见一斑。
△图片来源:人民日报
△图片来源:人民日报
学术层面,前有DeepMind团队2018年完成的“Clinically applicable deep learning for diagnosis and referral inretinal disease”,在眼科疾病的AI辅助诊断上的突破性进展,后有此次在医学NLP领域尤其是AI模型的构建上取得了长足进步,医疗AI辅诊正在不断取得突破。
这是在智能影像辅助诊断飞速发展之后,NLP技术在智能辅诊领域内的一次里程碑式的进化,标志着AI模拟人类医生进行疾病诊断时代的到来。
“AI医生”的梦想从未如此靠近现实。
△广州市妇女儿童医疗中心主任夏慧敏教授
夏慧敏教授表示,未来在医院互联互通的趋势下,几个区域性医疗中心数据之间可进行互相比对,从而能够使产品的使用范围更广。到2020年,国家卫健委所有三甲医院电子病历达到4级以上水平,语言标准统一、标准电子病历互通互联,相信人工智能辅助诊断系统的广泛应用这条路不会太长。但须要清醒认识到,我们仍有很多基础性工作要做扎实,比如高质量数据的集成便是一个长期的过程,因为大数据的收集和分析需要算法工程师、临床医生、流行病学专家等在内的多专家通力合作。此外,人工智能学习了海量数据后,其诊断结果的准确性仍然需要更大范围的数据对其进行验证和比对。
◆ ◆ ◆
“读懂”136万份病历 医学NIP年度重磅成果问世
△依图医疗CEO倪浩
在依图医疗CEO倪浩看来,这种认可更多来自于对于未知领域的开拓性创新:“我们给出了一套适用于当前临床环境,利用原始电子病历进行智能辅助诊断的一整套理论体系和实践方法,虽然并不完美,但是目前世界上可见的理论体系中相对完整且被证明有效的。”
如同《流浪地球》中高达1.1万米的行星发动机的瑰丽想象,采用AI替代部分临床工作,乃至替代人类完成诊疗决策一直是众多AI学者及医学专家的梦想。然而作为高度复杂的决策过程,“诊断”并不是简单的逻辑推理游戏,它对于决策者的医学知识储备、逻辑分析能力、社会经验、真实案例积累等等都提出了极为苛刻的条件。
以医学NLP领域为例,由于诊疗规范程度不一致、书写习惯不同等多种原因,临床上,电子病历不仅格式各异,即便是同一疾病的表述也各有不同,如“发烧”一词就可能有“高热”、“发烧”、“高烧”等多种词汇表达,对于需要精准理解自然文本并进行决策的AI模型带来了挑战。
即便是AI“读懂”了电子病历,想要让AI同人类医师一样,从语音及文本中高度智能的提取关键信息,并根据决策需要主动发问,补全决策所需要素,更是难上加难。
联合科研团队在全球范围内率先解决了上述2大难题。
为了实现对于电子病历信息的高效治理及分析利用,并以此为基础构建AI辅诊模型,依图医疗的科学家们与广妇儿专家团队提出并测试了一个专门对电子医学病例进行数据挖掘的系统框架,将医学知识和数据驱动模型结合在一起。该模型先通过NLP对电子病历进行标注,利用逻辑回归来建立层次诊断,从而实现对于常见儿童疾病的AI辅诊。
△专门对电子医学病例进行数据挖掘的系统框架
自2016年10月起,联合科研团队针对广州市妇女儿童医疗中心在2016年1月至2017年7月间的567,498个门诊病人的1,362,559次问诊电子病历,抽取到覆盖初始诊断包括儿科55种病例学中常见疾病的1.016亿个数据点,并将这些信息用于训练和验证系统框架。此次研究同时还基于NLP实现了病历的结构化。
研究过程中,拥有超过25年临床实践经验的资深主治医师手动注释了6,183个图表,然后用3,564张人工标注的图表对NLP信息提取模型进行训练,并用剩下的2,619张图表对模型进行验证。该NLP模型总结了代表临床数据的关键概念类别,利用深度学习技术自动将电子健康记录(EHR)注释到标准化词汇和临床特征中,从而允许对诊断分类进行进一步处理。
在广州市妇儿中心医务部主任孙新看来:“专业儿科医生高质量的先验医学知识输入成为这套系统的关键优势”。
△训练AI理解海量电子病历中的临床特征数据
性能测试中,科研团队抽取了1.2万电子病历,并召集20位临床医师与之进行性能对照。结果显示,这套基于智能病种库搭建的AI辅诊模型在55种儿科常见病的诊断准确率已经接近9成,部分疾病如急性上呼吸道感染,其诊断准确率已达到95%,其性能超过低年资儿科医生,接近高年资儿科医生。
△AI模型的平均得分0.885,高于医生组1平均分0.841和医生组2平均分0.839
广州市妇儿中心儿内科门诊主任何丽雅认为:在可预见的时期内,这套AI模型拥有空前广阔的应用场景,例如在分诊环节,通过记录基础数据让模型产生预测诊疗结果,并通过这个结果评估病人的优先级,以确保医生可以按需就诊。此外,基于AI的诊断模型还可以帮助医生诊断复杂或罕见病症,提示可能情况,避免由于医生受限于自身专业或经验,在复杂病症出现时出现误诊。可以预见的是,这个模型不仅能在医疗资源短缺或不均的地区发挥巨大作用,也将为全世界带来重要的普适进步意义。
倪浩透露:“此次成果的核心技术部分,实际上是通过深度学习技术与医学知识图谱,对EHR数据进行解构,从而构建了高质量的智能病种库。使得后续可以较容易地利用智能病种库建立各种诊断模型。而诊断模型证明了基于AI的系统可以帮助医生处理大型数据和辅助诊断,同时在诊断的不确定性和复杂性上给予临床支持。”
目前,该系统在广妇儿2019年的第一季度调用量已经超过了3万次,相当于一位儿科副主任医师一年的门诊工作量。
夏慧敏教授对AI辅诊未来寄予厚望,他表示:“国家大力推进的人工智能规划,让我们看到了契机,基于信息化产生的优质医疗大数据落地AI技术和平台,既能在一定程度上解决医疗服务能力不足的问题,又能提高健康服务的公平性和可及性。我们希望,人工智能AI可以帮助边远、基层、年轻的医生,为基层儿科医生和年轻儿科医生提供辅助诊疗服务,为患儿家长提供智能自诊服务和权威的第二诊疗意见,避免误诊、漏诊造成的医疗风险。”
◆ ◆ ◆
医学NLP技术或与语音技术融合
此项研究完成后,依图医疗在儿科领域还会有哪些探索?
对此,倪浩表示,单在儿科领域,依图医疗已经拥有了覆盖“诊前—诊中—诊后”的全链条产品矩阵,如智能导诊、智能预问诊、智能辅诊等多个AI产品,并已经在广妇儿、上海儿童医学中心、厦门大学附属中山医院多家三甲医院实现落地试用。未来,依图医疗将致力于与医疗机构展开深入合作,在临床实践中打磨产品,不断提升产品性能,服务临床。
另外,他还透露,未来该AI辅诊系统有望与依图的自然语音识别技术进行深度融合,将问诊流程中产生的语音数据实时转化为文字并提供给AI模型进行智能分析,问诊完毕后医生获取辅诊结果及检查建议,进一步减少医生负担,提升临床诊疗效率。
◆ ◆ ◆
世界AI看中国
随着中国医疗AI技术水平的提升,近年来,越来越多的顶级科研论文开始登陆CNS(《Cell》、《Nature》、《Science》),同时,各个细分领域的医疗AI产品也正在以肉眼可见的速度迅速在各家医院铺开临床试用。
“中国政府对于医疗AI行业的大力扶持、海量的高质量医疗数据、丰富的AI人才、医疗机构对于AI产品的迫切渴求以及临床专家的开放态度等多方面因素共同推动了医疗AI行业的兴盛,”倪浩表示,“其中,高质量的医疗数据与医疗机构的开放态度至关重要,在与广妇儿专家团队的合作过程中,医疗机构对于AI的开放态度与专业水平令我们备受鼓舞。”
此次研究中,来自横跨2016-2017年间创纪录的136万份真实病历数据颇为引人注目。中国拥有全球最为丰富的医疗数据资源,并且随着医院信息化的发展和民众诊疗需求的释放仍将持续增长,如何对对临床积累的海量临床医疗数据进行治理?如何挖掘海量数据中的科研价值?如何基于海量数据进行临床质量管理,实现医院管理的智能化升级?成为困扰众多医疗机构的共同难题。
作为AI领域先行者之一,华西医院在国内率先开展应用AI技术治理医疗大数据,构建智能病种库,并以此进行AI应用研发。华西医院院长李为民教授曾表示:中国并不缺数据,真正缺乏的是系统的、标准的医疗大数据,这些没有经过人工智能技术治理的医疗数据标准各异、存储分散、质量参差不齐,并不能称之为真正意义上的医疗大数据,不仅临床研究价值受到限制,更遑论利用这些数据去开发人工智能应用。
2018年6月,依图医疗与华西医院深度合作,共同完成了国内首个肺癌临床科研智能病种库的建设,2万余例经病理确诊的肺癌患者信息实现全部信息AI自动入库,完成了多模态、全周期的数据(从风险因素到就诊过程,从实验室检验到影像检查再到病理,从诊疗方案到预后信息)在一个科研数据库中的集成,实现了科研信息的自动化提取与分析,将万量级患者的全维信息提取时间从年级别压缩至月,并成为强大的科研数据质量控制工具。
“智能病种库的诞生对于科研工作者而言是革命性的,无论是信息的自动入库、治理,还是关键信息点的自动提取,以及基于此进行的AI模型构建,都将科研工作效率直接提升了一个数量级,科研质量也迅猛提升,”倪浩说,“手工科研与智能化科研之间的差距如同火铳与自动步枪的区别,双方将会产生科研能力上的代差。”
◆ ◆ ◆
医疗人工智能正在迎来最好的时代
随着越来越多的医疗人工智能产品走进临床,业界对于人工智能产品的性能及前景的认知逐步深入,而暴露出的问题也越来越多,并引发了不少争议,热潮之后,医疗人工智能是否正在撞上“新秀墙”?
“真正沉下心来,专注于医疗AI的人工智能企业正在迎来最好的时代,”倪浩表示,“在经历AI大发现的狂热之后,医疗人工智能正在从概念走向产品,走出实验室,深入到临床融入工作流,也必然接受临床医生最严苛的考验,在挫折中成长,这个过程是痛苦的,是漫长的,但吹尽黄沙始得金,谁能够真正融入临床工作流,满足临床医师需要,才能够在竞争中生存。”
他强调,医疗人工智能的进步正在为医疗机构创造前所未有的产业升级机遇。随着基础算法及AI模型的进步,医疗人工智能正在将越来越多的工作内容定义为基础工作。在繁重的体力劳动上,AI将比人类更有耐心,更高效,更精准,人类医师逐渐从劳动者转向劳动的创造者与监督者、决策者,熟练掌握AI工具的临床医师将在未来具备更强的行业竞争力。
“以肺部结节筛查为例,依图医疗在业内率先完成了从结节筛查的点状任务阶段,向胸部CT影像智能诊断的单病种、单科室解决方案的进化,能够在单个病种或者单个科室的应用场景中切实辅助临床医师影像判读效率及质量的提升,”倪浩说,“未来,在经历临床的严酷考验之后,AI的功能将越来越成熟,性能愈发稳定可靠,真正担当起临床医师的好帮手与第二大脑这一角色定位,协助医疗机构的管理者提升医疗服务质量管理水平,提升医疗机构运行效率,加强科研成果产出能力,成为现代医院的标配。” |