摘要:医学影像学正朝向大数据应用方面发展,医学影像大数据具有大规模、高增速、多结构、高价值和真实准确五个特点。受技术方面的制约,目前绝大多数影像数据还需依赖影像诊断医师进行人工分析,因此出现了误诊率高、医师缺口大的问题。随着我国发展人工智能脚步的加快,医学影像被业内认为是人工智能在医疗中最有潜力的落地领域。在未来,AI医学影像大数据主要会有以下几个发展方向:开发智能医学影像图像分析工具、助力精准医疗、促进影像组学方法的发展。在发展的同时,我们还要关注制约医学影像大数据应用的几个因素,即影像数据的规模与质量还较低、数据标注效率有待提高、“人工智能+医疗”的复合背景人才稀缺。
关键词:医学影像大数据;人工智能;精准医疗
1 认识医学影像大数据 1.1 什么是医学影像大数据
在医学领域,随着信息化的不断深入,数字医学数据越来越丰富,其中医学影像数据是一个十分重要的组成部分,有超过80%的医疗数据来自于医学影像。如果按照大数据的特点,医学影像大数据的定义可表示为:由DR、CT、MR等医学影像设备所产生的,存储在PACS系统内的,大规模、高增速、多结构、高价值和真实准确的影像数据集合。其具有以下五个特点:大规模、高增速、多结构、高价值和真实准确。
多结构和高价值这两点很好理解。医疗影像设备种类日益增长,使得医学影像大数据包含结构化表格、半结构化文本、非结构化影像等,数据结构多样;且现代医学越来越依赖医学影像数据进行诊断,约80%的临床问题需要影像检查才能得到准确的诊断结果,这使得影像大数据具有很高的医学分析和指导价值。 大规模和高增速需要从市场和人口两个大环境来解释。据统计,我国科室级PACS、多科室或全院级PACE系统建设水平已经分别达到了60-70%和50-60%,基本覆盖国内一线城市的三甲医院,从市场增速来看,我国PACS市场年均增速在25%以上;人口方面,影响医疗影像大数据规模的主要是人口基数和年龄的分布,据预测,到本世纪中叶,我国老年人口数量将达到峰值,超过4亿,届时每3个人中就会有一个老年人,老龄化必将带来医疗服务的旺盛需求。所以,目前PACS系统的普及率和人口数量的庞大,是我国医学影像大数据的大规模基础,而PACS系统和老龄人口的快速增长率,是医学影像大数据的高增速的基础。
作为大数据5V特征中的最后一环,医学影像大数据的真实性是如何实现的呢?这需要从数据处理技术方面来解释。事实上,PACS系统从不同的影像设备上收集的数据在质量上往往参差不齐,而数据分析结果的准确度和可信度很大程度上取决于收集到的数据质量的高低,所谓“垃圾进,垃圾出”,没有数据准确性作保证,大数据分析就变成了一纸空谈。为了保证影像大数据的真实性,在影像设备将影像数据传递给PACS系统后,首先要做的第一步就是由PACS系统来对影像进行后处理。以多维影像融合这项技术为例,主要包括数据预处理、图像分割、特征提取以及匹配判断这几个过程。简单来说,数据预处理是指将大量模糊的、不完整的、带有噪声和冗余的信息进行清理和过滤, 滤掉残渣,留下精华,将其变成适合挖掘的形式,包括图像去噪、增强、平滑、锐化等工作;图像分割和特征提取环节是将预处理过的图像“切丝、切段”,为后期的智能匹配和判断提供精准
的素材,例如器官形态模型、图像边缘特征模型、神经网络聚类模型等;最后的图像匹配和聚类的过程,需要依赖深度学习等核心技术,即人工智能与医学影像大数据的融合。
1.2 医学影像大数据的应用现状
据了解,目前绝大多数医学影像数据都要依赖影像诊断医师进行人工分析。人工分析主要存在以下两个问题:第一是精确度低。影像诊断结果会因为受到医师的精力、耐力、眼力、经验水平等因素的局限,很容易被误判。中国医学会的一份误诊数据资料显示,中国临床医疗每年的误诊人数约为5700万人,总误诊率为27.8%,其中恶性肿瘤平均误诊率为40%,如鼻咽癌、白血病、胰腺癌等,肝结核、胃结核等肺外结核的平均误诊率也在40%以上。因為医疗行业中80%-90%的数据都来源于医学影像,医学影像是医生进行疾病判断的重要依据,所以要降低误诊率,首先要提高影像诊断的精确度。
第二是放射科医师缺口大。目前我国放射科医师仅有8万多名,每年承担的诊断工作量却达到了14.4亿张影像,并且这个需求还在不停地增加,我国医学影像数据以每年30%的速率增长,与之相对应的放射科医师的年增长速率却只有4%,其间的差距是26%,放射科医师数量的增长远不及影像数据的增长。这意味着放射科医师在未来处理影像数据的压力会越来越大,甚至远远超过负荷。据统计,有超过50%的放射科医师工作时间在8小时以上,20.6%的医师每天平均工作时间超过10个小时。面对爆炸式增长的医学影像数据集和相当较少的、水平不一的阅片医师,医师的疲劳、情绪等因素都将会导致误诊、漏诊率的上升。 那么,面对目前医学影像误诊率高、医师缺口大的问题,应该通过何种途径去解决呢?从现有技术水平来看,最好的途径便是人工智能,随着人工智能和医学影像大数据的逐渐普及,两者的融合,必将成为医学影像发展的重要方向。 2 未来医学影像大数据的应用发展
得益于高质量、高标准化的医疗影像数据库的快速积累,医学影像天然具有使用人工智能进行大数据处理的可能,再加上智能图像诊断算法趋于成熟,人工智能技术被认为是解决当前医学影像界面临难题的“救命稻草”,医学影像也因此成为人工智能在医疗中最有潜力的落地领域。医学影像大数据与人工智能相结合主要会有以下几个发展方向:
2.1 提供医学影像图像分析工具? AI医学影像应用中最为亮眼的成果无疑是“医学影像阅片机器人”了。大数据、计算力以及人工智能算法是AI近年来崛起的基石,医学影像阅片机器人的诞生也正基于此。据检测,通过输入上万多张高质量的人工标注的CT影像,配以适用于AI的高性能计算机(HPC)设备和用于影像识别的3D卷积神经网络算法,阅片机器人就可以从若干张肺部CT光片中找到隐匿着的少量病人的CT片,快速识别图片中病灶的位置,在准确率上胜过了绝大多数专业医生,在用时上更是远远超过了人类选手。
这种以“阅片机器人”为代表的人工智能医学影像辅助诊断系统进入临床应用后,势必会将放射科医师从繁重的阅片工作量中解脱出来,帮助医生快速获得影像诊断结果,提高诊疗效率和准确性,并且这种经过大数据训练后的影像辅助诊断系统可以变身为一个“类似应用程序的东西”,嵌入在任何的服务器甚至手机上,从而能够在社区、乡镇等医疗条件不高的地方给基层医生“顶级专家看病的本事”。 2.2 助力精准医疗
2013年,美国女星安吉丽娜·朱莉通过基因检测,发现其携带了一个“乳腺癌易感基因”,根据医生建议,朱莉接受了双侧乳腺切除手术,通过手术,朱莉患有
乳腺癌的几率从87%下降到了5%。这是一个典型的利用基因大数据实现“精准治疗”的案例。随着计算机存储量和运行速度的提升,生物医学大数据的整合利用,疾病的治疗将从经验医学向精准医学转变,最终可实现疾病的“同病不同因,同因不同治”。而医学影像大数据在精准医疗的发展中发挥着绝对的主力作用,有超过90%的临床医学数据来自于医学影像,如果能够运用人工智能技术分析医学影像,深入挖掘影像特征与病状之间的联系,并将影像与医学文本记录进行交叉对比,与基因组数据相结合,即可更准确地分析出针对个体的诊断与治疗方案,挽救患者的生命。
2.3 促进影像组学方法的发展
在临床实践中,影像医生对图像的解读还停留于主觀的判断,通常基于病灶形态、大小、部位、密度/信号、增强强化模式等作出诊断。这样的方法存在主观性强、依赖于临床经验等缺点,已不能满足现代医疗模式转向精准医学实践的要求,在临床上亟需研发影像量化方法。近年来,随着医学影像大数据和医学图像分析技术的发展,从医学图像中挖掘信息,提供临床医生肉眼不能判读的深层定量信息用于临床分析与临床指导,逐渐成为医学图像研究的热点,影像组学因此而产生。
荷兰学者Philippe Lambin教授于2012年提出影像组学(Radiomics)的概念,其定义是:利用计算机软件,将医学影像转化为可挖掘的数据,从中抽取海量的定量影像特征,用于临床信息的解析。其基本分析流程包括:图像获取及病灶分割,影像组学特征提取,影像组学特征筛选、模型构建和临床信息解析等。简单来说,它的工作流程与医生日常读片是非常类似的,针对影像数据,提取特征,利用人工智能建模,然后再进行临床应用、辅助决策。但相比医生,它的最大优势在于计算机看到了高维信息,能够看到蛋白基因在宏观影像上的变化,这样的宝贵数据可以辅助医生提升临床诊断的正确性和准确性。 3 AI医学影像发展面临的问题
3.1 影像数据的规模与质量需要进一步提高
数据是人工智能算法所需的核心资源,仅掌握算法而缺乏数据是无法获得较好训练效果的。现阶段,我国的医疗影像仍处于从传统胶片向电子数据过渡的阶段,大量影像资料尚未数字化,且医院之间的数据共享和互通程度较低,是否能够获取大规模的、优质的、标准化的、规范化的可靠大数据是对本行业的一个巨大考验。
3.2 数据标注效率有待提高
在获取数据的基础上,人工智能在对模型进行训练之前,训练集需要进行事先标注。由于大多数图像标注还需依赖人工识别,至少需要两位以上的资深医学专家来控制标注质量,如果标注结果不一样,还会再聘请一位更高资历的专家来确定标准,数据标注工作耗费了较大量的人力和时间,成本非常高。因此在AI医疗影像领域,如何高效的自动获取具有高可靠性的标注数据也成为今后需重点解决的问题。
3.3 跨学科人才稀缺
在医学这个专业程度很高的领域,AI医学影像应用及平台开发者不仅要研究人工智能算法,更要对医疗影像识别建立深入的了解,急需一大批高素质,既懂医学,又懂理学、工科的复合型、跨学科人才。归根到底,一个AI产品是否符合医疗行业需求,主要看是不是解决临床问题,是不是按照医生的需求去设计,按照医生的规划达到一定效果,因此开发者只懂AI技术是远远不够的,只有“人工
智能+医疗”的复合背景人才才能开发出医生真正觉得好用的产品,人才是决定本行业未来发展高度的决定性因素。 4 结语
医学影像大数据与人工智能的结合已是大势所趋,深入挖掘医学影像大数据背后的价值,用人工智能赋能医学影像大数据,用科技的力量改变医学影像诊断,释放人工智能在医疗领域应用的巨大潜力,解放医生,让患者看病不再困难,这将是时代赋予影像人肩上的重担! 参考文献
[1] 张振,周毅,杜守洪,等.医疗大数据及其面临的机遇与挑战[J].医学信息学杂志,2014,35(6):2—8.
因篇幅问题不能全部显示,请点此查看更多更全内容