葛均波
近期,ChatGPT横空出世,在全球引发高度关注及热烈讨论,甚至认为其是一个革命性产品。笔者仅结合自己的医学研究及临床经验,分享一下自己对人工智能对未来医学研究和实践的可能影响的思考。
ChatGPT是人工智能(即AI)发展到一定阶段的代表性产品,可实现聊天、创作、写代码等功能。GPT是Generative Pretrained Transformer三个单词的缩写。Generative是生成的意思,表示它区别于既往搜索引擎,能自己生成创作出新的内容;Pretrained是预先训练意思,表示它之前已经在一些数据库里经过训练过,已经具有一些自身逻辑及判断;Transformer是一种全新的算法架构,能够在处理长文本时更高效,训练时间更短。ChatGPT的研发人力物力投入巨大,是个巨大系统性工程,是算法、算力及数据库三个方面的庞大资源高度整合的产物。
影响AI发展的三个要素是算法、算力及数据库。在算力方面,我相信随着芯片等硬件技术提高,问题是不大的。但在算法及数据库方面,医学是有特殊性的。首先,医学的参数变量主观性较强,有时候不太好精确定量评价,如疼痛、疲劳、瘙痒、犯困,很难用数学精确定量,个体差异又很大。其次,医学参数变异度及相互影响很大,比如我们经常使用一个参数6分钟步行试验,就是让患者在6分钟内拼命走路,然后测量其最大走动距离,患者在不同身体状态、不同医生陪同监督下都会出现差别较大的结果;又例如心脏功能常用的参数,左心室射血分数(LVEF),不同超声医生测量结果差异度也较大,同时其准确度也受到很多情况影响(比如瓣膜反流,心脏大小,显像清晰情况等)。其实,我一直以为医学是一门模糊科学,是一门概率科学,很难精确地预判,只能是大概率地判断。在实践中,再简单的手术,都不可能百分百没有并发症;再高明的专家,在临床实践中,也不可能百分百准确诊断。医学变量的模糊性及变异性,以及参数之间可能会发生交互作用,对AI在医学中应用提出了更高要求。因此,需要更高级、更深度的算法来解决。对于医学数据库建立,同样存在巨大难度。上面讲到,医学变量和常规变量不一样,有时候难以准确收集,并且一个人所涵盖的生物信息参数本身就是非常巨大,再加上受制于个人隐私、医学伦理,医院之间信息壁垒,人力投入不够等等因素,要建立一个完整的海量生物信息数据库是一个非常大的挑战。目前只能建立一些大型局部疾病数据库。
综上分析,AI在医学应用还是存在着诸多重大挑战,想要完全取代医生目前技术看来还是不可能。AI医疗诊断先驱IBM Watson、谷歌人工智能Streams铩羽而归就是个证据。然而,毫无疑问,AI将会为大大促进医学发展,成为医生的好助手。例如,提供高效的文献检索,图像处理、识别及辅助诊断,帮助手术导航等等,目前均已实现。随着算法及算力提升,其效能及准确性将进一步提升。
对于AI在医学中发展方向,笔者目前能想到的方向包括:一、信息检索及咨询。可以帮助医生更迅速高效找到匹配的研究文献,最新诊疗指南,类似的案例,可以回答患者一些专业性问题;二、辅助诊断。主要是影像诊断,包括快速图像(超声、CT、磁共振、病理切片)处理,筛查感兴趣的或者异常区域,作出影像方面诊断;当然,在特定场景下,对一些特定疾病作出诊断也是可能做到的,比如在心内科门诊诊断出室上性心动过速。但要AI像医生那样对众多疾病都作出分析和诊断还是比较遥远;三、AI辅助制药。通过海量分子结构数据库学习,建立起不同分子之间空间结构相互作用及关联的模型,然后对候选药物分子、化合物、蛋白质的结合以及基因的作用完成机理上的模拟和计算,典型的应用场景包括虚拟药物筛选、蛋白质结构预测等,将人工智能技术与生物制药技术融合,大幅度缩短药物研发时间,节省研发成本,提高效率。头部公司AlphaFold突破性地解决了生物学界长达50年的蛋白质空间结构预测难题就是个典型成功例子。四、虚拟器官。虚拟的人体器官或在人体系统上测试药物和疗法的有效性,进而能够准确预测真实的人体对疾病治疗的反应。计算机模拟人体试验可以降低初步评估的时间与金钱成本,同时大大减少了志愿者的数量。这种技术也可以应用到医疗器械研发领域,在计算机模型中验证所涉及医疗器械的效果。五、智能监测采集。无须专业医生,患者在家庭即可实现自我收集,比如家庭超声图像采集。六、数字孪生。这是我近期提出的概念,就是通过收集个体各种生物信息,建立一个符合个体健康特性的数字人,通过海量数据库及人工智能学习,可以对患者即将出现的健康情况恶化做出预警,对健康管理提出建议。
总之,AI不能替代医生,但会成为医生的好助手。
(作者系全国政协委员、中国科学院院士)