开云网页开云网页开云网页从谷歌的报告中了解到,其通过AI检测糖尿病性视网膜病变(DR)的症状,对糖尿病进行早期筛查的项目,临床结果很不理想。原因可能有以下方面
(1)现实场景中,拍照的质量与实验室的图库质量差异会比较大。比如拍片医师的经验、设备成像质量的差异等都会造成拍片质量的差异。会导致识别结果不正确或甚至无法识别。
进而,若想成为临床级的应用,仅解决上面的问题还远远不够。因为基于深度学习等算法,从根本上是统计机器学习的方法,只能通过特征,给出是否得相关疾病的概率统计值。且其过程是“黑箱”的。即机器无法做到“知之为知之,不知为不知”,只是通过经验统计的猜测。同时机器“知其然但不知其所以然”。正如清华大学AI研究院院长张钹院士指出:大数据驱动的人工智能有大量毛病,毫无“自知之明”…
而现代医疗是以循证医学为基础的。临床级的应用,需要符合循证医学的逻辑,这样才能帮到医生。而现在基于深度学习等统计机器学习的AI系统显然是无法做到这一点。也就无法进入临床医疗科学。我想这是谷歌等系统的效果差强人意的更深层次原因。
依未科技基于视计算的眼底定量化分析技术,有效弥补深度学习等不足,是临床级的医疗AI应用。若感兴趣可做进一步了解。
乍一听到要和AI进行比赛,绝大部分的医生态度是犹豫的。倪渊说,他们在邀请时都会告诉医生,比赛并不是要证明AI比人类强,而是想在这样的场景下验证AI能否跟知名医院的医生达到相同的水平。全球有很多医疗资源匮乏的地方,如果AI的实力被肯定,是有望在未来帮助这些地方提高医疗水平,拯救更多的生命。
大屏幕上的倒计时还在不断闪烁,表面上看起来风平浪静的赛场,实则暗潮涌动。一方是6位来自中外各大医院内分泌主治医生组成的人类医生团队,一方则是平安AskBob AI医生。他们面对的是9个糖尿病及其并发症的患者信息,需要在45分钟内,给出最终的诊断和治疗方案。
这是全球首届糖尿病综合管理国际人机大赛的现场。6名人类医生被分为了3组,每组2人,分别独立回答3个病例,而AI医生需要完成全部9个病例的诊疗方案。在略显轻快的背景音乐中,每一名医生都紧盯着面前的电脑屏幕,或眉头紧锁,或断断续续地敲击着键盘。而另一面,由平安工作人员正在操作的AI 医生,只能看到鼠标在不停地滑动中。
倒计时结束,双方都交出了他们的最终答卷。随后,评审团在盲审的情况下进行打分。最终平安AskBob AI医生以92.4分vs 人类医生团队89.5分的优势,成为最后的赢家。
▲ 以上专家及评审团依次为:北京大学人民医院内分泌科主任纪立农教授、天津医科大学代谢病医院院长陈莉明教授,新加坡中央医院内分泌科主任Bee Yong Mong教授,国际糖尿病联盟IDF名誉主席、喀麦隆雅温得内分泌和代谢疾病科主任、喀麦隆雅温得中央医院国家肥胖中心主任Jean Claude Mbanya教授。图 / 受访者提供
AI赢了,但所有在场的人类医生并没有显得沮丧,反而更加兴奋。新加坡中央医院内分泌科主任Bee Yong Mong教授是评委之一,他在看过AI给出的诊疗方案后,印象最深的是它始终如一的稳定。从外界看起来,前期的问诊阶段,无论是第几个病例,AI都能钜细靡遗地把相关病史全部问到,但对医生来说,当答题到后期,过度的疲惫已经让他开始不自觉地跳过一些细节,无法再面面俱到。同时,在答题速度上,医生完成1道病例需要15-20分钟,而AI只需要几秒。——这些当然不是缺点,而是人类的特点。
通过一场比赛,医生们更直观地看到了技术能够带来的更多可能性。在使用AI进行辅助医疗决策时,能够节省大量的时间,让医生可以集中注意力去关注那些通过数字和信息暂时不能解决的问题。北京大学人民医院内分泌主任纪立农教授参与了比赛的全程,作为本次比赛的评审团主席他告诉每日人物:“这次人机大赛第一次让我们直观地看到,采用AI的方法来进行疾病诊疗的决策支持是完全可以实现的,虽然需要一些前提,但是这个随着我们对患者信息采集过程的优化,AI是可以越来越好地发挥它的作用的。”
宣布最终结果的同时,平安科技副总工程师倪渊也终于长舒一口气。平安是本次大赛的主办方之一,从今年2月份开始规划,到6月份做赛程设计,再到如今比赛圆满落幕。倪渊和她的团队在这个过程中经历了重重考验。
比如,参赛者们来自不同的国家,每一个国家都有自己在疾病诊疗方面的指南。在选择病例和设计问题时,倪渊及其团队与相关专家进行过大量讨论,来避免国际差异导致的评分标准不一致,确保比赛结果的公正。
由于疫情的原因,所有的国外医生只能线上远程参赛,网络的稳定性也一直是倪渊心底的担忧。医生答题到一半掉线了怎么办?评委的分数无法上传又该怎么办?太多的不可控因素,让倪渊和团队在正式比赛前进行了多次彩排,保证每一步的细节都做到万无一失。
当然,最困难的部分还是说服医生们来参赛。乍一听到要和AI进行比赛,绝大部分的医生态度是犹豫的。倪渊说,他们在邀请时都会告诉医生,比赛并不是要证明AI比人类强,而是想在这样的场景下验证AI能否跟知名医院的医生达到相同的水平。全球有很多医疗资源匮乏的地方,如果AI的实力被肯定,是有望在未来帮助这些地方提高医疗水平,拯救更多的生命。
在比赛结束后,这样的意义也得到了参赛医生的认可,AI并不是一个替代的选择,而是能够辅助医生去做得更好。“来参赛的两个巴西医生还跟我说,以后如果有比赛还要邀请他们。所以做完这个比赛,我觉得也达到了我们想要的。”倪渊说。
▲ 参赛医生分别来自北京大学人民医院、北京大学国际医院、新加坡中央医院和巴西圣保罗大学里贝朗普雷图医院。图/受访者提供
参加比赛的AI医生名字叫AskBob,目前正在为4万多家医院和100多万名医生提供医疗辅助决策。但在最初,AskBob在平安本身是作为一款智能搜索类产品出现的,主要的服务领域在金融。2017年,AskBob迎来了改变。
谢国彤在那一年从IBM来到平安,任平安集团首席医疗科学家。在医疗领域,AI不会取代医生,是他一直以来的观点。AskBob要做的是成为医生的一件称手的工具和一名合格的助手。对于基层医生来说,它是一个导航仪,在问诊和检查阶段给予提示,在诊疗时提供建议。
谢国彤曾带着AskBob到深圳市罗湖人民医院谈合作,一开始有医生对这套系统存在质疑,并当场出了一道“难题”。那是他前一天刚刚看过的一位病人,病情相对复杂。平安的团队就将病人的各种症状输入系统,AskBob给出了三种诊断提示,其中包含了一种非常罕见的疾病。院长看到后,当即决定全院推广AskBob,因为病人最后的确诊结果就是那种罕见病。院长说,系统比他自己的学生强,这个病学生们都不见得能诊断出来,没想到这个系统居然可以。
不仅在这种顶级医院,谢国彤和他的团队也看重AskBob在基层医疗机构的普及。当基层医生的诊疗质量提高后,最明显的变化是可以将分级诊疗的政策成功落地。长期以来,由于基层医疗机构和三甲医院的医疗能力分化严重,导致三甲医院人满为患,医生也疲惫不堪。比如,在房颤的诊疗中,一些患者需要抗凝,但是有基层医生不太敢去用抗凝的方案,因为控制不好可能会导致一些出血的风险。所以一旦遇到抗凝他们直接就转到三甲医院去。
在这种情况下,AskBob和复旦大学附属中山医院合作,根据专家建议,加上临床诊疗的规范,做了一个AskBob的房颤版本,在基层医生中使用。它会明确告诉医生,患者来了要先做评估,评估后不同的情况下该怎么如何调整方案。在系统的支持下,越来越多的基层医生开始敢于用抗凝的方案,也得到了患者的认可。后来,上海徐汇枫林社区医院还专门开了一个房颤的门诊,几百个患者,他们在自己社区内就可以全部管理。
而对于专家和专科医生来说,AskBob的作用更多是在节省时间,提高效率。AskBob曾经和国家肾脏病临床研究中心的医生进行过一次比赛,通过看病理片子,来数肾小球内的3种不同固有细胞的数量。最后,机器的准确度比病理医生高5%至11%;识别每个肾小球内固有细胞数量仅需0.6秒,比病理医生快50至90倍。
对于医生来说开云网页,更重要的工作是基于这些细胞数量去判断病人的病情和治疗方式,将“数细胞”这个动作交给机器,用时少,准确率高,人机二者都完成了自己最擅长的工作,才是真正的共赢。
在AI医疗的领域,平安集团想做的从来都不是颠覆,而是帮助。“不要妄想能代替医生去做诊断和治疗,也没必要。我们要做的是,当诊疗过程中有一些耗时耗力的环节和简单的重复性劳动,就别让医生干了,机器可以干得非常好。让医生把时间花在跟患者沟通、更多地去做一些复杂的决策上,这是医生该干的事。”谢国彤说。
除了入驻医疗机构,AskBob本身也是一个一站式的医生平台。医生可以在上面查文献查指南,看到最新的科研动态。在这方面,AskBob并不是起步最早的,但一直在优化功能,努力给医生们带来最好的体验。倪渊还记得,有一段时间AskBob上突然涌入了一大批的肾内科的医生,但当时他们并没有去任何医院的肾内科做宣传推广。后来才发现,是某一名肾内科医生在使用了AskBob后,主动当起了他们的“自来水”,将AskBob转发到了各种医生群里,吸引到更多医生的加入。
这位大妈是一名严重的糖尿病患者,血糖超过正常人两三倍,住院能降下来,但是出院就复发。后来,大妈加入了平安的慢病管理计划,AI会从饮食、运动、用药等各个方面,24小时监测并不断地提醒她,在坚持3个月后,大妈的血糖回到了正常水平。她非常高兴,拍了视频,用东北人特有的幽默讲了这件事,笑得特别开心。
第一次看到视频的时候,谢国彤以为是团队找患者做的宣传,后来知道是大妈自己主动拍的,他说这是他工作中成就感最高的时刻,“你能够切实地感受到她那种喜悦,是真的有一个东西帮到她的感觉”。
这也是当初谢国彤离开IBM,选择加入平安的原因之一——离应用场景更近一些。
平安拥有自己的医疗生态圈:互联网医疗平台平安健康、平安智慧城市智慧医疗、平安健康检测中心、医疗保险……这些业务为AI技术提供了大量的数据支持,同时也使得技术的应用成为可能。“你做的任何一点点东西,在应用起来之后,能够影响到的人群是很大的,除了经济价值,它的社会价值更大。”谢国彤用那些从谷歌离开的科学家做类比,“如果我天天干的事就是研究怎么让人家多点两下那个广告链接,太浪费我的才智了。我觉得很多做技术的人是有追求的。我为什么不干点事能让这个人有病早点发现,或者治得更好,或者他出院之后,有更好的方式让他去做康复,我为什么不做这样的事情呢?”
另一件让谢国彤感触很深的事情,是团队去上海的老年活动中心做眼底筛查。2019年,平安研发了智能眼底疾病筛查系统。这个系统可以在无创的情况下,用算法筛查出大约49种眼底疾病。
以往,都是医院派医生去到老年活动中心做义诊,一天看不了几个人,效率很低。后来改用了这个系统,大爷大妈们只要按照机器的语音提示,睁眼闭眼几次,3分钟就能完成一次筛查,重疾者还能由机器把资料同步到医生侧。
结果是,有30%参与检测的老人,发现了眼底的病变,其中的一半以上需要马上治疗,甚至手术。但在这之前,他们中的大部分对自己的病毫不知情,以为只是年纪大了,眼睛花。谢国彤后来看到了上海电视台对这件事的采访,有的老年人真的因为这次筛查而尽早得到了治疗,他感到无比欣慰。目前,这套设备已经在两百多家基层场所,包括社区医院、健康驿站、非眼科医院的专科医院等地放置,谢国彤也期待它能够帮助和惠及更多的人。
今年,谢国彤的团队还和国家肾病中心的刘志红院士合作了一个项目——IgA肾病患者的肾衰竭风险预测模型。IgA肾病是慢性肾病的一种,也是亚洲人的高发肾病。这个肾病本身问题不大,但如果对它的干预和管理不到位,会造成肾衰竭,甚至死亡。这个模型的主要功能是预测病人的肾衰竭的风险有多高,以便医生可以提前做出有针对性的诊疗方案,从而拉长他进入肾衰竭的时间。
这个模型今年进入了KDIGO——全世界最权威的肾病临床指南。全世界的肾病医生进行诊疗的时候,都要去参考这个指南。在这之前,中国很少有类似的模型被这样的国际指南所引用。“我们能够做一些东西去影响全球的医疗界,通过我们的技术,帮助中国在国际的指南上面有发声的机会,让全世界的医生去参考,这个事情还是非常骄傲和自豪的。”谢国彤说。
这个月的人机大赛,已经是AskBob第三次胜利,相较于前两次的紧张,平安团队在这次比赛之前内心已有胜算。
谢国彤记得“第一次是心里最没底的”。当时,上海中山医院有一批刚刚接受完规范化培训的全科医生。比赛是在这些医生中展开的,一方的医生使用AskBob,另一方不使用,最后使用Askbob的医生拿到了80多分,而没有使用的仅有50多分。AskBob作为工具,能够帮助一位新医生快速的上手和成长,第一次看到这样的成绩,谢国彤和团队都很高兴。
第二次的比赛对手从全科医生变成心内科的专科医生,对AskBob来说,也是第一次完全独立进行比赛,最后的结果证明AskBob的心血管病综合管理能力可以和三级医院住院医生相媲美。
本次的全球首届糖尿病综合管理国际人机大赛,AskBob依然表现出色。对于平安团队的每个人而言来说,AskBob就像一个拉扯长大的孩子,看着它在过去四年,一点一点成长起来。从最开始阅读病例、文献、临床指南,然后开始能看很少的病,再到现在能看两千多种疾病,每个平安人都为AskBob过去取得的成绩骄傲,也对它的未来感到期待。
如今,平安的生态医疗想做中国版的HMO,所谓HMO,就是健康维护组织(Health MAIntenance Organization):管理式医疗的一种形式,HMO通过与特定的医生、医院和诊所协商,为本地区的自愿参保者提供成套的综合医疗服务。
不仅如此,平安想做的是,融合HMO健康管理、家庭医生会员制与O2O医疗服务三大模式的战略升级版。有人评价,在平安医疗生态圈中,平安健康作为线上医疗服务的流量入口,通过整合线上+线下资源,正在为平安集团打下一个坚实的生态地基。其串接和实现该价值主张的利器是家庭医生会员制——以之为纽带,令前端C端和B端客户的保险+医疗健康需求得以满足,助力后端O2O线上线下价值闭环的实现。“用家庭医生来连接两端,完善用户的就医旅程开云网页,弥补线上线下的断点。”
根据最新财报,平安健康注册用户达4亿人,其自身成为强大的互联网医疗流量入口,同时也是协同商业保险、政府、医保等多方资源的医疗服务网络平台,能够持续发挥积极作用。
这样一个平台,不仅让患者就诊变得更方便快捷,也能够最大限度的节约医疗资源。在中国,一年大概平均有80亿人次就诊,但医生的数量却无法满足如此大的医疗需求。每一个患者能够分到医生的时间极其有限,从而导致医患之间的交流不充分,无法彼此理解。
身为临床医生的纪立农教授也表示很期待AI能够真正成为医生的好伙伴,让医生能够拥有更多的时间去跟患者进行交流和共情,这样既能加深医患之间的信任感,也让患者对诊疗方案有更大的依从性,有助于疾病的康复。
疾病是一个很复杂的领域,每一个病例里都包含了文本、图像、视频等多种不同的数据,对AI技术的挑战很大。自1996年至今,平安在医疗健康领域已耕耘20多年,积累了雄厚的科技实力,打造了全球最大的医疗数据库之一,医疗科技专利申请数位列全球前列。这背后是有像谢国彤、倪渊这样的工作人员多年的努力付出,也有平安真金白银的投入。
平安集团每年将营业收入中的很大一部分投入到医疗生态领域,并且已经取得了瞩目的成就。2020年和2021年,平安发表的SCI期刊论文(不包括顶级人工智能国际会议的论文)涉及临床医学、医学信息学、生物统计学、计算生物学和人工智能领域,共41篇,SCI影响因子共计240.83,平均每篇论文的影响因子接近6.0。
截至2021年9月末,公司科技专利申请数较年初增加5423项,累计达36835项,金融科技、数字医疗专利申请数位列全球第一;其中发明专利申请数占比近96%、PCT 及境外专利申 请数累计达8,715项。同时,平安在国际顶尖科技比赛中频频斩获荣誉,2021年7月在国际权威视觉问答竞赛VQA(Visual Question Answering)获得“识数”任务单项冠军、总成绩亚军。
平安用AI的算法来帮助人们解决真实的需求,用“保险+医疗”HMO模式让健康管理融入每一个人的日常生活,为人们提供省心、省时、省钱的高质量服务,这是平安的愿景,也是值得所有人期待的未来。
比如,血液检查,并不是缺什么或多什么。而是在整个人体流动的血液中,是不是符合这个整体平衡。
就算把现在的数据录入,形成一个监测工具,那么,标准在哪里?本身就是错误的。
一旦定下一个标准,那么人体的大环境就被无视,把人当机器了。是不可能产生效果的。
如果,产生一种超级学习智能,每天把全世界人的身心问题进行监测,通过智能,运算出正确的标准。那才有可能说,有未来。
符合医疗器械或体外诊断资格的医疗器械软件(MDSW),在进行临床评估/性能评估时,同样也遵循监管法规所规定的一般原则,目的是能提供足够的临床证据,以证明其在按预期用途的正常使用条件下符合相关GSPR。
为每个医疗器械软件汇编临床证据时,应考虑3个关键组成部分,以下对组成部分作详细描述。
有效临床关联/科学有效性应被理解为:基于所选的输入和算法,医疗器械软件的输出与目标生理状态或临床状况的关联程度。
例:通过分析数字听诊器获得的听诊声音以检测心律失常的医疗器械软件,需证明异常心音与心律失常之间的有效临床关联。
支持有效临床关联/科学有效性的证据,可通过文献研究、专业指南、概念证明研究或制造商自身的临床调查/临床性能研究等方式生成。
制造商应验证:医疗器械软件输出,与其预期用途定义的目标生理/临床条件/临床参数的关联。
此关联应被医学界广泛接受,或在同行评审的科学文献有报道,或有其他方式的充分理论依据。
现有数据不足情况下,可创建新的临床性能数据,以进一步证明有效临床关联/科学有效性。
技术性能/分析性能是指:医疗器械软件的输入数据能准确、可靠地生成预期输出的能力。
例:单元级、集成和系统测试,或使用精心准备的数据库、精心准备的登记处、参考数据库,或使用过往收集的患者数据等,以生成新证据。
制造商应验证:医疗器械软件是否可靠、准确、持续地满足实际使用中的预期用途。
可用性、保密性、完整性、可靠性、准确性、分析灵敏度、检测限、定量限、分析特异性、线性度、阈值、测量间隔范围、通用性、预期数据速率或质量医疗科学、未存在不可接受的网络安全漏洞、人因工程学等。
例:使用真实数据集,以证明器械通用性,或将可用性评估扩展至以前被遗漏的用户群体等。
制造企业可将临床研究相关工作交付第三方企业处理,该第三方企业应具备能力有: