“怪病”缠身3年求医无果,最后竟然被ChatGPT成功诊断!
这是发生在一名4岁男孩身上的真实经历。
某次运动后,他身体开始剧痛。母亲前后带她看了17名医生,从儿科、骨科到各种专家,先后进行了MRI等一种类稽查,但没一个真正找出病因。
他的母亲没抱太大渴望地测验求助ChatGPT,后者却根据描述和检察报告,直行给出了确凿的建议。
话题一出冲上知乎热榜,Reddit热度也飙升至2.3k。
有网友表态,GPT本次真的很让人快乐:
每个医生的办公室都允许配备一个AI助手,并将它与本身的诊断结果进行比较。
还有网友cue了下谷歌专门训练的辅助医疗诊断大模型Med-PaLM,想知道它的诊断结果怎样:
对于大模型而言,这几乎是个完美的测评任务。
所以,这具体是应该一回事?
故事的主人公名叫Alex,他的母亲Courtney总共有两个孩子。
2023年的一天,Alex的保姆告诉Courtney,Alex平素都要服用止痛药,不然就会疼到崩溃。
接着,Alex又展示了磨牙的症状,父母把这两件事联系到了一起,认为可能是由换牙抑或蛀牙引起的疼痛导致的。
于是母亲带着Alex去看了牙医,Alex长达三年的寻医之路便郑重开始了。
源于牙医稽查往后没有显现任何问题,但提出鉴于Alex现时磨牙,推荐他们去看专门治疗气道阻塞的正畸医生。
正畸医生发现,Alex的上颚太小,导致呼吸特殊情况,于是给Alex放置了一个加入器。这种治疗方式的确起到了效果,母亲一度认为Alex的病马上就要痊愈了。
很合理,但现实往往是不讲逻辑的。
妈妈很快又浮现,只有四岁的Alex个子突然不长了。
这一次,妈妈求助的是一名儿科医生。
医生认为Alex大概是受到了新冠病毒的影响,但妈妈对这个解释并不满意。但是,妈妈保持在2023年初带着Alex去复查了。
医生告诉妈妈,Alex的个子“长高了一点”,但出现Alex的左右脚有些不平衡,建议他们选择物理治疗。
该次妈妈倒是笃信了医生的话,但在物理治疗开始之前,Alex又显现了头痛的症状,而且越来越主要。
物理治疗的事只好先搁置一下,母亲先带Alex去看神经(内)科医生,结论是Alex患有偏头痛。
在和头痛进行抗争的同时,Alex还被精疲力竭的症状困扰着,于是又被带到了耳鼻喉科医生那里查察是否有鼻窦问题效力睡眠。
经历了这番波折往后,Alex终于开始接受物理治疗,他的物理治疗师认为,Alex抑或患有一种名为Chiari畸形的先天性疾病。
这种先天性疾病会导致头骨与脊柱相接处的大脑展现万分。
母亲开始对此展开思考,带着Alex看了新的儿科医生、小儿内科医生、成人内科医生和肌肉骨骼医生等。
最终Alex看过的医生多达17位,可以说几乎踏遍了能想到的所有科室,甚至被送入急诊,但如故没能稽察出个所以然。
直到ChatGPT让整个事件显露了180度大逆转。
抱着试一试的心态,母亲注册了一个ChatGPT账号。
她将Alex的症状和MRI报告中的注释一并输入,其中有一个细节,就是Alex不可实现盘腿坐的动作。
ChatGPT给出了诊断——脊髓栓系综合征(TCS)。
当然Courtney并没有直行确信,得到答案以后她先是找到了Facebook上的一个患儿家长沟通群。
结果看了里面的讨论之后,母亲觉得这些症状和Alex真的是太像了。
这一呈现让几近熄灭的奢望之火重新燃了起来,事后母亲回忆说,自身在电脑前坐了一整晚,经历了所有的一切。
带着这一结论和Alex的MRI报告,找到了神经外科医生。
该次终于是找对人了,神外医生看了一眼MRI就给出了和ChatGPT一样的结论,并指出了栓系的具体位置。
再后来的事情就比较顺利了。Alex接受了手术治疗,当下正在进行康复。
那么为什么Alex直到看到第18个医生才最后确诊呢?
首先,和Alex本身也有一定关系。
TCS患者的背部平素会浮现裂口,但Alex并没有裂口,这种情况称为隐式脊髓栓系综合征(O TCS)。
即使TCS是罕见病,但在新生儿中的发病率也并不低,约为0.005~0.025%,比白血病的发病率还要高一些。
但OT CS就比较罕见了——罕见到发病率根本没统计出来。
不过毕竟故事的最后,外科医生看到MRI图像以后很快就给出了决断。
所以,之前没能确诊,或许是由于“找错了医生”:那17名医生中,的确没有人从事外科。
当然,这也是正常的,毕竟他们都是擅长各自专注领域的专科医生(对应全科医生),专门之外的知识难免了解不全面。
但是这也暴露出了一个问题,遇到不可解释的难题时,这些医生都没有商量进行多学科会诊,是否全面询问过Alex的各项病史也不得而知。
用母亲Courtney的话说,没有人愿意解决“更大(超出自身学科范围)的问题”,没有人会给出任何关于诊断结果的线索。
而ChatGPT的知识库至少在广度上比细分领域的专注人士要充裕的多,更加全面地切磋了Alex的情况,最后才给出切实的结论。
那么此次ChatGPT的成功诊断,究竟是误打误撞,依然确实曾经具备诊断能力了?
事实上,用ChatGPT或GPT-4来做病情诊断工具,也不是第一次有人这样做了。
像是GPT-4出来后不久,就有人用它成功诊断了自家狗子的一种病例,这段经历一度在网上爆火。
他将狗子从头一回发病开始的症状、治疗工序以及每次的血液尝试报告都告诉了GPT-4:
20号当天高烧41.5摄氏度,医生根据验血结果诊断为犬巴贝斯虫病(附血液测评结果),接下来的3天接受抗生素治疗,24日当天接受抗生素治疗,但呈现牙龈苍白(附新的血液尝试结果)。
GPT-4很快给出了检测结果,并在互动中声明大概是以下两种原因导致的:
1、溶血:因为各种原因造成的红细胞破坏,如免疫介导性溶血性贫血(IMHA)、毒素或除巴贝斯虫病以外的其他感染。
2、失血:内部或外部出血,可由创伤、手术或胃肠道问题 (如溃疡或寄生虫)引发。
最后医生诊断结果显露,狗子患上的确实是免疫介导性溶血性贫血(IMHA),对症下药后狗子得救了。
除此之外,也有网友自述被ChatGPT(GPT-4)救了一命的经历。
他在去健身房后浑身酸痛,将病症咨询GPT-4后,得出“横纹肌溶解症”的答案,立刻去医院并因此捡了一命。
但也有学术思考提到,不论是ChatGPT仍旧GPT-4,都并非一个完全允许依靠的AI医生。
举例哈佛大学附属医院布莱根妇女医院(BWH)发表在JAMA上的一项思虑就呈现,在给出癌症治疗建议时,ChatGPT只有62%的案例是完全切实的。
在其他的案例中,有34%的建议至少都涵盖一个或多个和无误诊断结果不一致的答案,还有2%的案例给出了无法信的诊断结果。
对此,商酌认为,还不能完全将诊断交给ChatGPT或GPT-4,毕竟他们在诊断这一工序上还是无从和专注的医生相比。
(但是有网友指出,ChatGPT没诊断成功的原因,抑或也和训练数据有关,2023年之后的治疗讯息不网罗其中)
对此,哈佛大学流行病学助理教授Andrew Beam认为,ChatGPT和GPT-4的使用效果怎么分两面看待:
一方面,它们要比一些普通的诊断软件或是谷歌搜索引擎更好用,格外是GPT-4这个版本。
但另一方面,它们现时还不太没准取代具备大批专注知识的临床医生。毕竟对于AI来说,它们确实没准在找不到答案时捏造音讯,根据“幻觉”推想出错误结果。
美国医学会(AMA)的主席Jesse M. Ehrenfeld对此表态,即使AI能诊断结果,最后的责任如旧医生自身的。
总结一下上述观点就是,大伙儿可以用AI辅助诊断病情,比搜索引擎好用,但最终如旧得去医院,找医生确诊。
那么,要么安排用大模型“问问诊”,哪个大模型最好用?
有网友就以自身为病例,测验了各种大语言模型是否具备诊断能力,最终认为依然GPT-4比较能胜任:
我早已就慢性咳嗽的原因咨询过几位医生,但最终是在一个油管频道上得悉自身患了LPR(隐性咽喉返流)。
我用本身的病例测了测大模型,GPT-4是唯一一个成功诊断的。Claude2虽说答案接近,但没能完全自主诊断出来。
你有测试过用AI援手判别病情吗?感觉效果应该?
参考链接:
[1]https://www.today.com/health/mom-chatgpt-diagnosis-pain-rcna101843
[2]https://www.reddit.com/r/ChatGPT/comments/16gfrwp/a_boy_saw_17_doctors_over_3_years_for_chronic/
[3]https://news.harvard.edu/gazette/story/2023/08/need-cancer-treatment-advice-forget-chatgpt/
—完—
(投诉)
AI正版系统源码推荐:小狐狸GPT-AI付费创作系统+对接我国各大接口