×

ChatGPT 首次通过神经学考试

admin admin 发表于2024-10-11 16:59:24 浏览74 评论0

抢沙发发表评论

OpenAI 的 LLM 4.0 正确回答了美国精神病学和神经病学委员会 85% 的问题,这意味着该技术未来可能会有 "重大 "用途。


ChatGPT 首次通过神经学考试新闻




OpenAI 最新升级的大型语言模型(LLM)ChatGPT-4.0 在一项概念验证研究中以 85% 的正确率通过了临床神经学考试。研究报告的作者认为,经过一些微调后,LLM 在临床神经学中会有 "重大应用"。


海德堡大学医院和海德堡德国癌症研究中心的一组研究人员于 12 月 7 日公布了实验结果。该测试于 5 月 31 日进行,使用了两个 LLM,即 ChatGPT-3.5 及其后期版本 ChatGPT-4.0。


研究人员使用了美国精神病学和神经病学委员会的神经病学考试题库以及欧洲神经病学委员会的一小部分问题。


旧版本的ChatGPT得分率为66.8%,在1956个问题中答对了1306个,而最新版本的ChatGPT-4.0得分率为85%,答对了1662个问题。人类的平均得分是 73.8%。ChatGPT-4.0 在行为、认知和心理相关问题上的表现优于人类用户,并有效地 "通过 "了神经学考试,因为在教育机构中,70% 的正确答案通常被视为及格分数。


不过,在需要 "高阶思维 "的任务中,两种模型的表现都比只需要 "低阶思维 "的问题相对弱一些。


据进行实验的研究小组称,这些结果建议在进行一些修改后将 LLMs 用于临床神经学:


"这些研究结果表明,经过进一步完善,大型语言模型可以在临床神经学中得到重要应用"。

研究人员指出,目前仍有一些保留意见。虽然将 LLMs 应用于文档和决策支持系统的前景明确,但神经学家在实际使用时应谨慎,因为它们在高阶认知任务方面仍不完善。该研究的作者之一 Varun Venkataramani 博士在接受 Cointelegraph 采访时说:


"我们认为我们的研究更像是对 LLM 功能的概念验证。LLMs还需要发展,甚至可能需要具体的微调,才能使其正确适用于临床神经学。"

人工智能已经在医疗保健领域的一些重大任务中发挥作用,例如为阿斯利康(AstraZeneca)寻找癌症的治疗方法,或在香港对抗抗生素的过量处方的现象。


群贤毕至

访客