人工智能又取得大胜?ChatGPT的健康问答结果碾压人类医生
(原标题:人工智能又取得大胜?ChatGPT的健康问答结果碾压人类医生)
财联社4月29日讯(编辑 赵昊)最新公布的一项研究表明,聊天机器人ChatGPT在某些方面能表现得比医生出色。
这项研究周五(4月28日)发表在国际著名医学期刊《JAMA Internal Medicine》上。结果表明:人工智能助手可能有能力帮助医生起草对患者问题的回答。
作者加州大学圣地亚哥分校约翰·W·艾尔斯(John W. Ayers)博士称,聊天机器人对患者的回应要普遍优于医生的回应,并且在回答质量和同理心方面的评分都明显高得多,“用人工智能改善医疗保健的机会是巨大的。”
具体来看,研究团队从一个社交论坛上抽取了195个医学问题,每一个问题都有人类医生作出过回答。接着将这些问题输入到ChatGPT中,得到了对应的人工智能的回答。
然后,团队将人类医生的回答和聊天机器人的回答交由三名医疗保健专业人员来评估。
这组专业人员需要在三个方面打分:一、哪个反应得更好?二、信息的质量如何?三、回答是否具备同理心?
在评估过程中,医疗保健专业人员并不知道哪一份回答是来自人类的,或是来自ChatGPT的。
结果显示:在第一个问题上,评估者认为,聊天机器人在78.6%的问题上表现得比人类医生好;
在质量上,评估者觉得聊天机器人78.5%的回答表现良好或非常好,而人类医生只有22.1%;
在同理心方面,聊天机器人45.1%的回答被评为有同理心或非常有同理心,而医生的比例只有4.6%。
研究提供了一个非常典型的例子。一名患者在论坛提出了一个问题:漂白剂溅入眼睛后是否有失明的风险。ChatGPT先是表达关切,随后针对“不太可能失明”的结果提出了七句建议和鼓励。
而人类医生则是回应,“听起来你会没事的”,然后贴出了中毒中心的电话号码。经对比,三位医疗保健专业人员都更喜欢ChatGPT的反应。
但有专家指出,ChatGPT的回复通常要比医生长得多,可能会影响质量和同理心的分数。爱丁堡大学自然语言处理教授Mirella Lapata称,如果不控制回答的长度,就很难确定评分者的判断标准。
本周另有一项研究表明,ChatGPT在一些特定的医学场合具有独特的价值和优势。研究人员要求ChatGPT提供五年级阅读水平的医嘱,“ChatGPT提供的答案写得很好、很详细,有望让待诊患者更早获得专业信息。”
不过,宾夕法尼亚大学医学教授David Asch博士强调,ChatGPT应该被视为对医生的补充。他还警告,人工智能工具还没有充分准备好,“我担心错误信息会被放大。”
更多知识
-
如何治疗和预防甲流(服务窗·科学防疫)
原标题:如何治疗和预防甲流(服务窗·科学防疫)每年春季是甲流的高发季节,最近一些地方出现了散发病例。什么是甲流?有什么特点?如何治...烟燃烟灭つ 268 阅读
-
iPhone15的type-C接口玩手段,欧盟将重罚,苹果会妥协么?
据称苹果今年的iPhone15将会首次用上type-C接口,不过苹果为了赚取厚利可能会给type-C接口,而欧盟显然也早就为此做好准备,如果苹果执意如...﹏丶小迣界 284 阅读
-
微视频|同心逐梦 共向未来
原标题:微视频|同心逐梦 共向未来春风浩荡中,2023年全国两会通过法定程序把党的二十大作出的决策部署转化为全国人民的实际行动,胜利闭...■■俗人雅钦 187 阅读
-
东方甄选回应直播间疑似售假:会积极解决问题,请不要攻击主播
Tech星球3月16日消息,日前东方甄选被曝将养殖虾当野生虾卖引发热议。昨日晚间,东方甄选官方账号发文回应称,“东方甄选作为一家公司,会...原地等候已经远去的幸福 216 阅读
-
OpenAI 离成熟商业公司更近一步
发布 GPT-4 的同时,OpenAI 离成熟公司越近,离名字里的 “Open” 越远。GPT-4 无疑是一个更好的产品。写散文、诗歌、代码,这些 GP...床上小旋风 281 阅读
-
维珍轨道公司暂停运营一周:员工休无薪假,股价暴跌50%
3月16日消息,据外媒援引知情人士消息称,当地时间周三火箭发射公司维珍轨道决定暂停运营一周时间,并安排大部分员工休无薪假,期间寻求能...冷夕颜 237 阅读
-
推动世界共同发展繁荣 创造更加美好未来
原标题:推动世界共同发展繁荣 创造更加美好未来新华社北京3月13日电题:推动世界共同发展繁荣 创造更加美好未来新华社记者十四届全国人...而后的我们 220 阅读
-
瞭望·治国理政纪事丨马上就办 真抓实干
原标题:瞭望·治国理政纪事丨马上就办 真抓实干 ◆ 1991年2...愚人自愈 203 阅读
撰写回复