(资料图片仅供参考)
随着越来越多的消费者转向新推出的 ChatGPT 寻求健康建议,研究人员迫切希望了解人工智能聊天机器人提供的信息是否可靠和准确。马里兰大学医学院 (UMSOM) 的研究人员进行的一项新研究表明,所生成的答案在绝大多数情况下都提供了正确的信息;但有时,这些信息是不准确的,甚至是虚构的。
研究结果今天发表在放射学杂志上。
2023 年 2 月,UMSOM 研究人员创建了一组 25 个与乳腺癌筛查建议相关的问题。他们将每个问题提交给 ChatGPT 三次,以查看生成的响应。(聊天机器人以每次提出问题时都会改变其反应而闻名。)三位接受过乳房 X 光检查培训的放射科医生评估了这些反应;他们发现,对于 25 个问题中的 22 个,答案是恰当的。然而,聊天机器人确实根据过时的信息提供了一个答案。其他两个问题的回答不一致,每次提出相同问题时都会有很大差异。
“我们发现 ChatGPT 在大约 88% 的时间内正确回答了问题,这非常惊人,”研究通讯作者、UMSOM 诊断放射学和核医学助理教授兼 UM 医学智能成像中心 (UM2ii) 主任 Paul Yi 医学博士说).“它还有一个额外的好处,就是将信息汇总成一种易于消化的形式,以便消费者轻松理解。”ChatGPT 正确回答了有关乳腺癌症状、哪些人处于危险中的问题,以及有关乳房 X 光检查的费用、年龄和频率建议的问题。
缺点是它的响应不如人们通常在谷歌搜索中找到的那样全面。“ChatGPT 只提供了一套由癌症协会发布的关于乳腺癌筛查的建议,但没有提到疾病控制和预防中心 (CDC) 或预防服务工作组 (USPSTF) 提出的不同建议, “研究的主要作者 Hana Haver 医学博士说,他是马里兰大学医学中心的放射科住院医师。
在研究人员认为不合适的一个回应中,ChatGPT 提供了一个过时的回应来计划围绕 疫苗接种进行乳房 X 光检查。2022 年 2 月更改了在接种 疫苗后将乳房 X 光检查推迟四到六周的建议,CDC 认可不建议等待的 USPSTF 指南。对于有关个人患乳腺癌的个人风险以及某人可以在哪里进行乳房 X 光检查的问题,给出了不一致的回答。
关键词: