ChatGPT通过了美国放射学委员会的考试,但其收集信息的可靠性仍令人担忧
科技日报记者 刘霞。过美国放 加拿大科学家在16日发表的射学收集《放射学》杂志上发表了一篇新论文,称最新版本的考试靠性ChatGPT通过了美国放射学委员会的考试,突出了大型语言模型的信息潜力,但也给出了一些错误的仍令人担答案,表明人们仍然需要检查他们提供的过美国放答案。 图片来源:物理学家组织网。射学收集 ChatGPT是考试靠性一种人工智能(AI)聊天机器人,它使用深度学习模型在巨大的信息训练数据中识别单词之间的模式和关系,并根据提示生成类似的仍令人担人类反应,类似的过美国放聊天机器人包含在谷歌和流行的搜索引擎,医生和病人也会使用这些搜索引擎来搜索医疗信息。射学收集但由于数据源不一定真实可靠,考试靠性工具会给出与事实不符的信息答案。 多伦多大学的仍令人担拉杰什·哈瓦那博士及其同事首先测试了基于GPT-3.5的ChatGPT的表现,以评估ChatGPT在美国放射学委员会考试中的表现,并探索其优势和局限性。研究小组使用了150道选择题,与加拿大皇家学院和美国放射学委员会的风格、内容和难度相当。这些问题不包括图像,分为低级思维问题(知识回忆、基本理解)和高级思维问题(应用、分析、综合)。可进一步细分为影像表现描述、临床管理、计算与分类、疾病关联等高级思维问题。 研究人员发现,基于GPT-3.5的ChatGPT正确率为69%,接近70%。该模型在低级思维问题上表现较好,正确率为84%,但在回答高级思维问题时表现不佳,正确率仅为60%。GPT-4的正确率为81%,高级思维问题的正确率为81%,远好于GPT-3.5。但GPT-4在低级思维问题上的正确率只有80%,答错了12个问题——GPT-3.5所有这些问题都得到了正确的回答,这引起了研究团队对GPT-4信息收集可靠性的担忧。 这两项研究都表明,ChatGPT倾向于提供错误的答案,仅仅依靠它来获取信息是非常危险的,因为人们可能没有意识到答案是不准确的,这是它目前面临的最大问题。目前,ChatGPT最适合激发想法,帮助编写数据摘要,并快速检索信息,需要验证其提供的事实答案。
- 最近发表
- 随机阅读
-
- 云南德宏发现兰科植物新种——盈江虾脊兰
- 我国西北电网新能源发电装机占比超过50%
- 元旦假期第二天全国道路交通平稳有序
- 重庆沙坪坝区着力打造成渝地区创新驱动示范区
- 春节假期全国投递快递包裹超6.41亿件
- 北京怀柔:多模态跨尺度生物医学成像设施启动试运行
- 八部门印发指导意见 到2027年传统制造业发展水平明显提升
- 广东车八岭保护区发现新物种——车八岭竹叶蛙
- “央博龙年新春云庙会”数字门票助你游四方
- 涉嫌违规寄递烟花爆竹 三家快递企业被约谈
- 国内首个井下电加热稠油井组成功采出稠油
- 元旦假期首日跨省游占比55%,热门目的地有这些
- 乘着高铁看雄安,揭秘创新加速度!
- 北京地铁16号线全线贯通运行
- 集众智解难题 宁夏举办第二届博士论坛
- 今年新建70家智能工厂 “智造优等生”上海希冀构建“产业大脑”
- 开年首月我国人民币贷款增加4.92万亿元
- 甘肃积石山县高三1498名学生全部实现异地复课
- 新型气凝胶助力太赫兹技术应用
- 人参等三种原料纳入保健食品备案原料目录
- 搜索
-