文章主题:ChatGPT, 大学课程, 学生, 表现
本文概要:
1. 一项研究发现,ChatGPT在32门大学课程中的9门课程的表现可与学生相比或优于学生。
2. ChatGPT在需要广泛事实知识的课程中表现尤为出色,而学生在数学和经济学任务中表现更好。
3. 用于区分人类和机器生成文本的AI文本检测器测试全部失败。
站长之家(ChinaZ.com) 8月26日 消息:最近一项针对ChatGPT的研究发现,其在32门大学课程的测试中,有9门的表现可与学生相比或甚至优于学生。
在一项富有挑战性的实验中,纽约大学阿布扎比分校(NYUAD)的教师被 initialized 为提供他们各自的讲座中的十个问题,并且从这些问题中随机挑选出三名学生的答案。
在后续的研究过程中,研究者们采用了ChatGPT来针对每一个问题生成三个富有差异性的答案。在执行此操作时,问题 straight up被输入到ChatGPT中,而提示部分则没有任何额外的上下文信息。
在参考文献中,人们提到了GPT-4,但目前研究并未明确指出具体采用的是GPT-3.5还是GPT-4。然而,如果在研究中使用了GPT-3.5,那么利用GPT-4的AI响应质量可能会得到提升,特别是在推理领域。
ChatGPT在32个科目中的表现令人瞩目,其中在9个科目上,它的表现甚至超越了人类学生。在经过与学生回复的混合后,这些评估将会有来自三位不同审阅者的评分。这一结果进一步证实了ChatGPT在学术领域的卓越表现,以及其作为人工智能助手的巨大潜力。
数据结构
公共政策概论
定量合成生物学
网络战
面向对象编程
土木工程材料的结构与性能
生物心理学
气候/变化
管理与组织
在“公共政策概论”这门课程中,ChatGPT的 average score 是学生平均分的一半以上。而在涉及到较高认知技能的数学和经济任务时,学生们却展现出了超越ChatGPT的能力。
在进一步的研究中,研究者们尝试运用OpenAI所具备的人工智能文本分类能力以及GPT-Zero的可靠性,来区分人类文本与机器文本。然而,这一方案并未得到公司的支持,原因在于其可靠性无法满足相关规定。
OpenAI 工具将5% 的人类文本错误分类为机器文本,而 GPTZero 将18% 的人类文本错误分类。考虑到所涉学生可能被错误地指控作弊的潜在后果,这是一个灾难性的结果。
相反,OpenAI 工具将49% 的机器生成文本识别为人类文本,而 GPTZero 的这一比例为32%。在这两种情况下,人工智能文本作为人类文本传递的可能性都很高。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!