ChatGPT在32门大学课程中展现出了惊人的表现：它能在9门课程中与学生相比甚至超越学生，尤其在需要广泛事实知识的课程中，它的表现尤为出色

文章主题：ChatGPT, 大学课程, 学生, 表现

“公共政策概论”课程中，ChatGPT的平均得分是学生的两倍多。

本文概要:

1. 一项研究发现，ChatGPT在32门大学课程中的9门课程的表现可与学生相比或优于学生。

2. ChatGPT在需要广泛事实知识的课程中表现尤为出色，而学生在数学和经济学任务中表现更好。

3. 用于区分人类和机器生成文本的AI文本检测器测试全部失败。

站长之家(ChinaZ.com) 8月26日消息:最近一项针对ChatGPT的研究发现，其在32门大学课程的测试中，有9门的表现可与学生相比或甚至优于学生。

在一项富有挑战性的实验中，纽约大学阿布扎比分校（NYUAD）的教师被 initialized 为提供他们各自的讲座中的十个问题，并且从这些问题中随机挑选出三名学生的答案。

在后续的研究过程中，研究者们采用了ChatGPT来针对每一个问题生成三个富有差异性的答案。在执行此操作时，问题 straight up被输入到ChatGPT中，而提示部分则没有任何额外的上下文信息。

在参考文献中，人们提到了GPT-4，但目前研究并未明确指出具体采用的是GPT-3.5还是GPT-4。然而，如果在研究中使用了GPT-3.5，那么利用GPT-4的AI响应质量可能会得到提升，特别是在推理领域。

ChatGPT在32个科目中的表现令人瞩目，其中在9个科目上，它的表现甚至超越了人类学生。在经过与学生回复的混合后，这些评估将会有来自三位不同审阅者的评分。这一结果进一步证实了ChatGPT在学术领域的卓越表现，以及其作为人工智能助手的巨大潜力。

数据结构

公共政策概论

定量合成生物学

网络战

面向对象编程

土木工程材料的结构与性能

生物心理学

气候/变化

管理与组织

在“公共政策概论”这门课程中，ChatGPT的 average score 是学生平均分的一半以上。而在涉及到较高认知技能的数学和经济任务时，学生们却展现出了超越ChatGPT的能力。

在进一步的研究中，研究者们尝试运用OpenAI所具备的人工智能文本分类能力以及GPT-Zero的可靠性，来区分人类文本与机器文本。然而，这一方案并未得到公司的支持，原因在于其可靠性无法满足相关规定。

OpenAI 工具将5% 的人类文本错误分类为机器文本，而 GPTZero 将18% 的人类文本错误分类。考虑到所涉学生可能被错误地指控作弊的潜在后果，这是一个灾难性的结果。

相反，OpenAI 工具将49% 的机器生成文本识别为人类文本，而 GPTZero 的这一比例为32%。在这两种情况下，人工智能文本作为人类文本传递的可能性都很高。

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！