“类ChatGPT模型MOSS英文回答水平高于中文:数据质量是关键”

MOSS 2 年前 0 1

文章主题：复旦大学, 邱锡鹏, 类ChatGPT, MOSS

复旦大学邱锡鹏教授团队于2月21日宣布推出我国首个同类 ChatGPT 模型 MOSS，此消息一经发布，便引发了各行各业积极参与内测的热潮。值得注意的是，MOSS 的英文回答表现相较于中文更为出色，这一现象在公众与 ChatGPT 的互动中也有一定的相似之处。那么，为何会出现这样的结果呢？

深圳粤港澳大湾区数字经济研究院（IDEA）认知计算与自然语言中心文本生成算法团队负责人王昊指出，数据质量的差异是中文自然语言处理面临的主要挑战之一。由于相较于英文数据，中文数据的开放度较低，使得中文数据集的规模相对较小。另外，英文作为科研的主流语言，在学术界和工业界中被广泛运用，从而积累了大量的优质语料数据，为英文自然语言处理的研究提供了巨大的优势。MOSS研究团队也坦诚地表示，“相较于中文，MOSS的英文回答能力更强，这是因为其模型基础部分学习了3000多亿个英文单词，而中文词汇的学习量仅约为300亿个。”

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复