测评团队还指出,目前大模型的会计分录生成能力普遍较差,较财务数字化探索在2023年2月的测试结果改善并不明显。
这个结果是测评团队基于上述题目、维度的一个带主观性的结果。YCY会计行业观察在2023年12月中旬对同样的11个国产大模型提问,评分结果与其有很大的不同(参阅《在会计行业问题 AI回答哪家强?》)。当然,这些测评都可供读者参考。本测试中使用的11个免费国内大模型链接
智谱清言 https://chatglm.cn/
文心一言 https://yiyan.baidu.com/
讯飞星火 https://xinghuo.xfyun.cn/
腾讯混元 https://hunyuan.tencent.com/
面壁露卡 https://luca.cn/chat
360智脑 https://chat.360.com/?
天工 https://www.tiangong.cn/
KimiChat https://kimi.moonshot.cn/
通义千问 https://tongyi.aliyun.com/qianwen/
云雀大模型(豆包) https://www.doubao.com/chat
百川智能 https://www.baichuan-ai.com/home
欢迎关注财务数字化探索公众号
深入阅读和互动