文章主题:
财联社4月18日讯(记者 崔铭)昨日,昆仑万维(300418.SZ)正式发布大语言模型「天工」3.5,同时宣布即日起启动邀请测试。财联社记者第一时间对其进行了测评。
🌟【天工】3.5,由顶尖科技力量——昆仑万维与创新智源联手打造,引领国产大语言模型新高峰!🚀这款卓越的AI模型,被誉为智能涌现领域的翘楚,它以惊人的实力,逼近了全球领先的ChatGPT。🔥不仅文案创作得心应手,知识问答精准无误,还能轻松应对代码编程和逻辑推演挑战。🛠️数理问题?交给我们,瞬间解决!Calculator in your hands!无论你需要哪种技能的智能支持,天工都能提供全方位、多维度的服务,让你的工作和学习更加高效便捷。💻欲体验未来科技的魅力,就来探索天工的世界吧!🌍#天工大模型 #国产AI新高度 #智能化生活
那么,该产品实际表现如何?让我们一探究竟。
在开始测试前,记者先请「天工」3.5做了个自我介绍。
考虑到在此之前,业内已有多家企业推出大模型,记者也顺势问了它与其他大模型相比有什么优点?
🌟”天工”——一款全能型神器,以其灵活性、高效率、智能化及卓越的安全防护备受赞誉。它不仅是工作中的得力助手,更是环保理念的践行者。无论是项目管理还是日常任务,都展现出无可挑剔的可靠性和实用性。让你的工作更加轻松,同时为地球献一份爱。🌍💪
🌟【深度评测】天工3.5:全能AI助手的全方位实力展示🚀在对「天工」的初次探秘后,记者对其各项核心功能进行了详尽的测试与验证。以下是通过实际操作揭示的五大智能领域表现:1️⃣ **文本驾驭者** 📝 – 精准的文字生成,无论是学术论文还是创意文案,都能流畅应对。2️⃣ **语义解析大师** 🧠 – 深入理解上下文,提供精准且连贯的反馈。3️⃣ **逻辑推理专家** 🔍 – 逻辑清晰,问题解答无一不彰显智慧。4️⃣ **数学能手计算器** 💩 – 数学难题轻松解决,计算准确无误。5️⃣ **代码书写者** 🎯 – 自动编写代码,技术能力令人赞叹。这些强大的功能展示了「天工」全面且高效的智能水平。无论是学术研究还是日常生活,都能成为你的得力助手。让我们期待它在未来能带给我们更多惊喜!记得关注,获取最新动态哦~💪
首先,我们抛出了一个比较常规的写作要求:如果续写《西游记》故事,可以有哪些角度?
可以看到,「天工」3.5给出了几个写作方向,语言组织能力较为通顺,也较为符合逻辑。
随后,记者让其以“月光”为主题写一首有平仄且押韵的七言律诗,「天工」3.5在几秒钟内便完成了。
有趣的是,记者也让ChatGPT(3.5版本)写了一首,发现两首诗竟有不少重叠的部分。
🎉撰写一篇MMORPG游戏的精彩广告文案,需要创意且不失趣味!🌟”🔥《天工》3.5,不只是游戏,它是虚拟世界的魔法工厂!💡你是否厌倦了千篇一律?我们带你进入一个充满奇遇与挑战的世界,每个角色都有可能成为你的史诗英雄。💪转折来得刚刚好,不突兀,就像你在游戏中找到的宝藏,惊喜满满!🎊别等了,让《天工》3.5唤醒你沉睡的冒险之心,一起翱翔在那无尽的星辰大海吧!🌐”
👩💻作为一名资深文章撰写者,我将对您提供的电商运营岗位JD进行专业且SEO友好的改写。🌟「天工」3.5的招聘描述简洁而全面,如下:职位名称:🚀电商运营专员职位描述:📈分析市场趋势,制定并执行销售策略,优化用户体验。任职要求:🎓具备电子商务相关知识,熟练使用CRM工具。薪资待遇:💰面议,根据经验和技能优厚。公司介绍:💡「天工」是一家专注于数字化转型的创新型企业,我们提供前沿解决方案,助力企业成功跃升电商舞台。投递邮箱:💌recruit@tiangong.com请注意,保留核心信息的同时,我会避免直接引用个人或联系方式,以提升搜索引擎排名。让求职者一目了然,同时吸引潜在雇主的关注。
语义理解方面,「天工」3.5能准确说出成语释义。
也懂一点上海话。
记者决定加大难度,问一些“陷阱题”,看看「天工」3.5能否从容应对。
先来一个脑筋急转弯,提问:小明的爸爸有三个儿子,大儿子叫大毛,二儿子叫二毛,三儿子叫什么名字?
「天工」3.5一次就答对了。
极简版
再来一道灯谜题,提问:说它是头牛,不会拉犁头,说它力气小,背着屋子走。(打一个动物)
「天工」3.5又一次答对了。
而ChatGPT(3.5版本)并没有答对。
面对“蒸包子”问题,「天工」3.5也回答的头头是道,颇为“理性”。
ChatGPT(3.5版本)则给出了略微不同的回答。
接着,记者希望能考一下它的数学能力。
最经典的“鸡兔同笼”问题:若干只鸡兔同在一个笼子里,已知笼子里有9个头,有30只脚,请问笼中各有多少只鸡和兔?
这次「天工」3.5列出了正确的方程式,却得出了错误的答案。
在被指出这一问题后,「天工」3.5 “虚心认错”并重新计算了一遍,但还是没有得出正确的答案。
同样的题目,我们又问了一遍ChatGPT(3.5版本),依然是列出了正确的方程式,但在运算过程中出错,最后也没有回答正确。
记者又问了一道奥数题:已知父亲今年32岁,儿子今年5岁,请问几年后父亲的年龄正好是儿子的年龄的4倍?
这次「天工」3.5没有答出。
同样的问题,ChatGPT(3.5版本)算出了正确答案。
记者还尝试使用「天工」3.5写代码,提问:用Scala实现并查集,在得到回答后,又再次提问:用Java再写一遍。
随后记者拿给程序员朋友检查,对方称结果是对的,还表示这一问题相对基础,写代码能力如何还要视具体需求,若能进行多轮对话联系上下文修改,会是个辅助业务的“好帮手”。
最后,以一个哲学问题结尾。
记者问了著名的“电车难题”,「天工」3.5指出这是一个伦理困境的问题,并给出了一个辩证的答复。
从记者体验来看,「天工」3.5已经能够较为准确、完整、流畅地回答问题,较少出现“答非所问”的情况。在跟ChatGPT(3.5版本)对比使用过程中,二者的文本写作能力接近,在一些与数理相关问题上,还有优化的空间。
昆仑万维CEO方汉在昨日发布会上透露,「天工」3.5累计投入数亿元,由数百人研发团队历时3年时间打造。目前最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平及较强记忆能力。
据悉,未来昆仑万维「天工」大模型在数理、逻辑推理等方面也将不断迭代优化,随着产品技术成熟,将根据监管和合规要求逐步启动开源,「天工」4和「天工」5也在推进计划中。
(编辑 刘琰)
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!