阿里达摩院发布“通义千问”,首席首测,学问如何?
01 阿里这个大语言模型,成色几何? 大语言模型热之下,4月7日,阿里上线邀测了自己旗下的大模型,名字叫“通义千问”。 这个阿里大模型,号称是世界首个突破 10万亿参数的 AI 大模型,据说阿里还牵头搭建了国内规模最大的 AI 模型服务社区 “魔搭”。 不过缺点是,指令字数上限为1000字,大大限制了指令输入,目前也还不支持多模态。 阿里这款大模型到底成色如何? 首席商业评论拿到了邀请码,也问了通义千问几个问题,回答如下。 首先,我们测一个大家喜闻乐见的 “情感性”问题:我妈和女朋友掉河了,先救谁? 这是一个老问题,通义千问在这个问题上比较绕,似乎有一些倾向,但似乎又有一些矛盾。当然,这种问题本身就是刁难人,AI并没有装糊涂,下图的问答也算过得去。 再问一个简单问题:宫保鸡丁怎么做?通义千问在回答的最后不忘温馨提示。 我们再上点难度,问它如何评价“首席商业评论”?它给出的回答是: 不愧阿里官方给它的形容词之一就有“写彩虹屁”,这波彩虹屁还是可以的。 首席编辑表示比较满意:)。 作为商业号,我们又问了通义千问一些商业相关的问题。 周杰伦起诉网易不正当竞争,你觉得谁会胜出? 通义先给出了一个模棱两可的答案,周杰伦起诉网易不正当竞争这个事件,涉及到著作权、商业竞争等多个方面,需要综合考虑各种因素才能做出判断,但后面也给出了自己的观点。 应该说这个回答还是相当不错的。 除了回答问题,我们又让通义千问给问界汽车做个SWOT分析。 这样标准化的问题似乎应该不会难倒AI,回答也可以作为很多人制作PPT的基础素材。 再来,以马云、马化腾、张一鸣三位大佬为主题,写首诗。 这个,似乎有点套模板了。 最后,请它用淄博烧烤为话题,写个淘宝文案。 从文案来看,格式是有内味儿了,但内容还是不大符合事实,看来通义是把淄博烧烤当成一种食材,可以送礼,可以在家自制,而不是城市路边摊。可能在最新数据上并没有接入最新的互联网热点。 从这些回答来看,通义千问在涉及到商业、科技等理性问题上,分析还算比较有逻辑,给出的回答让人基本信服。但在涉及到文学问题上表现略为逊色,写出的诗或文案,还是有硬套模版的感觉,比较生硬,整体上中规中矩。 总体来看,通义千问还是有着不错的能力的,但想要真正代替打工人写文案,恐怕还得让打工人们再费心多调教了。 首席的朋友们,如果你们想对“通义千问”提问,请在评论区留言,我们将抽取部分问题来代为提问。 02 从社交到办公,各个大厂都在卷 最近,很多公司在大模型领域已经杀疯了,短短10天,就有5场大模型发布会已经或将要与众人见面。 名字起得都相当文艺,气势上谁也不想输于对手,不少公司都是从传统文化里汲取灵感。 阿里的通义,取自《汉书》中的“天地之常经,古今之通义也”,有“普遍适用的道理与法则”之意。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具有广泛的知识和普适性,可以针对各种领域的问题“对答如流”。 而“千问”,阿里巴巴达摩院给出的官方解释是“千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的也一定是真有学问,以及AI和我们一样,都有千万次交互的热情”。 腾讯AI大模型,是从道家学说中“取经”——“混元即无极,无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦衍万物”。 根据这句经典的道家语录,腾讯将机器学习平台命名为“太极”,基于此平台研发的AI大模型命名为“混元”。 腾讯的混元AI大模型包括计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向,已广泛应用于腾讯微信搜索、腾讯广告等业务场景。 据总裁Martin所言,该大模型未来还会应用于各业务当中,除社交、通讯和游戏业务外,聊天机器人、数字助手、资讯获取等方面也将是腾讯的尝试方向。 网易也给自家大模型取了个极文雅的名字——“玉言”,取自“金口玉言”一词,即对别人所说话的敬称。 “玉言”大模型脱胎于网易伏羲,训练语料主要来自小说、百科和新闻等,模型规模从最早的一亿参数增长至千亿参数,模型领域也从文本拓展到图文、音乐、行为序列等多种模态,其具备的自然语言处理能力可应用于语言助手文本创作、新闻传媒、智能客服等领域,甚至在多项任务上超过人类水平。 此外,网易有道还将于近期推出教育场景下类ChatGPT模型——“子曰”。基于“子曰”研发的AI口语老师和中文作文批改DEMO已完成,近期开放内测,“子曰”在古代是各家学生对老师的尊称。...