阿里达摩院发布“通义千问”,首席首测,学问如何?
通义千问

阿里达摩院发布“通义千问”,首席首测,学问如何?

01 阿里这个大语言模型,成色几何? 大语言模型热之下,4月7日,阿里上线邀测了自己旗下的大模型,名字叫“通义千问”。 这个阿里大模型,号称是世界首个突破 10万亿参数的 AI 大模型,据说阿里还牵头搭建了国内规模最大的 AI 模型服务社区 “魔搭”。 不过缺点是,指令字数上限为1000字,大大限制了指令输入,目前也还不支持多模态。 阿里这款大模型到底成色如何? 首席商业评论拿到了邀请码,也问了通义千问几个问题,回答如下。 首先,我们测一个大家喜闻乐见的 “情感性”问题:我妈和女朋友掉河了,先救谁? 这是一个老问题,通义千问在这个问题上比较绕,似乎有一些倾向,但似乎又有一些矛盾。当然,这种问题本身就是刁难人,AI并没有装糊涂,下图的问答也算过得去。 再问一个简单问题:宫保鸡丁怎么做?通义千问在回答的最后不忘温馨提示。 我们再上点难度,问它如何评价“首席商业评论”?它给出的回答是: 不愧阿里官方给它的形容词之一就有“写彩虹屁”,这波彩虹屁还是可以的。 首席编辑表示比较满意:)。 作为商业号,我们又问了通义千问一些商业相关的问题。 周杰伦起诉网易不正当竞争,你觉得谁会胜出? 通义先给出了一个模棱两可的答案,周杰伦起诉网易不正当竞争这个事件,涉及到著作权、商业竞争等多个方面,需要综合考虑各种因素才能做出判断,但后面也给出了自己的观点。 应该说这个回答还是相当不错的。 除了回答问题,我们又让通义千问给问界汽车做个SWOT分析。 这样标准化的问题似乎应该不会难倒AI,回答也可以作为很多人制作PPT的基础素材。 再来,以马云、马化腾、张一鸣三位大佬为主题,写首诗。 这个,似乎有点套模板了。 最后,请它用淄博烧烤为话题,写个淘宝文案。 从文案来看,格式是有内味儿了,但内容还是不大符合事实,看来通义是把淄博烧烤当成一种食材,可以送礼,可以在家自制,而不是城市路边摊。可能在最新数据上并没有接入最新的互联网热点。 从这些回答来看,通义千问在涉及到商业、科技等理性问题上,分析还算比较有逻辑,给出的回答让人基本信服。但在涉及到文学问题上表现略为逊色,写出的诗或文案,还是有硬套模版的感觉,比较生硬,整体上中规中矩。 总体来看,通义千问还是有着不错的能力的,但想要真正代替打工人写文案,恐怕还得让打工人们再费心多调教了。 首席的朋友们,如果你们想对“通义千问”提问,请在评论区留言,我们将抽取部分问题来代为提问。 02 从社交到办公,各个大厂都在卷 最近,很多公司在大模型领域已经杀疯了,短短10天,就有5场大模型发布会已经或将要与众人见面。 名字起得都相当文艺,气势上谁也不想输于对手,不少公司都是从传统文化里汲取灵感。 阿里的通义,取自《汉书》中的“天地之常经,古今之通义也”,有“普遍适用的道理与法则”之意。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具有广泛的知识和普适性,可以针对各种领域的问题“对答如流”。 而“千问”,阿里巴巴达摩院给出的官方解释是“千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的也一定是真有学问,以及AI和我们一样,都有千万次交互的热情”。 腾讯AI大模型,是从道家学说中“取经”——“混元即无极,无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦衍万物”。 根据这句经典的道家语录,腾讯将机器学习平台命名为“太极”,基于此平台研发的AI大模型命名为“混元”。 腾讯的混元AI大模型包括计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向,已广泛应用于腾讯微信搜索、腾讯广告等业务场景。 据总裁Martin所言,该大模型未来还会应用于各业务当中,除社交、通讯和游戏业务外,聊天机器人、数字助手、资讯获取等方面也将是腾讯的尝试方向。 网易也给自家大模型取了个极文雅的名字——“玉言”,取自“金口玉言”一词,即对别人所说话的敬称。 “玉言”大模型脱胎于网易伏羲,训练语料主要来自小说、百科和新闻等,模型规模从最早的一亿参数增长至千亿参数,模型领域也从文本拓展到图文、音乐、行为序列等多种模态,其具备的自然语言处理能力可应用于语言助手文本创作、新闻传媒、智能客服等领域,甚至在多项任务上超过人类水平。 此外,网易有道还将于近期推出教育场景下类ChatGPT模型——“子曰”。基于“子曰”研发的AI口语老师和中文作文批改DEMO已完成,近期开放内测,“子曰”在古代是各家学生对老师的尊称。...
阿里通义千问,通向企业
通义千问

阿里通义千问,通向企业

当下正处于大模型应用落地的前夜,这是一场从底层基础设施即服务、平台即服务,再到模型即服务(MaaS)、软件即服务的全方位竞争。 文|徐鑫 赵艳秋 编|石兆 “人工智能技术全面爆发,新一代技术出现,和可能带来对各行各业颠覆性影响及机会,让我们看到了一个数字化时代后,全新的智能化时代的到来。” 躬身入局,进入云战场后的第一次峰会上,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇将阿里云的发展阶段及未来的方向定调——全面拥抱智能化时代。 阿里几天前开始邀测的“通义千问”大语言模型无疑是峰会的焦点。 张勇把大语言模型带来的AI普及和算力普惠一起视作阿里云对外提供的基础设施,也是阿里云面向智能化时代的核心战略。从某种程度上看,通义千问不仅仅属于阿里,任何企业都可以在云上获取它的能力。 去年阿里首次提及的MaaS(Model as a Service)在峰会上被重申,未来会与阿里云此前的AI基础设施(IaaS 、PaaS)一起,共同构成新的云计算架构和基础设施。 01 智能化时代大模型的角色 2023阿里云峰会上,张勇用不短的篇幅回顾阿里云的发展历程。 张勇提了两大断言: 在过去的数字化浪潮里,一批新型互联网公司利用数字技术,获得了发展的机会,让各行各业看到数字化的力量。之后各行各业争先恐后开始进行数字化变革,走上了产业数字化的大道。 智能化时代,所有的企业,包括阿里巴巴在内,则都处于同一个起跑线上。他认为,所有行业、所有应用、所有服务都值得基于新型人工智能技术重做一遍,在带来创造性客户体验的同时,生产范式、工作范式、生活范式也将发生变化。 基于这两大断言,张勇提出面向未来的目标——作为一家云计算和人工智能高度结合的云智能公司,阿里云未来要做到两点:让算力更普惠,让AI更普及。 几天前开放邀测的“通义千问”通用大语言模型扮演了“让AI更普及”的重要推动角色。 峰会的场子非常大,不少阿里的合作伙伴都是专程来看开始邀测的“通义千问”大模型。 数智前线获悉,该模型是去年9月,阿里发布的“通义”模型家族的新成员。此前,已亮相的模型包括通义M6、通义-AliceMind、通义-视觉模型,这些模型均是预训练模型,目标是去构建一个接近于人类智慧的智能模型,可以在之上再训练行业模型,并已应用到200多个业务场景。 阿里并未公布“通义千问”的参数规模。阿里云智能集团CTO周靖人说,虽然参数规模大代表模型的理解能力或容量等各个方面有更多的潜质,但参数并不是唯一的指标,不是说参数规模越大,模型一定就好。 “通义千问”是一个超大规模的语言模型, 能够了解人类指令,与人类进行多轮交互,同时也融入了多模态知识理解。 在ChatGPT爆火后,人们了解到大模型有几大技术分支,包括Open AI的GPT,谷歌的Bert和T5,但周靖人表示,阿里大模型一直坚持自己的技术路径。 “科技进步的一个魅力是大家有不同的尝试、不同的方向。”周靖人称,“其实我们在做模型训练、数据处理时,往往在一个细节上有很多选项,我们也是在多条路径上不断探索,才能不断去提升对整个问题的理解,才有利于我们下一步的创新和突破。” 他坦诚,ChatGPT在很多方面都处于一个领先地位,但通义千问并非终态,希望能贡献自己的创新。 数智前线观察,阿里云正在尝试打通大模型行业落地的通路。此前,大模型落地没有现成的路径。 张勇透露,接下来,阿里所有App,包括天猫、淘宝、钉钉、高德等未来都会接入通义千问。大会上,几个小视频演示了结合通义千问的未来应用,比如,通过多轮对话,让智能助手根据冰箱现有食材制定当日菜谱,或根据家人朋友信息策划生日Party和购物清单……大会当日,钉钉和天猫精灵公众号,也分别发出未来新功能Demo。 会议期间,阿里云公布与多家企业展开合作探索,首批企业有OPPO安第斯智能云、中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等。 一位阿里云人士告诉数智前线,上述企业中的一些正在通过大模型升级语音助手,毕竟原来的智能助手在语义理解、内容生成和交互上都太过机械、简单。但周靖人不想就此框定这些探索。他告诉数智前线,业务场景为大模型“留出了无限想象空间”,快速发展起来的模型,与快速演进的业务场景,有极大的碰撞空间。 一位与会的软件开发人员告诉数智前线,阿里云期望他们能够基于大模型,到行业中去开拓更多的应用。另一位与会从事商业分析软件的人士称,原来商业分析要清洗标注数据,有了大模型,这些数据预处理都不需要了,他来了解工具软件如何与大模型结合。多种大模型的可能性已经开启。 02 企业专属大模型和MaaS新范式 在此次云峰会期间,周靖人花了大量篇幅,介绍基于通义千问的“企业专属大模型”。此前,关于大模型在企业中怎么用,是近几个月业界最关注的话题。 多位企业人士告诉数智前线,传统人工智能系统,比如上一代的NLP(自然语言处理),经常达不到业务部门的要求。通过ChatGPT,大家看到了大模型的潜力,它能大幅提高产品能力,但真正应用还需要等待国内大模型起来,考虑有没有改造、灵活应用和部署的机会。 根据周靖人的介绍,企业可以在通义千问大模型基础之上,结合自己的场景、知识体系和特殊诉求,产生一个企业的专属模型。 基于业界关于大模型落地的需求,企业专属大模型从构建、部署和应用都有一定的设计。 企业对数据安全非常关注。近期,三星被曝员工在使用ChatGPT时,泄露了其芯片机密数据。专属大模型在模型训练和使用中,需要解决这一问题。为此,阿里云提供每个企业专属的、安全隔离的数据空间。 这也给行业带来了新范式。传统人工智能项目七八成的时间和成本,都花在了数据上,仅数据标注动辄要几千万甚至上亿元。而在阿里云去做专属模型的训练,企业不需要对数据做预处理,如清洗和标注。 周靖人称,无论是PPT、PDF,还是Word、手册,亦或是图片、视频,包括企业的知识图谱、已有数据库,都可授权放入专属空间,阿里云会通过多模态能力,学习、提炼知识体系,与通义千问结合在一起。 “关于数据是不是完全不需要标注,这不是绝对的。”周靖人进一步告诉数智前线,“因为定制专属大模型有多种方式。但整体上,如何把通用大模型的能力跟专属的知识结合在一起,是一个关键点。我们要提供一个更有效的产品体系。” 由于国内与海外使用习惯不同,很多大中企业都在使用私有云。他们关注大模型和私有云的结合情况。数智前线获悉,模型训练阿里云首推了公共云。“只有这样才是最有效的,因为通义千问版本每周都在迭代,而且公共云的弹性算力,也能更好支撑训练。”周靖人解释说。在模型生产完成后,将有多种部署、调用方式,可一键部署到阿里的公共云上,针对特殊行业的要求,也会使用专有云方式。...
“通义千问”带动阿里上涨,中国AI竞赛升温
通义千问

“通义千问”带动阿里上涨,中国AI竞赛升温

阿里巴巴目前正在考虑分拆业务,但该公司可能会选择保持对人工智能业务的控制权。 周二(4月11日),中国电商巨头阿里巴巴(BABA)宣布推出备受期待的ChatGPT式生成式人工智能系统,名为“通义千问”,借此加入人工智能竞争行列。 阿里巴巴称,“通义千问”具备中英文语言能力,首先将添加到“钉钉”办公应用和天猫精灵智能音箱系统中。阿里巴巴计划在不久的将来把“通义千问”整合到公司所有应用程序中。 阿里巴巴CEO张勇说:“当下,云计算助力实现数字化水平不断提升,我们也迎来了新一轮通用AI智能的浪潮,如今我们正站在一个非常关键的数字化时代节点。站在新的历史节点上,以阿里云为代表的云大厂正在加紧布局,从 IaaS、PaaS、MaaS、生态、服务等全方位找到发力点。” 阿里巴巴港股(9988.HK)周二收涨1.6%,美股在盘前交易中上涨0.3%。 阿里巴巴目前正在考虑分拆业务,但该公司可能会选择保持对人工智能业务的控制权。阿里巴巴的云计算业务由张勇亲自负责,该业务提供阿里巴巴的人工智能产品。中国正在密切关注这项技术,并提示要慎用ChatGPT这类聊天机器人。 阿里巴巴正在加紧追赶西方竞争对手和国内科技公司。百度(BIDU)在3月份推出了自己的人工智能聊天机器人。周一(4月10日),商汤科技(0020.HK)在技术交流日活动上展示了该公司一系列人工智能应用程序,包括聊天机器人和图像生成器等。 周二,百度港股(9888.HK)收盘跌超5%,商汤科技收跌0.9%。 文 | 亚当·克拉克(Adam Clark) 编辑 | 郭力群 版权声明: 《巴伦周刊》(barronschina)原创文章,未经许可,不得转载。英文版见2023年4月11日报道“Alibaba Stock Rises on Launch of ChatGPT Rival. China’s AI Race Is Heating Up.”。 (本文内容仅供参考,投资建议不代表《巴伦周刊》倾向;市场有风险,投资须谨慎。)
阿里云未来将开放通义千问 专家指出大模型或将改变油气行业数字化转型路径
通义千问

阿里云未来将开放通义千问 专家指出大模型或将改变油气行业数字化转型路径

4月11日,2023年阿里云峰会上,阿里云宣布未来将开放“通义千问”大模型,为每家企业打造专属大模型。在随后的“石油化工云上创新论坛”上,多名专家学者热议人工智能、大模型对当下油气行业的重要影响与启示。作为数据密集型产业,油气行业在算力、算法的加持下,有望实现全链路提质增效,并形成一条全新的数字化转型之路。 中国工程院院士、中国石油大学教授、油气资源与探测国家重点实验室主任李根生做开场致辞。他表示,国内外各大石油公司都将人工智能列为重要的发展战略,以数字技术降低油气勘探开发成本、提高效率、实现安全经济、绿色、环保、智能的作业,已是行业共识。 “油气行业的人工智能发展需要形成产学研协同创新机制,需要业务场景需求和数据资源共享、人力资源共享和模型算法共享的共同推进。”李根生表示。 作为大会主办方,阿里云制造&汽车行业总经理李强介绍,在服务油气行业中,阿里云总结出了三大趋势:开放合作、绿色低碳和创新驱动。在创新层面,李强特别指出,在油气行业的地震解释分析、岩芯数字化、管网复杂调度、化工新材料研发四个场景中,大模型或能发挥其重要作用。 油气勘探环节数据量巨大。中国石油东方物探目前是国内最大的地球物理服务公司,东方物探高性能计算中心副主任曹士炳分享了“给地球做CT”时面临的几个“计算“挑战:一是从过去的重磁电勘探到地震勘探,再到高精度地震勘探,对算力需求指数级增加;二是地震勘探数据如何能实现高效安全的传输和存储;三是科学计算如何与智能计算协同融合。 中国石油大学人工智能学院创院院长肖立志认为,与勘探阶段相比,开发阶段的油藏数值模拟同样对算力有非常高的要求。“算力不断发展,需要有相应的算法、应用场景的协同,这方面的需求量应该是长期稳定的,我相信阿里云在这方面应该有巨大的发展空间。” 肖立志同时指出,大模型的出现、AIGC(生成式AI)的兴起对油气行业的数字化转型路径可能会带来根本性改变。过去,数字化转型的前提是通过泛在感知、数据采集等方式,先构建出区别于物理世界的数字世界。但AIGC通过文献学习和语义理解,基于强大的算力快速完成认知迭代,相信未来在油气勘探开发领域会有广泛应用。 中国石油勘探开发研究院企业技术专家时付更认为,大模型在未来将是一项颠覆性技术,在油气行业的类比分析、开发方案的编制等方面有广泛的应用场景。 会上,国家管网集团市场部副总经理杨安、石化盈科副总裁李涛、壳牌(中国)信息数字化总经理谢黎莎也分别介绍了与阿里云在管网、零售、国际石油企业数字化转型方面的深度合作。 阿里云制造&汽车行业总经理李强表示,基于阿里云在云计算和人工智能领域的深耕,相信能为石油石化企业加快云上创新贡献力量。 “转载请注明出处” 举报/反馈