商汤大模型体系“日日新”带来什么惊喜?和ChatGPT之类比“会有一点差距,但可以很快追上。”网红聂小雨穿紧身裤、内衣外露,深夜逛美国超市,粉丝:注意安全
ChatGPT

商汤大模型体系“日日新”带来什么惊喜?和ChatGPT之类比“会有一点差距,但可以很快追上。”网红聂小雨穿紧身裤、内衣外露,深夜逛美国超市,粉丝:注意安全

图说:语言大模型“商量”展示 新民晚报记者 郜阳 摄 在AGI(通用人工智能)火得发烫的这个春天,商汤科技没有缺席。 在上海临港的人工智能计算中心(AIDC),“日日新”大模型体系,正式问世。 “日日新”的名字来源于《礼记·大学》中的“苟日新,日日新,又日新”,体现大模型日新月异,不断进化之意。这一大模型体系可提供自然语言生成、内容生成、自动化数据标注、自定义模型训练等多种能力,同时结合决策智能大模型,助力实现AGI。 10日的技术交流日上,商汤不仅展示了“日日新”大模型体系下的语言大模型“商量”,还展示了文生图生成模型“秒画”、AI数字人视频生成平台“如影”、3D背景建筑生成平台“琼宇”和3D物体生成平台“格物”。 在商汤科技董事长兼CEO徐立看来,这是一次大模型的“超市开张”,提供了完整的产业链。 会处理问题 也会学习新知 “帮我写一句语言大模型的广告标语,这个语言大模型的名字叫‘商量’。” “与商量携手,让语言成为你的优势,开启无限可能。”对最新研发的语言大模型“商量”的表现,人们已然见怪不怪。 难度升级,程序员加载了专利法的PDF文件,提出了“专利法申请周期,今年的规定有没有新的变化?”的疑问,“迟疑”片刻,“商量”结合学习到的内容和更新的知识,给出了“最快可能在2年之内获得授权”的回答。 “这是拥有1800亿级参数的中文大语言模型,在互动式引导过程中精进判断力与创作智能,在多轮对话、问诊与编程等垂域表现突出,并全方位覆盖各种应用。”徐立介绍,“另外,‘商量’还能做到知识自动及时更新。” “商量”的问诊本领更令人惊叹——“最近加班很辛苦,眼睛都黄了”,面对这一需求,“商量”没有直接给出答案,而是询问“还有其他不适的症状吗?”当人类告诉它,“手掌也有点黄,并持续一个多月后”,它谨慎地分析道:“可能是黄疸”“建议尽快预约肝功能检查”“提醒您注意休息和保持健康的生活方式”。 “‘商量’不断演进的语言能力和推演能力,将为与顶尖医院合作搭建未来医疗服务场景提供可能。与新华医院合作开发的随访,与嘉会医院搭建的互联网问诊等都已落地。”徐立说。 对了,“商量”还集成了“AI代码助手”功能。在公司内部实测中,它将代码编写效率提高了62%,在测试集上的一遍通过率达40.2%。“新的软件开发范式已经产生。在新的二八定律下,未来80%的代码将由AI生成,实现‘AI for AI’。”徐立感叹。 据悉,“日日新”大模型体系已面向合作伙伴开展内测,未来主要面向B端业务。 “有天赋的运动员” 在商汤科技联合创始人、首席科学家王晓刚看来,大模型是个非常有天赋的运动员,在教练——人的调教下,不需要一招一式来示范,只需要“点拨”一番,这个天赋异禀的运动员就能完成新的动作。 “日日新”体系下文生图创作平台“秒画”的展示印证了他的看法。面对“生成有80年代港风特点的女生”特点的图片需求,“秒画”的第一次创作只可谓差强人意。没关系,那就给几张港风范满满的图片,没过一会,“秒画”又创作了新的作品。这一次,台下掌声雷动。 同样惊艳的还有AI数字人视频生成平台“如影”——仅需一段5分钟的真人视频素材,就可以生成出声音及动作自然、口型准确、多语种精通的数字人分身。 相比之下,过去的一些模型则是领域内的“专属模型”,它是一个刻苦的运动员,天赋没那么高,得“耐心地教”:一种教法是人工标注大量的数据,另一种则是高天赋的运动员在掌握新动作后,自动产生了很多数据,再“喂”给专属模型去学习。 “通用人工智能大模型带来了人工智能范式的一个变化。”王晓刚认为,它以极低的成本、非常高效的方式不断解决各个领域里新出现的各种开放性任务,并大幅提升了研发效率和人工智能覆盖的范围。 要知道,此前ChatGPT和GPT-4 能表现出高超的图片和语言理解能力,就是因为“涌现现象”——大模型的数规模达到一定程度时,其解决问题的能力就会发生突变——打个比分来说就是“大力出奇迹”,或者说就是“开窍了”。“一个强大的模型,能通过强化学习和人类反馈不断解锁新的能力,从而更高效地解决海量的开放式任务,实现从‘数据飞轮’到‘智慧飞轮’的演进。”王晓刚解释,这最终会达到“人机共智”,就有了延续的“涌现现象”。 算力支撑 提供模型即服务 一个回避不了的问题摆在了商汤科技联合创始人、大装置事业群副总裁陈宇恒面前:在大模型领域,国内和国外差了多少? “会有一点差距,但这段差距是可以很快追上的。”陈宇恒显得很有信心,“大模型技术依托的几大要素即为大算力、大数据和模型设计。” “在AI大模型时代,数据、算法和算力这三要素在经历新的演变,大模型参数量将以指数级速率提升,而数据量随着多模态的引入也将大规模增长,因此必然会导致对算力需求的剧增。”徐立补充道。 当前业界训练大模型,对大算力的需求非常旺盛,而真正好用的基础设施却十分稀缺。在技术交流日的举办地:临港AIDC,就是历时5年建成的AI大装置,共有27000块GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。而基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。 事实上,就在上个月,商汤发布了开源社区多模态多任务通用大模型“书生2.5”,其拥有30亿参数,可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。 记者了解到,基于AI大装置和“日日新”大模型体系,商汤将面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务。 “基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升。”陈宇恒介绍,“而模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。”此外,商汤也向行业开发人员开放大量预训练模型及AI开发工具链,全面赋能开发效率。 这两年,AI的热点很多,先有元宇宙,再来大模型。对此,陈宇恒表示,元宇宙是人工智能大模型极佳的应用场景,也是多种技术的结合体。其中一系列大模型驱动的技术能力,可以很好解决元宇宙中内容制作成本过高的痛点。 “AI企业要发挥自己的优势,避免盲目跟风,持续地积累和沉淀,但要在机会来临的时候,快速敏锐地抓住。”陈宇恒说。 新民晚报记者 郜阳
【广发通信】商汤版ChatGPT大模型“日日新”亮相
ChatGPT

【广发通信】商汤版ChatGPT大模型“日日新”亮相

  【广发通信】商汤版ChatGPT大模型“日日新”亮相,推荐商汤AI定制芯片方案商【翱捷科技】 【英维克】22年报超预期,继续推荐超算中心液冷龙头 【翱捷科技】国内第一梯队的基带芯片设计公司,A股稀缺,产品线涵盖4G/5G IoT
刚发布!阿里版ChatGPT:通义千问
ChatGPT

刚发布!阿里版ChatGPT:通义千问

来源:量子位 阿里正式加入ChatGPT战局! 就在刚刚,阿里版类ChatGPT突然官宣正式对外开放企业邀测。 它叫通义千问,由达摩院开发。 嗯,是大模型版十万个为什么那个味儿了。 事实上,早在这个月初,就传出过不少阿里要推出类ChatGPT的消息,不过普遍预期在11号左右。 而前几天率先流出的天猫精灵“鸟鸟分鸟”脱口秀版GPT,就是基于大模型的“压缩版”,已经以其惊艳表现把网友的胃口吊了起来,让众人将目光投向阿里。 如今“正菜”提前上桌,自然一点即着,引爆舆论关注。 所以,这个阿里版ChatGPT“通义千问”,究竟实力几何? 恰好量子位拿到了第一批邀测资格,省流结论:中文大模型真正的竞争开始了。 咱们实测见真章。 调戏阿里版ChatGPT实录 先来看看通义千问的主要功能。 作为一个大语言模型,它的能力主要集中在文本生成上,即也能像ChatGPT一样“问啥答啥”: 这里我们试一下官方给的撰写短文,看起来连语文老师常用的“总分总”也能理解: △又一个中文写作业神器(doge) 除了对话外,它还具备一个“百宝袋”功能,里面相当于一个工具箱,能快速生成各种指定类型的文案: 话不多说,先从语言能力、上下文理解能力、代码能力和数学能力四个方向,来测测模型的对话能力。 一、对话能力 语言能力 要说国内大模型,首先要看的还得是中文。 先来个最基础的:“能穿多少穿多少”是什么意思? 不错,解释得比较清楚,还顺便聊了一下自己对这句话的看法: 续写类的创意写作,不但能模仿语气,甚至还能创造悬疑,有点厉害哟~ 接下来就轮到新一代AI benchmark弱智吧问题了:怎么才能把梦里的钱取到银行卡里? “在梦里取钱是一种幻觉或想象”,谢谢你清醒侠。 还有更扎心的……“如果您经常做梦梦到钱,建议您睡前回顾一下自己的财务状况,看看有什么不足之处” 虽然阿里的朋友称,通义千问主要是中文不错,但我们叛逆一点,看看这个中文大语言模型的其他语言水平怎么样。 先不走寻常路,试试通义千问的日语能力,给花泽香菜写一封情书。 看中文机翻似乎还不错,这就把它寄给香菜,应该没问题吧? 再来试试英语。刚好前段时间有网友PK了一下Bard和GPT-4的Rap,我们也来看看通义千问的说唱能力。 这top,这stop,还给押上了!就是不知道姆爷认不认可。 试试加点难度,中英夹杂的谐音梗? 这个时候,通义千问的回答就显得有点严肃了。 当我们给出答案的时候,虽然通义千问看出了这是个笑话,但它并不觉得好笑,还很严肃地指正我们:这并不意味着松下惧怕索尼。 不过我们发现,ChatGPT同样一本正经……这年头的AI都这么正义么…… 好,下一个试试它的上下文理解能力。 上下文理解能力 这部分说白了就是多轮对话能力,考查通义千问能不能准确提取上文的信息,用于下轮问题的回答。 来听题:山东一县一酒是真的吗? 模糊掉山东试试?让它列举“这个省”几个经典的白酒牌子: 不错。再试着从最新的回答中追问一下: 等等,“据史书记载”不会是编的资料吧?追问×2: 有意思的是,我们确实在孔府家酒的官网找到了资料来源: 代码能力...
重磅!阿里版ChatGPT 通义千问突然上线邀测!正式加入AI战局!
ChatGPT

重磅!阿里版ChatGPT 通义千问突然上线邀测!正式加入AI战局!

今天下午,阿里版ChatGPT突然官宣: “通义千问”正式对外开放企业邀测! 至此,阿里正式加入AI战局!,中国入局的大佬是越来越多了。AI赛道也是越来越热闹了! 中文大模型真正的竞争开始了! 这次开放的 “通义千问”主要定向邀请企业用户进行体验测试,大家可自行前往官网申请 如还不知道官网地址的,微信公众号后台回复【阿里】可获取直达链接 关于“通义千问” — 关于通义千问的技术细节,阿里达摩院官方没有透露详细信息。但根据网络资料显示,该模型来自阿里巴巴达摩院,2019年便已启动研发,训练截止到2023年2月,训练资料包括:大量语言和文本数据、中英日法西班牙语多语种文本数据。 其实早在2021年,阿里便先后发布了国内首个超百亿参数多模态大模型M6,以及被称为“中文版GPT-3”的语言大模型PLUG。 M6在多次迭代之后,实现了十万亿级别的参数规模,并且M6和支付宝、淘宝的业务相结合,在国内实现了首个商业化落地。 这次发布的通义千问,相比现在的全球标杆ChatGPT(GPT-4)还有不少进步空间,但是,这也与百度的文心一言一样,代表了中国大模型的顶尖水平。阿里方面也透露,根据内测反馈,通义千问还在飞速迭代中。 “通义千问”的主要功能 — 从具体功能上来说,通义千问最核心能力还是跟ChatGPT一样,集中在文本生成上,简单点说就是个问答AI机器人,你问啥它都能回答,文字工作者又是担心“被失业”的一天啊! 除了基本的问答对话,它还多了一个 “百宝袋”功能,相当于是一个工具箱,能帮助用户快速生成各种指定类型的文案 调戏“通义千问”实录 — 从语言能力上来看,通义千问对中文的理解还是不错的,创意类写作还是可以达到及格水平 不过光调戏通义千问不过瘾,得有对比才能分出胜负,下来来场大模型之间的机器人大战,看看能不能分出个胜负吧~ 大模型PK战 — 文心一言VS通义千问VS ChatGPT 同样都是大语言模型,但还是各有各的风格。 ① 来~先上一个中文十级大考! “李四壮差点上上上上海的车”,这句话是什么意思? 阿里通义千问的回答↓ 百度文心一言的回答↓ ChatGPT的回答↓ 第一回合~还是中文大模型胜~ 看来,论对刁钻中文的理解能力,“洋人”ChatGPT “还是比不上“土生土长的”通义千问和文心一言,至少它两都能理解并解释正确。 ② 再来看看她们的网感~ 来个脑筋急转弯测试一下 关于松下和索尼的问题,到底谁强?~ 对于网友们的调戏,通义千问的回答还是全体都过于正式了些~ 给出答案后,虽然它看出了这是个笑话,但它还是一!板!一!眼!甚至很严肃地指正:这这并不意味着松下惧怕索尼。 来~看看ChatGPT的表现~↓ 但是,ChatGPT甚至没有看出这是一个笑话~! ChatGPT输的太惨了,给它来道送分题吧↓~ ③...