腾讯混元助手,任重道远
腾讯混元

腾讯混元助手,任重道远

腾讯发布了ChatGPT产品:《腾讯混元助手》,第一时间和其他国内ChatGPT产品横向对比了下 —— 我选择8个问题来对比下,可以直观感受区别,各位读友可以来甄别下: 一、小学6年级数学题 题目:有一个10千克的西瓜,含水量非常丰富,达到了99%,放在太阳底下晒了一段时间后,含水量变成98%了,那么,这个西瓜现在多重? 以下是各家的回答: 只有讯飞星火的表现尚可,另外三位真的是差生文具多,没有理解题目。 二、关于哲学的理解 题目:克拉底鲁和赫拉克利特的理论有哪些核心矛盾? 以下是各家的回答: 混元、文心和通义三兄弟全部写了差异,但是没有交代两人的背景,而讯飞只交代了背景,没有详细对比两人的差异,四兄弟结合起来才是完整的。 三、费米问题 题目:提一个费米问题,如何估算深圳有多少家奶茶店?请写出计算思路 以下是各家的回答: 费米问题的常见策略应该是:逐步拆解成最小指标来计算。这题其实可以拆解成两种类型: ①抽样调查多大范围内有一家奶茶店,然后深圳的面积,这样计算一个大概的范围; ②抽样调查没几个人中喝奶茶的数量,根据常驻人口来能算大概的范围。 四、历史家庭题 题目:诸葛亮的夫人是谁?他有几个孩子? 以下是各家的回答: 看到这四兄弟的回答,我凌乱了,到底是几个?混元的回答最离谱(重名的孩子也算,鲁迅体?) 五、网络用语题 题目:“尊嘟假嘟”是啥意思?是双胞胎么? 以下是各家的回答: 混元,你在干啥?现在是2023年啦…… 六、产品架构题 题目:您是教育行业产品专家,能否给K12行业搭建一个报课的SaaS平台,分为报课端和平台管理端,请输出一份结构化的产品架构图 以下是各家的回答: 做K12的产品经理可以看看,反正混元表现怪怪的。 七、给孩子的一封信 题目:能否给6岁孩子写一封关于爱情的书信 我是爸爸 以下是各家的回答: 哎呀,先比较下,我喜欢混元的回答,以孩子的口吻在讲述一个事情。其他三兄弟都是说教式的。 八、小红书标题 题目:能否以小红书的标题调性,取几个关于勒布朗詹姆斯的标题,加emoji表情,以及写出适合阅读的人群和带货商品 以下是各家的回答: 各位,可以让ChatGPT去试下这8道题,你可以看看国内外的差距。只能说任重而道远哇。 期待混元接下来的迭代表现。
Bonus独家 | 揭秘腾讯大模型新项目组「混元助手」人才地图
腾讯混元

Bonus独家 | 揭秘腾讯大模型新项目组「混元助手」人才地图

‍‍ 若要用一个词来形容2023年2月的国内大厂,那就是“不甘落后”。和2月公布“文心一言”的百度相比,腾讯相对低调,但也备受万众瞩目的压力。 职场Bonus独家获悉,腾讯针对类ChatGPT对话式产品已成立「混元助手(HunyuanAide)」项目组,该项目组Owner为张正友,PM分别为俞栋、王迪、刘田,目前该项目有至少7位组长、7位Sponsor。上述几乎每一位在腾讯都是重量级人物(完整名单见文末)。 职场Bonus从多处信源得知:该项目组将联合腾讯内部多方团队构建大参数语言模型,目标是“通过性能稳定的强化学习算法训练,完善腾讯智能助手工具,打造腾讯智能大助手,并能成为国内的业界标杆”。腾讯的底气之一,是手中“多样、高质的真实数据”;另一层是物理硬件问题的解决(后文会提到);还有一层,或许是多年来积累的人工智能技术人才。 17级大牛带队,3位PM顶梁,跨事业群精英集结 ╱ 01 低调布局争取来的“下注”时间╱ 02 大厂抢人,选对专业的应届生狂喜╱ 03 17级大牛带队,3位PM顶梁, 跨事业群精英集结 「混元助手(HunyuanAide)」项目组的一号位张正友,是腾讯史上最高专业职级拥有者。早年他曾就职于微软研究院,带领视觉团队从事大量学术研究,在Windows、Office、Xbox、Kinect、Skype for Business、Office Lens等诸多微软产品里都有其团队的贡献。张正友于2018年加入腾讯,带领创建了腾讯机器人实验室Robotics X,致力推进人机协作的下一代机器人研究。2021年1月8日,腾讯宣布张正友成为腾讯首位17级研究员/杰出科学家。 “正友是位随和的大牛,”与其短暂共事过的人告诉职场Bonus,“但他擅长的方向偏计算机视觉、立体视觉、3D重建,而类ChatGPT工具要突破的技术领域应该在NLP自然语言处理。虽然都是人机协作的必备课题,但两类领域略有区别。”据此预测,该“智能大助手”产品未来极有可能出现类“DALL·E [1] ”等结合图像、视觉能力的功能和应用场景。 学术背景方面,张正友于1985年本科毕业于浙江大学信息与电子工程系,1987年在南锡第一大学(现洛林大学)获计算机科学硕士学位,1990 年获巴黎第十一大学计算机科学博士学位。在国际顶尖会议和杂志上,张正友发表论文250余篇,论文引用次数51000多次,有超200项专利。其于1999年论文提出的摄像机标定法“张氏标定法”在全世界被普遍采用,获2013 IEEE Helmholtz时间考验奖。  [1] DALL·E:OpenAI推出的文本转图像模型 3位PM的能力画像,分别侧重于算法、工程和商业化。职场Bonus获悉,3人当中,余栋或会主要负责强化学习和多轮对话,王迪主要负责大模型、预训练。 俞栋是将深度学习成功应用在语音识别领域的开创者之一,他提出的理论与模型已经广泛用于业界的语音识别和处理系统中。其主要研究的领域包括自动语音识别、语音处理和自然语言处理等,发明了100多项专利,曾获得IEEE、NAACL的多个论文奖项,谷歌学术引用量5余万次。 王迪作为2008年7月校招即加入腾讯的15年老员工,经历过重组、换团队的动荡。我们在其2016年为数不多的一次采访中得知,当时他与团队正在给公司内部其他BG的业务产品提供“搜索引擎检索系统”相关模块的开发。目前,王迪已是腾讯TEG-AI平台部的助理总经理。 从组长的构成来看,「混元助手」项目的确做到了凝聚腾讯内部多个团队的能力。 其中Ying Shan(Dr. Shan)是腾讯PCG-ARC Lab(应用研究中心实验室)的杰出科学家和主任,在在线广告、计算机视觉、深度学习、文本挖掘和大数据分析领域拥有近22年的经验。和张正友一样,在加入腾讯之前他也在微软研究院(微软是AI华人黄埔军校实锤),并在Bing Ads担任首席科学家经理(Manager role),在ICCV、CVPR、ECCV、SIGGRAPH、KDD、PAMI、IJCV等顶级会议和期刊发表论文30余篇,拥有30项美国/国际专利。  项目的赞助支持人员更是堪称腾讯豪华阵容。值得注意的是,除了能看到TEG、PCG、CSIG力量的参与,微信和互娱的也出现在名单人员的业务覆盖面内。 低调布局争取来的“下注”时间 整份名单透露出的气息,可以用两个词来形容:押宝。 我们能在贯穿腾讯2022年的“降本增效”主题中找到鲜明的对比:上文提到的PCG(平台与内容事业群)、CSIG(云与智慧产业事业群)均在去年经历了公司范围内最大力度的裁员;AI Lab所挂靠的TEG(技术工程事业群)也曾被部分内部员工吐槽“穷”,被认为科研自由度不如百度。据晚点LatePost,去年腾讯除了砍掉十余款长期亏损的低战略价值产品、批评整治内部贪腐、调整多部门业务策略与考核重点,还通过转型深度自研来加速技术降本。 「混元助手」并不是混元AI大模型的第一次亮相。2022年6月,腾讯多模态AI大模型先被应用在了广告投放这一toB业务领域进行“降本增效”:先以腾讯混元AI大模型助力系统理解广告内容,其次以精排大模型提升广告和用户的匹配准确率,模型训练用的是腾讯机器学习平台太极。相比以前的小模型算法,腾讯广告精排大模型当时累计给广告主带来15%的GMV提升。 虽然对大模型早有布局,但如今,腾讯之所以能短时间内如此果断地往“大模型”上加注押宝,多是由于ChatGPT在用户增长和商业上摧枯拉朽的表现。用过的人或许知道,ChatGPT的交互界面极为简单,产品形态也相当原始。但上线5天后,ChatGPT注册用户便超过100万,2个多月后月活破亿,迅速超过了TikTok用9个月破亿的历史纪录。 在「混元助手」之前,腾讯最接近ChatGPT的项目或是智能创作助手文涌(Effidit)。「文涌」出自腾讯 AI Lab,部分功能的实现使用「混元」系列 AI 大模型作为底层预训练模型,具有智能纠错、文本补全、文本润色等功能。 “混元大模型本就是国内自然语言类中的最强者。”内部知情人士对腾讯混元助手项目的未来信心满满。去年4月29日,腾讯混元AI大模型在CLUE(中文语言理解评测集合)分类榜中取得第一并刷新该榜单历史纪录,分数突破80.888分,有相关分析文章认为,该模型在自然语言处理上的实力接近人类语言理解能力。...
AI音乐创作:智能音乐生成器的未来前景
腾讯混元

AI音乐创作:智能音乐生成器的未来前景

人工智能(AI)音乐生成器是通过计算机程序创作的音乐,如Amper Music、AIVA、Ecrett Music、Soundraw、Boomy、OpenAI——MuseNet、Chrome’s Song Maker、MuseNet MIDI Generator 和 Melodrive。它们可以通过预先录制的样本或机器学习算法评估现有音乐并制作新作品。使用这些工具,用户不必精通音乐理论或作曲,便可轻松创作音乐。每个工具都有其特色,如易于使用、多样化音乐风格、免版税歌曲生成等。