文心一言
投入使用!文心一言全面嵌入百度内部工作平台,可用AI写文案、代码等
随着ChatGPT的快速进化吸引了全球网友的眼球,国内厂商也纷纷推出了相似的产品,其中百度推出的“文心一言”已经正式开始的相关的测试。 据之前的介绍,文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品。 百度在人工智能领域拥有产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力,目前文心一言在做上线前的测试调试工作。 据百度介绍,文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。 百度方面表示,ChatGPT相关技术,百度都有。百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言,位于模型层。 就在今日,据科创版日报的消息,文心一言在百度内部全面应用在智能工作平台“如流”,已经为全体员工开通使用。 据报道,文心一言可根据员工输入的提示词生成大纲、招聘JD、新闻稿、宣传文案、邮件、调研报告等文案,也支持根据输入的文字生成匹配的图片,还提供代码推荐功能,帮助工程师在编写代码的时候实时推荐和生成代码。 但据科创版日报的消息,文心一言相关应用还仅限于百度内部工作场景。 由于“文心一言”是国内第一个发布的类ChatGPT产品,自然引起了不少网友的关注,有测试的资格小编自然是第一时间对“文心一言”进行了体验。 可以看到,在一些热词方面,“文心一言”有着不错的回答,结果也较为准确,并且经过多次的尝试后,“文心一言”也没有出现语言类AI常出现的“胡言乱语”的问题。 随后小编对“文心一言”进入了更加深入的测试,可以看到“文心一言”的模型训练不足的问题就显现出来,小编提问的是目前最新的机型,但是在其模型中只能搜索到骁龙888,并且相关传感器信息也有些滞后,所以输出的内容出现了不少的错误。 就在今日,小编对于之前出现错误比较多的问题进行再次提问,可以发现现在其对于问题的处理较为谨慎,仅提出一些观点和想法,不再给出具体的内容。 由于在上文报道中提及,“文心一言”已经可以进行辅助编程,小编就提出了一个较为基础的编程问题。 可以看到,整体语句的写法是准确的,并且还对相关问题进行了解释,说明“文心一言”目前来看已经具备一些通过编程处理问题的能力,至于后续百度是否会大面积应用以及效果如何还无法得知,感兴趣的消费者可以保持关注。 近期文章精选: 2499 元起,华为nova11系列开箱体验,首发XD Portrait 人像引擎 下周多场发布会来袭,华为、小米和vivo你更期待哪一场? 15英寸MacBook Air领衔,多款苹果Mac新品曝光 小米13 Ultra搭载徕卡一英寸可变光圈,还有平板、手环新细节 iPhone 15 Pro或不搭载固态按键设计,苹果自研5G基带进程再曝 小米13 Ultra下周见,徕卡加持、影像能力再升级 商务合作 kejimeixue@163.com
Bard
ChatGPT与Bard的PK,倚天屠龙争霸赛始末
近期,ChatGPT爆火出圈,引起各行各业广泛关注。 Google也在顺势而为,推出竞品Bard,却在昨天因回答失误导致市值大跌。 ChatGPT为何如此备受推崇,Bard真的就此败北了吗? 下面我们来看看领域资深专家、达观数据副总裁、《知识图谱:认知智能理论与实战》一书的作者王文广老师怎么说吧~~ 01 ChatGPT爆火出圈始末 “虎越雄关踪影杳,兔临春境万家新。” 岁末年初,人工智能江湖掀起了江湖上的一场“血雨腥风”。 这场风雨的起因是屠龙刀——ChatGPT。 可谓屠龙刀ChatGPT一现江湖,即引起所有江湖人士的关注。 不仅圈内人士津津乐道,纷纷赞叹自然语言处理(Natural Language Processing, NLP)大模型的魔力,探讨通用人工智能(Artificial general intelligence,AGI)的奇点来临,吃瓜群众更是纷至沓来,实在算是爆火出圈,拦都拦不住的那种: 《时代》记者把 ChatGPT 当人一样来采访[1],若非ChatGPT自己一直强调它是人工智能,是大语言模型,人们可能会认为与记者对话的是该领域的专家。ChatGPT通过了沃顿商学院的工商管理硕士课程的期末考试并获得B档成绩,展现出了非凡的能力[2]。ChatGPT已经成为了许多科学论文或出版书籍的共同作者,比如ChatGPT名列《Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models》这篇文章的12个作者中的第3位,Gautier Marti则在其出版的书籍《From Data to Trade: A Machine Learning Approach to Quantitative Trading》中将ChatGPT列为共同作者。由ChatGPT 的前身Codex大语言模型提供支撑的GitHub CoPilot为数千万的程序员提供效率工具。北密歇根大学哲学教授安东尼·奥曼 (Antony...
文心一言
这回是官方的了!正版文心一言上架App Store
随着ChatGPT的快速进化吸引了全球网友的眼球,国内厂商也纷纷推出了相似的产品,其中百度推出的“文心一言”已经正式开始的相关的测试。但在此前,百度官方将“文心一言”盗版 App公开处刑,并表示已向北京市海淀区人民法院对苹果公司及相关开发者团队发起诉讼。据百度官方称,目前文心一言没有任何官方App!在百度官宣前,凡是在App Store和各种应用商店看到的“文心一言”App都是假的!凡是“文心一言”收费下载、付费会员都是骗子!凡是向用户售卖“文心一言内测激活码”的都是骗子!凡是声称有“文心一言源代码”的都是骗子!也就是说,百度“文心一言”现在没有任何App,而且没有任何内测码的说法。在当时小编在看到相关消息后,打开了App Store进行了验证,可以看到仍然有被百度官方认证为假的App可以下载。随后,百度聊天机器人“文心一言”正式推出了内测专用独立App,但仅提供安卓版。小编也是在第一时间进行了下载体验,可以看到文心一言App内测版界面非常简洁,用户可以通过键盘打字输入问题,也可以通过语音方式输入问题,并且文心一言也可以通过语音进行回答。此外,点击左下角“有趣的咒语都在这里”按键,就会给出一些提问建议。点击左上角的按键,可以选择不同的智能助理,目前提供“老万”和“小话”两个助理。会提供历史对话,也可以开启新对话,不过小编需要提醒各位体验的小伙伴的是App端的历史对话记录跟网页端的不同步。而就在今日,百度大语言模型文心一言App现已上架苹果App Store,用户可免费下载安装。产品介绍显示,“文心一言”作为百度全新一代知识增强大语言模型,采用一对一的对话式聊天场景,能够与人对话互动,回答问题,协助创作,同时在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等多个应用场景中“高效便捷地帮助人们获取信息、知识和灵感”。给不太了解的小伙伴介绍一下“文心一言”,文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品。百度在人工智能领域拥有产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力,目前文心一言在做上线前的冲刺准备工作。据百度介绍,文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。百度方面表示,ChatGPT相关技术,百度都有。百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言,位于模型层。由于“文心一言”是国内第一个发布的类ChatGPT产品,自然引起了不少网友的关注,而新出现的App也会使得其训练量有不小的提升,感兴趣的小伙伴可以保持关注。 推荐阅读 根本用不坏?报告称OLED屏幕理论寿命100年! 多款平板新品即将到来,小米、红魔、Redmi等都有 醒悟了?消息称小米印度公司将进行业务重组,员工降至近1000人 5.5G要来了?华为将于明年发布端到端商用产品 618也没能让手机市场回暖?下半年大量新机来势汹汹 苹果越贵越好卖?iPhone15 Pro或成主打产品
Bard
谷歌正式推Bard挑战ChatGPT 语言模型落地竞争进入白热化
雷递网 乐天 2月7日 在竞争对手OpenAI推出的ChatGPT大获成功的推动下,谷歌正急于加入对对话式AI的突然狂热。 谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)今日在博客文章中披露,人工智能是谷歌今天正在研究的最深刻的技术。 无论是帮助医生及早发现疾病,还是让人们能够以自己的语言获取信息,人工智能都可以帮助人们、企业和社区释放他们的潜力。AI开辟了新的机会,可以显著改善数十亿人的生活。 “这就是我们六年前围绕 AI 重新定位公司的原因——以及为什么我们将其视为实现我们使命的最重要方式:组织世界信息并使人人都可以访问和使用它。” “从那时起,我们继续全面投资AI,Google AI和DeepMind正在推动最先进的技术发展。 如今,最大的人工智能计算规模每六个月翻一番,远远超过摩尔定律。 与此同时,先进的生成式 AI 和大型语言模型正在激发全世界人们的想象力。 ” 桑达尔·皮查伊说,在谷歌将深入研究和突破转化为真正帮助人们的产品时,致力于这些技术是一个非常激动人心的时刻。 这就是我们使用大型语言模型的旅程。 两年前,谷歌推出了由我们的对话应用程序语言模型(简称 LaMDA)提供支持的下一代语言和对话功能。 “我们一直在研究一项由LaMDA 提供支持的实验性对话式AI服务,我们称之为Bard。 今天,我们又向前迈进了一步,将其开放给受信任的测试人员,然后在未来几周内将其更广泛地提供给公众。” Bard寻求将世界知识的广度与我们大型语言模型的力量、智慧和创造力相结合。Bard利用来自网络的信息来提供新鲜、高质量的回复。 Bard可以成为创造力的出口,也可以成为激发好奇心的发射台,帮助向9岁的孩子解释NASA的詹姆斯·韦伯太空望远镜的新发现,或者了解更多关于现在足球界最佳前锋的信息,然后进行训练培养用户的技能。 桑达尔·皮查伊指出,谷歌在使用AI为数十亿人改进搜索方面有着悠久的历史。 BERT是谷歌最早的 Transformer 模型之一,它在理解人类语言的复杂性方面具有革命性意义。两年前,谷歌推出了 MUM,它的功能是BERT的1000 倍,对信息的理解更上一层楼,支持多种语言,可以从视频中挑选出关键时刻,并以更多语言提供关键信息,包括危机支持。 “现在,我们最新的人工智能技术——如 LaMDA、PaLM、Imagen 和 MusicLM——正在以此为基础,创造全新的方式来处理信息,从语言和图像到视频和音频。 我们正在努力将这些最新的AI进步引入我们的产品,首先是搜索。” 最令人兴奋的机会之一是人工智能如何加深我们对信息的理解并更有效地将其转化为有用的知识——使人们更容易找到他们正在寻找的东西的核心并完成工作。 当人们想到 Google 时,他们通常会想到向我们寻求快速的事实答案,例如“钢琴有多少个琴键?” 但越来越多的人转向谷歌寻求更深入的见解和理解——比如,“钢琴或吉他更容易学吗,每种都需要多少练习?” 学习这样的主题可能需要付出很多努力才能弄清楚您真正需要了解的内容,而且人们通常希望探索各种不同的观点或观点。 人工智能在这些时刻可以提供帮助,很快,用户将在搜索中看到基于AI的功能,这些功能将复杂的信息和多个视角提炼成易于理解的格式,这样用户就可以快速了解全局并从网络中了解更多信息:无论是寻找其他视角,这些新的AI功能将很快开始在Google搜索中推出。 这也显示了谷歌的急切心情,也就是语言模型落地的竞争进入了白热化,谷歌不打算把优势拱手让给微软。 近期,谷歌云还投资OpenAI的对手Anthropic公司3亿美元,获后者约10%股权。Anthropic已选择谷歌云作为其首选云提供商,为其提供构建可靠且值得信赖的AI系统所需的计算能力。...
文心一言
实测 | 文心一言APP上架,125个细分功能够你玩了
近日有网友收到百度内测短信,称“文心一言APP”上架苹果App Store并开启内测。 经大模型之家查询,此次“文心一言”APP开发者一栏的确为百度公司,而据不少网友反馈,近日均收到了百度文心一言APP的内测信息,并已下载完成体验。 随着正版“文心一言APP”的上线,用户们终于可以不用再玩那些“假文心一言”,来体验这款真的文心一言的魅力。 大模型之家还发现,在文心一言网页版中也增加了“文心一言APP”的指引按键。苹果、安卓手机均可以扫描二维码进行下载安装。 值得一提的是,目前文心一言APP内测是免费使用的,给不少互联网人带来了福音。相对于网页版文心一言,APP版本有哪些新的功能上线?跟着大模型之家一起来看看吧。 登录文心一言APP后,首先能注意到,历史记忆对话为空白,此前网页版的提问记录是不同步的。 在对话界面能够发送文字、语音、图片消息,大模型之家将一张家庭聚会时拍摄的碰杯照片发送给文心一言,并提问,你猜我吃的是什么? 文心一言也很快响应并给出几个结论,社交活动、私人聚会、使用餐具是玻璃容器,表明正在享用红酒或啤酒等饮料,但关于“你猜我吃的是什么”并没有更多的信息能够获取。 能够根据一张图片识别出餐具的材质、碰杯、一群人,可见文心一言APP版本已经较网页版聪明不少,并发生了迭代。 在对话界面旁边是“发现”界面,大模型之家细数后发现,截至目前,已更新有125个功能场景,覆盖角色、创作、点评、绘画、职场、生活、学习等数十项细分场景。 在直接对话中,文心一言还无法直接生成图像,而在使用“萌哒动物头像”功能中,大模型之家提问“睡在飞云之上的可爱毛茸茸的小兔子宝宝”,文心一言可以实现作画,但其作画技能还不完善,暂不支持对画作的修改和解释。 在文案方面,文心一言还细分更多的文案功能,包括小红书探店文案、小红书种草文案、知乎回答生成、B站视频脚本、抖音标题优化、V50小助手、朋友圈神器等。 在小红书种草文案中,只需要输入商品名称就可以获得一篇带有标题、正文、话题的完整小红书文稿,B站视频脚本也是如此,只需要输入视频主题内容即可获得完整的脚本文案,创作者们再也不用绞尽脑汁想提示词了,大大提升了创作效率。 不仅如此,文心一言更像是安利给职场打工人专属的APP,还设置有PPT大纲生成、Excel公式生成、日报生成、公文助手、调研报告、会议纪要一键生成等涵盖24个工作场景的功能。 其中,热度最高的是PPT大纲生成器,直接输入PPT主题,就能够生成对应的PPT大纲,例如输入“人工智能的未来发展及其影响”,会有每页幻灯片所囊括的内容概要大纲,并提供该主题的其他可能方向。 此外,还有虚拟人诸葛孔明、马斯克、孔夫子等角色,但在专属舔狗和铁杆闺蜜的角色体验中,人工智能的“味道”还是很浓郁,始终没有人类的真情实感。 针对学习场景,文心一言还细分有考公面试、长篇笔记提取要点、考公案例分析助手、中英互译等。 在考公面试场景,能够根据提问出具“标准”答案,像极了《考公面试习题集》,考生可以在这里进行模拟训练。 在点评方面,文心一言还提供有电影影评、淘宝风格评论、外卖评论、豆瓣风格影评等。 大模型之家提问了最近上映的新电影《变形金刚:超能勇士崛起》,文心一言也能够给出准确的影评,这也证实了文心一言可联网搜索的事实。 值得注意的是目前,文心一言APP仍然处于内测阶段,对于拥有内测资格的用户可以直接下载进行体验;而对于没有内测资格的用户,则需要在下载App后,一键申请内测资格。 以当前内测版本而言,文心一言APP的功能场景相较于网页版更为全面,语言交互能力有了一定提升,更多的场景也为用户提供了诸多便利。大模型之家希望,在正式版上线时,文心一言APP在性能与功能方面能够更上一层楼,让行业见证中国大模型的成长。 近期活动
Bard
Bard与ChatGPT的较量,谁将成为智能语言模型的领跑者?
原标题:Bard与ChatGPT的较量,谁将成为智能语言模型的领跑者? 文章概要: ChatGPT的流行与缺陷: ChatGPT在过去一年中变得非常流行,但它在信息的准确性和相关性方面出现了下滑。 Bard的开发与特点: 虽然Google在开发Bard时看似落后,但他们专注于精度和质量,而不是仓促发布充满错误的工具。Bard仍在开发中,性能不断提升,且处于实验阶段有利于开发者进行重要改进。 Bard的新功能: Bard新增了多个解决方案选择功能,提升了工具的实用性和教育性。 互联网访问能力: Bard能够添加引用网站信息,帮助用户更快找到相关信息。 Bard与ChatGPT的差异: 在不知道答案时,Bard不会给出回应,而ChatGPT可能提供误导信息。 Bard的完善性: Bard尽管仍在实验阶段,但已经是一个几乎完善的产品,具备多种标准功能。 Bard与Google服务的集成潜力: Bard未来与Google的各种服务(如Gmail、YouTube等)的整合将带来巨大的好处。 ChatGPT的流行与问题 过去一年,ChatGPT如同一颗冉冉升起的新星,在数字领域迅速崭露头角。然而,随着它的声名鹊起,一个不容忽视的问题也逐渐显现出来:信息的准确性和相关性开始变得岌岌可危。这一点在用户使用过程中变得越来越明显,不少人开始对它提供的内容持怀疑态度。 Bard的发展与优势 与此同时,Google默默耕耘着自己的Bard项目。起初,人们或许会认为Google在这场语言模型的竞赛中稍显落后,但事实却恰恰相反。Google选择了一条不同的道路——他们不愿匆忙推出一个充满错误的半成品,而是将重心放在了精度和质量上。正因为这样的策略,Bard虽然目前仍处于开发阶段,但每一次更新都带来了实质性的提升。 Bard的新功能与实用性 Bard的发展可谓日新月异。每周使用它,都能发现一些令人眼前一亮的新功能。最近我注意到的一个更新是它提供了针对同一问题的多种解决方案。这不仅仅让用户有了更多选择,同时也在不断教会Bard如何更有效地解决问题。 互联网访问与信息引用 Bard的另一个显著特点是它能够访问互联网并引用信息来源。它能快速浏览成千上万的网页,不仅为用户提供解决问题的方案,还能引导用户查找更多相关信息。这种能力对于需要进行复杂问题解决的用户来说,是一个极大的便利。 两种模型的对比差异 在处理不确定答案的情形时,Bard和ChatGPT的表现截然不同。当Bard遇到无法回答的问题时,它选择不给出任何回应,虽然这在某种程度上显得有些不便,但至少它不会提供错误或误导性的信息。而ChatGPT则总是尽可能给出答案,即便有时这些答案并非精确无误。 Bard的完善性与功能丰富性 虽然Bard还处于实验阶段,但它已然是一个功能丰富、几乎完善的产品。它拥有的功能包括但不限于复制粘贴、插入长文本、区分文本和代码、高亮显示代码语法等。此外,Bard还支持将回应播放为音频,以及分享、检查答案和编辑提示或响应等操作。 未来展望:Bard与Google服务的整合 展望未来,Bard与Google旗下各种服务的整合将带来无限可能。想象一下,如果Bard能与Gmail、Google云盘、YouTube等服务无缝连接,它将如何改变我们的工作和生活方式,这是一个令人兴奋的前景。 总的来说,虽然ChatGPT和Bard各有特点,但对于追求精确、高效和丰富功能的用户来说,Bard显然是更优的选择。随着它的不断进步,我们有理由相信,它将在不久的将来为我们带来更多惊喜。返回搜狐,查看更多 责任编辑:
文心一言
百度副总裁:新版文心一言能力已超ChatGPT 3.5,未来只会有少量大模型
据报道,IDC发布AI大模型技术能力评估报告显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一。在面向媒体沟通中,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜指出,新版本文心一言3.5已超越ChatGPT 3.5,未来国内将只会有少量大模型。
Bard
Bard 首发失利、Gemini AI 推迟发布,谷歌的大模型之路为何如此坎坷?
原标题:Bard 首发失利、Gemini AI 推迟发布,谷歌的大模型之路为何如此坎坷? 来源:Founder Park 图片来源:由无界 AI生成 11 月 16 日,来自 The Information 的独家消息,谷歌决定推迟发布 Gemini AI——这是旨在与 OpenAI 竞争的大模型产品。 自 3 月份 Bard 发布以来,谷歌的 LLM 研发和产品推进一直比较缓慢,虽然在 Google Docs 和 Gmail 中都集成了 AI 工具,但市场反响一般,行业的注意力都聚焦在 OpenAI 和 ChatGPT 。 很明显,目前大模型赛道,与竞争对手 OpenAI 和微软相比,谷歌属于暂时失意的一方。至于原因,最近一篇分享在谷歌工作经验的 blog,提供了一个难得的内部视角,回答了为什么是 OpenAI 而不是谷歌成为了 LLM 革命的领导者。 文章编译自...
文心一言
百度文心一言:内卷现象:探究原因与解决之道
这篇文章是由百度文心一言所创作,大家觉得文章质量如何? 在当今社会,内卷现象已经引起了广泛的关注。内卷是指在竞争过于激烈的情况下,个体为了获得更好的资源和发展机会,不断加班加点、加大投入,以超越他人,但最终却导致个体身心俱疲,社会资源浪费的一种现象。本文将从多个角度分析内卷现象的原因,并探讨解决之道。 内卷现象的出现,既有社会现象的原因,也有心理现象的原因。从社会角度来看,随着社会竞争的日益激烈,人们为了获得更好的物质生活和社交地位,不断努力争取更多的资源和机会。此外,社会评价体系的单一也促使人们追求表面上的成功和优越感,从而导致了内卷现象的出现。从心理角度来看,个体在面对竞争时,往往会产生焦虑、不安、攀比等情绪,为了获得心理平衡,个体不断加班加点、加大投入,最终陷入了内卷的漩涡。 内卷现象的产生,与教育体制、家庭环境等多个因素有关。首先,教育体制的不完善为内卷现象的产生提供了土壤。在应试教育的背景下,学生为了在高考中取得好成绩,不断加班加点,忽略了身心健康和综合素质的发展。其次,家庭环境对内卷现象的产生也有一定的影响。在家庭教育观念中,父母往往会对孩子施加过大的压力,期望孩子在学业和生活中都能取得优异的成绩,从而导致了内卷现象的发生。 为了解决内卷现象,我们需要从多个方面入手。首先,改革教育体制,注重学生的综合素质和全面发展,减轻学生的课业负担,让他们有更多的时间参与课外活动和锻炼身体。其次,转变家庭教育和评价观念,家长应关注孩子的身心健康和个性发展,鼓励孩子尝试不同的兴趣和爱好,提高孩子的综合素质。此外,政府和社会组织也应承担起相应的责任,制定公平合理的评价和晋升机制,避免单一评价体系导致内卷现象的出现。同时,加大对内卷现象的宣传和教育力度,提高人们对内卷现象的认识,从而减少内卷现象的发生。 在内卷现象的解决之路上,个人的作用同样不可忽视。个体应从自身出发,树立正确的竞争观念,注重自身综合素质的发展,积极参与社会活动,拓展自己的视野和经验。同时,学会调节情绪,面对竞争压力时保持冷静和理智,避免盲目追求成功而陷入内卷的困境。 总之,内卷现象是一个复杂的社会问题,需要我们从多个角度进行分析和解决。通过改革教育体制、转变家庭观念、政府和社会组织的引导以及个人的自我提升,我们可以逐步减少内卷现象的发生,实现社会的和谐发展。在解决内卷现象的过程中,我们需要充分认识内卷的危害,积极采取措施,确保资源的合理分配,为每个人的发展提供公平公正的机会。只有这样,我们才能走出内卷的困境,创造一个更加美好的未来。
Bard
清华团队攻破GPT-4V、谷歌Bard等模型,商用多模态大模型也脆弱?机器之心Pro2023-10-17 20:07北京机器之心Pro2023-10-17 20:07北京
机器之心专栏 机器之心编辑部 GPT-4 近日开放了视觉模态(GPT-4V)。以 GPT-4V、谷歌 Bard 为代表的多模态大语言模型 (Multimodal Large Language Models, MLLMs) 将文本和视觉等模态相结合,在图像描述、视觉推理等各种多模态任务中展现出了优异的性能。然而,视觉模型长久以来存在对抗鲁棒性差的问题,而引入视觉模态的 MLLMs 在实际应用中仍然存在这一安全风险。最近一些针对开源 MLLMs 的研究已经证明了该漏洞的存在,但更具挑战性的非开源商用 MLLMs 的对抗鲁棒性还少有人探索。 为了更好地理解商用 MLLMs 的漏洞,清华朱军教授领衔的人工智能基础理论创新团队围绕商用 MLLM 的对抗鲁棒性展开了研究。尽管 GPT-4V、谷歌 Bard 等模型开放了多模态接口,但其内部模型结构和训练数据集仍然未知,且配备了复杂的防御机制。尽管如此,研究发现,通过攻击白盒图像编码器或 MLLMs,生成的对抗样本可以诱导黑盒的商用 MLLMs 输出错误的图像描述,针对 GPT-4V 的攻击成功率达到 45%,Bard 的攻击成功率达到 22%,Bing Chat 的攻击成功率达到 26%。同时,团队还发现,通过对抗攻击可以成功绕过 Bard 等模型对于人脸检测和图像毒性检测等防御机制,导致模型出现安全风险。 论文链接: https://arxiv.org/abs/2309.11751 代码链接: https://github.com/thu-ml/ares/tree/attack_bard 图 1:对抗攻击多模态大模型示例,可以使模型产生错误预测或者绕过安全性检测模块...
文心一言
“文心一言”背后,藏着中国科技向上突破的关键秘密
► 文 辟疆 百度“文心一言”终于在3月16日邀请测试。与此前爆火的ChatGPT相比,中国大模型提供了不少亮点。“文心一言”一步到位,首发版本就具备多模态功能——同时支持文本、图片、音频,未来还将支持视频的生成,可以对标OpenAI最新发布的GPT-4版本。 从新闻发布会信息来看,“文心一言”显然是中国目前为止、也可能是未来相当一段时间内最好的大语言模型,势必带来百度的价值重估。这种重估并不简单取决于“文心一言”眼下的能力。毕竟AI大模型还处在成长过程之中,哪怕已经展现出让人惊叹的能力,也难以避免一些“一本正经的胡说八道”。OpenAI也坦言,GPT-4仍然会产生幻觉、生成错误答案,并出现推理错误。事实上,“文心一言”最大的意义,在于其诞生本身。为什么中文版“类GPT”模型首先诞生于百度?这可能是一个决定未来数十年中美科技竞争格局的问题,是一个远比“文心一言”更重要的问题。我们还可以提出一个类似的问题:为什么ChatGPT出自微软旗下的OpenAI,而谷歌、Meta的类似模型却相继“翻车”?数据、算法和算力,是支撑AI技术的三要素,而对于大模型的讨论中,最令人印象深刻的无疑是其庞大的算力需求。算力换一个说法,就是“烧钱”。 机器学习领域最先进的英伟达A100显卡,每张售价超过1万美元。市场调查机构TrendForce最新报告显示,ChatGPT的运行需要使用30000块A100显卡,总成本高达3亿美元。这还只是显卡的价格,整个算力中心的建设更是一笔巨资。资料显示,ChatGPT的总算力消耗约3640PF-days(即每秒一千万亿次计算,运行 3640 天)。作为对比,中国近期规划的一座500P算力的数据中心,总投资达到30亿元人民币。AI大模型离不开“钞能力”的支持。去年一年,OpenAI预计亏损5.44亿美元,今年有消息称,微软还将向OpenAI投资100亿美元。不过微软对OpenAI的真实投入并没有这么高,因为OpenAI租用的算力,来自微软自家的云服务Azure,部分运算费用会回流到微软。美国投行Jefferies的研究报告也指出,微软“认为 AI 创新推动了 Azure AI 服务的增长”。换句话说,同时拥有OpenAI的算法、以及Azure云服务器的微软,通过垂直一体化大大节省了成本,同谷歌等对手相比自然具有了优势。百度则是比微软更加垂直一体化的企业。百度从十几年前就大力投入AI研发,而且是全球为数不多进行全栈布局的人工智能公司。 AI技术架构分为芯片层、框架层、模型层和应用层,分别对应百度的高端芯片昆仑芯、飞桨深度学习框架、文心预训练大模型,以及最为人熟知的搜索引擎。在整个AI垂直体系中,百度都有领先业界的关键自研技术。在国内众多云服务厂商中,百度也率先整合AI能力。去年12月27日,百度智能云发布国内首个全栈自研的AI基础设施“AI大底座”,并全面升级25项产品和技术。IDC《2022 H1中国AI云服务市场研究报告》报告显示,2022上半年,百度在AI公有云服务市场份额占比28.1%,已连续四年市场份额第一。截至目前,百度已经拥有阳泉、徐水、定兴三个云计算中心,其中,阳泉智能云数据中心仅一期就可承载16万台服务器,预计整个百度阳泉云计算中心可承载24万台服务器。百度自研AI芯片“昆仑”已在多场景实际部署几万片,在公司搜索业务中也已形成较强工程化实践,为“文心”大模型提供了强大的底层算力保证。十年累计研发投入超过 1000 亿元,百度马拉松式的研发正在“文心一言”上开花结果。垂直一体化的产业布局,既证明了百度雄厚的技术实力,更节省了大量中间成本。而在激烈的技术竞争中,成本往往会成为决定性因素。对一家企业如此,对一个国家更是如此。日本经济学家野口悠纪雄,是最初为日本泡沫经济“吹哨”的人。在他看来,垂直一体化与水平分工,这两种产业结构的差异,是工业时代大国兴衰背后的根本原因。在上世纪六七十年代,日本带有浓厚计划色彩的经济体制,催生了不少垂直一体化布局的大企业。在钢铁、化工以及后来的电子产业中,垂直布局让企业可以进行高额的资本开支,从而带动科技创新,帮助日本在这些领域一度超越美国。以电子产业为例,日本一度拥有从光刻机,到芯片制造,再到消费级电子产品的完整产业链,让美国感受到巨大威胁。然而到了90年代之后,世界产业趋势发生逆转,电子行业底层技术基本成型,互联网应用开始兴起,企业竞争的核心,变成谁能做出更迎合消费者的应用级产品。资本开支不再重要,轻资产的美国企业反而能够灵活调整产品策略,获取竞争优势。这也是日本“失去20年”的根本原因。 今天,我们或许站在了历史又一次逆转的前夜。过去十年轻资产、高利润的互联网模式正在失效,AI技术再次带来底层颠覆性创新,庞大的算力成本让科技行业回到重资产时代,垂直一体化的企业正在重新获得优势。百度能够成为中国“大厂”中第一个推出大语言模型的公司,或许正是开启这一趋势的信号之一。如果“文心一言”能够取得成功,百度的内在价值将获得彻底重估。不计成本的研发投入,曾经伤害了百度的财务报表,让资本市场心存怀疑,但这样的逻辑有可能被彻底颠覆。市场将重新认识资本开支的意义。无论对于中国企业,还是对于整个国家产业战略而言,这或许才是“文心一言”带来的最大启示。政府引导下的长期主义产业投资,从来都是中国经济体制的独特优势,在未来数十年中,更有可能成为中美科技竞争中的决胜因素。“文心一言”背后,隐藏的或许是中国科技向上突破的关键秘密。
文心一言
百度文心一言登录安卓、苹果
安卓: 1、手机浏览器在百度搜索中输入“文心一言” 2、下拉找到“文心一言”APP,下载登录获得资格的百度账号即可使用 苹果: 1、打开应用商店搜索“文心一言” 2、下载登录获得资格的百度账号即可使用
文心一言
文心一言:中国科技“元实力”的一次喷发
· 这是第5096篇原创首发文章 字数 4k+ · · 秦朔 | 文 关注秦朔朋友圈 ID:qspyq2015 · “我们正处在一场新的重大科技革命的序章。” 这是“两会”之后的一个晚上,我在一场科技发展与新型举国体制的夜话中,不止一次听到的判断。 去年11月30日ChatGPT上线,人工智能迎来了iPhone时刻。3月16日下午,百度宣布正式推出基于百度新一代大语言模型的生成式AI产品文心一言(英文名:ERNIE Bot),也就是之前一段时间人们所期待的“中国的ChatGPT”。 当人工智能多年积蓄的力量喷薄而出,无数被其赋能的新物种、新应用的大爆发也就水到渠成。 勇气与厚积薄发的信心 从去年9月通过“健全关键核心技术攻关新型举国体制的意见”,到“两会”宣布重组科学技术部,组建中央科技委员会,科技创新在中国现代化建设全局中的核心地位已毋庸置疑,它既是未来中国经济的关键变量,也是高质量发展的最大增量。 在人工智能这一具有战略性、全局性、辐射带动性的科创高地上,中国将有何新作为? 百度推出文心一言最大的意义,可能不止于技术本身,而在于直面国际科技竞争赛场的格局与勇气,这是一个远比文心一言更重要的问题。 3月5日,科技部部长王志刚在十四届全国人大一次会议首场“部长通道”上说,中国在自然语言处理和理解方面进行了多年的研究,既要通过科学研究、技术牵引,又要通过场景驱动、用户需求,使得人工智能能为中国经济社会发展、为中国科技作出贡献。 他还谈到了ChatGPT,认为ChatGPT要做到算法的实时性和有效性并不容易。“从源头来看是自然语言理解、自然语言处理两个技术,之所以引起关注,在于它是一个大模型,对应大数据、强计算、好算法,原理是这样,就像踢足球都是盘带、射门,但要做到梅西那么好也不容易。” 从底层技术看,文心一言和ChatGPT都采用了SFT(模型微调)、RLHF(强化学习)、prompt(用户指令)等技术。这跟大模型通过海量无标注数据的训练是不同的,还需要人的参与,作用是更好地理解人的意图,生成符合人的价值观、表达习惯的回复。 从演示看,文心一言和ChatGPT相比,在文学创作、商业文案写作、数理逻辑推算等方面的能力是“你有我有大家有”。但在中文理解上,文心一言非常领先,处于独一无二的位置。 这是因为文心一言的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,以及5500亿事实的知识图谱。 研究表明,数据规模大,参数达到千亿级,大模型就可能发生“智能涌现”,涌现出知识和逻辑推理能力。而百度不仅数据规模大,数据形态也最贴合回答和生成需求,在百度搜索中问答和生成类的搜索请求占比很高。因此文心一言大模型在自然语言问答和创意内容生成上有着非常突出的表现。 文心一言刚刚发布,就如同ChatGPT刚发布一般,注定有不完美的地方,但当其开始使用后,经由真实的用户反馈、开发者的调用和模型迭代,将飞速成长。 面对世界各个科技巨头躬身入局的大模型赛道,百度是全球第一个对标ChatGPT的互联网大厂,这不仅是一种魄力,更是一种厚积薄发的势能。 我在夜话中认识的一位投资人曾在百度人工智能部门工作多年。我问她怎么看文心一言。她说,Robin(李彦宏)可能是互联网公司创始人中最有技术情怀的,百度在人工智能方面投资最久、最多,人才和技术底子最厚,所以率先推出“中国的ChatGPT”是很自然的事。放在中美科技角逐的背景下,文心一言的推出更显重要,它证明在人工智能的这一关键应用上,中国并未落后。 “就像百度在无人驾驶方面投了几百亿,给今天的很多车企铺了路,其作用就像‘黄埔军校’一样,百度做科技,从来不止是服务于它本身。” “元实力”的一次喷发 从眼下看,对消费者来说,文心一言的价值在于,当它嵌入百度搜索,用户能直接与大语言模型交互,实现搜索体验的升级。对企业来说,则丰富和强化了百度智能云的能力,通过向公众开放大语言模型,可以帮助企业主和创业者在云上构建自己的模型和应用,提高效率、帮助决策和改善客户体验。 接下来,文心一言将与小度进行集成,升级小度的智能设备和服务;也将整合到百度的Apollo智舱系列产品等汽车解决方案中,让智能汽车具备领先的人车交互体验。 事实上,在最近的一个月内,已有超过600家合作伙伴宣布加入文心一言生态,期待尽早用上最新的大语言模型。对他们来说,百度智能云所提供的不仅是存储、带宽、数据库等基本功能,更是包括飞桨和文心大模型等在内的全栈人工智能能力。 这里简单梳理一下百度的人工智能能力体系。 在进入人工智能时代之前,IT技术的技术栈一般分为三层:底层的芯片,中间的操作系统,上层的应用。 进入人工智能时代后,百度的理解是四层:芯片层、框架层、模型层和应用层,并以此展开进行布局,即:芯片层的昆仑芯,2018年发布后已部署了几万片;框架层的“深度学习框架”飞桨,截至2022年底飞桨平台上已凝聚535万开发者,创建了67万个人工智能模型,服务20万家企事业单位;模型层的信息分布大模型、交通大模型、能源大模型等等,以及应用层的搜索、智能信控、电力等等。 这一四层全栈能力体系的好处是,针对一些场景在四层之间有非常多的反馈,从而进行极致优化。比如在搜索场景上,百度的人工智能芯片已经优化了10年,是全球效率最高成本最低的,在搜索场景下可以超过全球优秀的通用芯片。 文心一言位于四层架构中的模型层,它只是AI系统中承上启下的一环,假如脱离整个架构无异于空中楼阁。假如框架层和芯片层不能满足模型的需求,即使模型再好也无法发挥最大效果。 虽然文心一言刚刚推出,但它生在一个充满阳光雨露的强大的生态中,与之相关的基础技术如深度学习、自然语言处理、大模型等百度已沉淀多年。 对于百度的大模型,这里也稍作回顾。 随着数据井喷、算法进步和算力突破,效果好、泛化能力强、通用性强的预训练大模型,开始成为人工智能产业应用的基础底座。2019年,百度推出了文心大模型ERNIE 1.0这一产业级知识增强大模型。通过大模型与深度学习框架的融合发展,百度打造了自主创新的人工智能底座,大幅降低了开发和应用门槛,真正发挥大模型驱动人工智能规模化应用的产业价值。 文心大模型已迭代到了ERNIE 3.0,每天接受数十亿用户的搜索请求和其他百度移动生态app的训练。百度以文心通用大模型为基础,和各行各业的合作伙伴一起共建行业大模型,从行业及企业的特有数据和知识中,融合学习,提升大模型对行业应用的适配性。 截至目前,文心行业大模型已经达到11个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域,在产业化落地的过程中使大模型真正赋能千行百业。 在我看来,在全球新一轮人工智能技术的普惠化、创造性应用的大潮中,着眼于芯片和算力的企业具备“硬实力”,着眼于算法和模型的企业具备“软实力”,着眼于垂直场景应用创新的企业具备“巧实力”,而全栈技术能力强、底层核心技术过硬,并能将技术广泛赋能于个人、产业、城市、交通以及社会方方面面的企业,则具备“元实力”。 中国经济需要硬实力,软实力,巧实力,更需要元实力。 天地成于元气,万物之生皆禀元气。“元实力”的积累,需要长期的积累。...
文心一言
和百度的大模型“文心一言”聊了聊“罗刹海市”,大模型很聪明
对于“罗刹海市”,我向百度文心一言提问: 问题一:对刀郎的罗刹海市的每一句歌词,你能根据你的理解解释一下吗? 文心一言的回答如下: 1.六千里。这可能是歌词中的一种想象或夸张,因为实际距离可能没有这么远。 2. “过七冲越焦海三寸的黄泥地”:这句歌词描述的是通往罗刹国的路途困难重重,需要穿过七冲和焦海,三寸的黄泥地可能是指这些地方的地理环境,包括艰难险阻和消化系统等。 3. “只为那有一条一丘河”:这句歌词可能指的是在罗刹国有一条特殊的河,可能有着特殊的意义或者象征意义。 4. “河水流过苟苟营”:这句歌词中的”苟苟营”是一个方言词,指的是妓院或保护人的地方。这句歌词可能是在描述河水的流经地,也可能是在暗示罗刹国的某种社会现象或价值观。 5. “每一日蹲窝里把蛋来卧”:这句歌词可能指的是罗刹国的人们每天都在自己的工作场所或家中休息,可能是一种形容或比喻。 6. “老粉嘴多半辈儿以为自己是只鸡”:这句歌词中的”老粉嘴”是一个方言词,指的是爱说大话的人。这句歌词可能是在描述罗刹国的人们自我感觉良好,可能是一种讽刺或批评。 7. “勾栏从来扮高雅”:这句歌词中的”勾栏”是一个戏曲杂剧的演出场所,也可能指的是妓院。这句歌词可能是在描述罗刹国的文化或社会现象,可能是一种批评或讽刺。 8. “自古公公好威名”:这句歌词中的”公公”指的是古代的官员或贵族,这句歌词可能是在描述罗刹国的社会现象,可能是一种批评或讽刺。 9. “打西边来了一个小伙儿他叫马骥”:这句歌词可能是在描述一个来自西方的年轻人,他的名字是马骥。 10. “美丰姿少倜傥华夏的子弟”:这句歌词可能是在描述这个年轻人的外貌和气质,他可能有着美丽的丰姿和潇洒的气度,他是华夏的人。 11. “只为他人海泛舟搏风打浪”:这句歌词可能是在描述这个年轻人的冒险精神或勇气,他可能在茫茫大海上为他人而冒险。 12. “龙游险滩流落恶地”:这句歌词可能是在描述这个年轻人经历的困难或危险,他可能在恶劣的环境中挣扎求生。 13. “他见这罗刹国里常颠倒”:这句歌词可能是在描述这个年轻人对罗刹国的观察和感受,他可能觉得这个国家经常发生混乱和颠倒的事情。 问题二:你对这首歌是如何理解的? 《罗刹海市》是一首具有浓厚东方神秘色彩的歌曲,歌词中描述了一个名为罗刹国的虚构世界,充满了想象力和神秘感。 整首歌的氛围压抑而神秘,歌词中出现的“七冲”、“焦海”、“三寸黄泥地”等词语,给人一种险恶而未知的感觉。而歌词中的“只为那有一条一丘河”、“河水流过苟苟营”等句子,则暗示着这个神秘国度中存在着某些特殊的事物,或者是某些社会现象。 同时,歌词中还出现了一些具有象征意义的词语,如“老粉嘴”、“勾栏”等,这些词语的出现,使得整首歌更加具有了文化内涵和批判性。 总的来说,《罗刹海市》是一首充满想象力和神秘感的歌曲,歌词中的词语和句子都具有深刻的意义和象征性,听众可以通过这首歌感受到东方神秘文化的独特魅力。 问题三:你认为这首歌是网上传言的映射他人吗? 对于网上关于《罗刹海市》是否映射他人的传言,我无法做出肯定或否定的结论。这首歌的歌词确实比较神秘和寓意深刻,容易让人产生各种解读和猜测。但是,我们不能仅凭歌词和传言就断定这首歌是否映射他人,这需要结合更多的背景和信息来进行判断。 如果这首歌是刀郎的创作,那么他可能会有自己的创作动机和意图,而这些动机和意图可能并不为外界所知。同时,如果这首歌是映射他人的,那么也需要考虑到刀郎和被映射者之间的关系,以及这首歌的发布时间和背景等因素。 因此,我们需要更加客观和理性地看待这首歌,不要轻易相信传言和谣言,而是要通过更多的信息和证据来进行判断。
ChatGLM-6B
智谱ChatGLM3震撼发布:超越想象的AI大模型,引领智能科技革命!
原标题:智谱ChatGLM3震撼发布:超越想象的AI大模型,引领智能科技革命! 智谱AI在2023中国计算机大会(CNCC)上推出了全新的ChatGLM3基座大模型及其系列产品。这款最新的模型采用了创新的多阶段增强预训练方法,以实现更加充分的训练效果。 智谱AI的首席执行官张鹏亲自进行了新品发布,并通过实时演示展示了产品的最新功能。据介绍,通过使用更丰富的训练数据和优化的训练方案,ChatGLM3的性能得到了显著提升。与之前的ChatGLM2相比,MMLU提升了36%,CEval提升了33%,GSM8K提升了179%,BBH提升了126%。 此外,ChatGLM3还进行了针对GPT-4V的迭代升级,引入了一些全新的功能。其中包括具备多模态理解能力的CogVLM-看图识语义,在10余个国际标准图文评测数据集上取得了领先水平;代码增强模块Code Interpreter能够根据用户需求生成并执行代码,自动完成数据分析、文件处理等复杂任务;网络搜索增强模块WebGLM-接入搜索增强,能够自动查找互联网上与问题相关的资料,并在回答时提供参考的相关文献或文章链接。ChatGLM3的语义能力和逻辑能力得到了极大的增强。 此外,ChatGLM3还集成了自研的AgentTuning技术,激活了模型的智能代理能力,特别是在智能规划和执行方面,相较于ChatGLM2提升了1000%;同时还实现了对国产大模型的原生支持,包括工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。 除了以上功能,ChatGLM3还推出了可在手机上部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B,支持多款手机品牌,包括vivo、小米、三星等,甚至支持移动平台上CPU芯片的推理,速度可达20 tokens/s。在精度方面,1.5B和3B模型在公开benchmark上的性能与ChatGLM2-6B模型相当。 通过最新的高效动态推理和显存优化技术,ChatGLM3的推理框架在相同硬件和模型条件下,相较于其他开源实现,如伯克利大学的vLLM和Hugging Face TGI的最新版本,推理速度提升了2-3倍,推理成本降低了一倍,每千tokens的成本仅为0.5分。这使得ChatGLM3成为当前最具竞争力和高效性能的大模型之一。 智谱AI的新一代ChatGLM3基座大模型以其强大的性能和丰富的功能,将为用户提供更加高效、智能的交互体验,并在各个领域展现出巨大的潜力。返回搜狐,查看更多 责任编辑:
ChatGLM-6B
适配更多国产芯片 智谱AI推出第三代基座大模型ChatGLM3
原标题:适配更多国产芯片 智谱AI推出第三代基座大模型ChatGLM3 10月27日消息,智谱AI于2023中国计算机大会(CNCC)上,推出了全自研的第三代基座大模型ChatGLM3及相关系列产品,这也是智谱AI继推出千亿基座的对话模型ChatGLM和ChatGLM2之后的又一次重大突破。 此次推出的ChatGLM3采用了独创的多阶段增强预训练方法,使训练更为充分。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。智谱AI CEO张鹏在现场做了新品发布,并实时演示了最新上线的产品功能。 ChatGLM3全新技术升级 更高性能更低成本 通过更丰富的训练数据和更优的训练方案,智谱AI推出的ChatGLM3性能更加强大。与ChatGLM2相比,MMLU提升36%、CEval提升33%、GSM8K提升179% 、BBH提升126%。 同时,ChatGLM3瞄向GPT-4V本次实现了若干全新功能的迭代升级,包括多模态理解能力的CogVLM-看图识语义,在10余个国际标准图文评测数据集上取得SOTA;代码增强模块Code Interpreter根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强WebGLM-接入搜索增强,能自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。ChatGLM3的语义能力与逻辑能力得到了极大的增强。 ChatGLM3还集成了自研的AgentTuning技术,激活了模型智能体能力,尤其在智能规划和执行方面,相比于ChatGLM2提升了1000% ;开启了国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。 此外,ChatGLM3本次推出可手机部署的端测模型ChatGLM3-1.5B和 ChatGLM3-3B,支持包括vivo、小米、三星在内的多款手机以及车载平台,甚至支持移动平台上CPU芯片的推理,速度可达20 tokens/s。精度方面1.5B和3B模型在公开benchmark上与ChatGLM2-6B模型性能接近。 基于最新的高效动态推理和显存优化技术,ChatGLM3当前的推理框架在相同硬件、模型条件下,相较于目前最佳的开源实现,包括伯克利大学推出的 vLLM 以及Hugging Face TGI的最新版本,推理速度提升了2-3倍,推理成本降低一倍,每千tokens仅0.5分,成本最低。 免责声明: 1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证,并在此声明不承担信息可能产生的任何责任、任何后果。 2、 本号非商业、非营利性,转载的内容并不代表赞同其观点和对其真实性负责,也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误,负任何直接或间接责任。 3、本号部分资料、素材、文字、图片等来源于互联网,所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品,请与我们取得联系,我们会及时修改或删除。 返回搜狐,查看更多 责任编辑:
ChatGLM-6B
清华出品 | 超强AI大模型ChatGLM第3代整合包来了!
原标题:清华出品 | 超强AI大模型ChatGLM第3代整合包来了! 今天给大家带来一款令人兴奋的AI大模型,它就是清华出品的ChatGLM。 ChatGLM3简介 由清华系创业公司智谱AI推出的ChatGLM,是国内首个全线对标OpenAI产品线的公司。他们近期推出ChatGLM第三代,并且6B版本的大模型直接开源。 官方描述中,ChatGLM3在44个中英文公开数据集测试中排名首位,性能非常强悍。 ChatGLM3离线整合包来了 老规矩,大家自行在本地部署比较麻烦,所以我已经为大家制作好了一款离线整合包了,下载到本地解压即用! 大家下载离线整合包,解压到本地。 ①根据需要,选择不同的启动方式: 一键启动-CPU:适用于几乎任何电脑,但处理速度较慢(Windows 7不支持) 一键启动-GPU:适用于带英伟达独立显卡的电脑,建议2060显卡及以上 一键启动-综合demo:适用于带英伟达独立显卡的电脑 ②双击一键启动程序后,会打开一个命令提示窗口,项目会自动运行。加载成功后,会自动在浏览器打开项目主界面,如果没有自动打开的话,就自行复制以下链接,然后在浏览器打开“ http://127.0.0.1:7860/”。 以下是CPU运行: 以下是GPU运行: 运行成功后,就可以在浏览器看到项目主界面了。我们快速问它几个问题,发现ChatGLM3都能回答得比较快也比较正确。经典的,拿来给孩子辅导作业一点问题没有。🤣 以下是综合demo运行,这是我比较推荐的使用方法,也是官方提供的一个体验方法。综合demo提供了三种使用ChatGLM3模式: Chat:对话模式,该模式下可以与模型进行对话,回答更偏向于日常聊天。先来拿来试试做英语阅读理解题,回答也是一点问题没有。 工具:工具模式,可以通过模型内部自带的工具进行一些操作,比如调用获取天气的工具,然后询问当前某地的天气情况。 代码解释器:该模式下,模型可以在一个 Jupyter 环境中执行代码并获取结果,以完成复杂的任务。 好家伙,有种在本地就可以跑一个ChatGPT的感觉,关键还是免费的!清华毕竟是清华,出品的大模型还是比较强的👍🏻! 注意事项: ①该项目CPU和GPU(仅支持英伟达显卡,10G显存以上为佳)均可运行,但CPU运行较慢(CPU运行比较吃内存,需要16G以上内存)。 ②请确保解压到本地的路径不包含中文,不然可能会引起奇怪的适配问题。 关注并私信回复【ChatGLM3】,免费获得本文资源~返回搜狐,查看更多 责任编辑:
ChatGLM-6B
国产大模型ChatGLM3发布:用华为芯片推理速度提升超3倍,多能力对标GPT-4V钛媒体APP2023-10-27 17:28钛媒体APP2023-10-27 17:28
(图片来源:unsplash) 钛媒体App获悉,10月27日下午举行的中国计算机大会(CNCC2023)一场论坛上,阿里、腾讯投资的人工智能(AI)独角兽公司智谱 AI 正式发布全新自研的第三代基座大模型ChatGLM3系列。 新的ChatGLM3包括ChatGLM3-1.5B(15亿)、3B和6B参数三种,不仅在多模态理解、代码模块、网络搜索等能力上有所提升,而且相对最佳开源模型推理速度提升2-3倍。同时,基于集成自研AgentTuning技术,在智能规划和执行上比ChatGLM-2提升1000%。另外,ChatGLM3还利用华为昇腾生态,使算力推理速度提升3倍以上。 智谱 AI CEO张鹏表示,最新的自研模型ChatGLM3就是瞄准GPT-4V(多模态版的GPT-4)的跨模态能力,是ChatGLM全新一代的技术升级。 “对标OpenAI是智谱 AI 成立以来的目标。智谱 AI 致力于让机器像人一样思考,我们希望利用ChatGLM3通用基座模型能力,与合作伙伴一起共同的支撑千行百业,进入生成式 AI‘第二阶段’。”张鹏称。 据悉,智谱 AI 成立于2019年,脱胎于清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司,瞄准 AI 大模型研发落地,公司CEO张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士,清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道2.0。 2020年,智谱AI 开始GLM预训练架构的研发,并训练了100亿参数模型GLM-10B;2021年利用MoE架构成功训练出万亿稀疏模型;2022年公布1300亿级超大规模预训练通用模型GLM-130B,并以此打造大模型平台及产品矩阵。 2023年,智谱AI 推出千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B等,部署于个人开发者和企业应用领域。今年6月,智谱AI 迭代出ChatGLM2,包括6B、130B、12B(120亿参数)、32B、66B等参数的模型,推理速度增长42%。据张鹏透露,相比GPT-4版的ChatGPT,ChatGLM2-12B、32B和66B性能分别提升16%、36%和280%。 当前,智谱 AI 开源模型在全球下载量已超过1000万次。同时,该公司也进行商业化探索,打造AIGC(生成式 AI)模型及产品矩阵,包括已获批上线的智谱清言、高效率代码模型CodeGeeX等。 融资方面,创立至今的四年多,智谱AI 共完成四轮融资。10月20日,智谱 AI 宣布年内累计融资额超过25亿元人民币,投资方包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构,而君联资本等部分老股东跟投,华兴资本担任独家财务顾问。 截至目前,智谱 AI 公司估值已超过100亿元,是国内 AI 领域独角兽企业。公司称,上述融资将用于基座大模型的进一步研发,更好地支撑行业生态。 此次,智谱 AI 发布的最新ChatGLM3通用基座大模型,在性能、推理、算力、Agent智能体能力、API商业化等方面均有提升。 其中,性能方面,ChatGLM3-6B在44个中英文公开数据集测试中国内同尺寸模型排名首位,相比ChatGLM2-6B,多个排名提升33%以上,GSM8K基准提升179%;推理方面,相较于目前伯克利大学开源的vLLM,速度提升2-3倍,推理成本降低一倍。 同时,新的模型还集成自研AgentTuning技术,激活模型智能体能力,在智能规划和执行方面比ChatGLM2提升1000%,支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景,最新AgentBench基准测试上ChatGLM3-turbo和GPT-3.5接近;国产算力层面,以昇腾生态为例,ChatGLM3推理速度提升达3倍之多。 而在模型尺寸上,ChatGLM系列首次增加1.5B、3B这类小参数模型/张鹏称,主要原因是用户需求和算力成本之间的平衡,而且支持国产芯片的边缘侧模型ChatGLM3-1.5B可在笔记本电脑、手机、汽车等场景部署,速度达20 Tokens/s,精度上1.5B和3B模型与ChatGLM2-6B模型性能接近。 现场演示中,对标ChatGPT、基于ChatGLM3的 AI...