文章主题:视频加载, 刷新页面, 再次尝试

666AI工具大全,助力做AI时代先行者!

关闭
观看更多
更多
正在加载
正在加载
退出全屏

视频加载失败,请刷新页面再试

1685028127387.png 刷新

1685028134873.png

LaMDA轻量级版本到“PaLM 2”,Bard实现超强进化:

2023年2月6日,谷歌母公司 Alphabet 首席执行官Sundar Pichai发布由“LaMDA轻量级版本”支持的Bard对话式人工智能项目;3月21日,Bard正式开放内测,并将反馈结果用于改进;5月10日,在年度开发者大会上,谷歌正式发布了对打GPT-4的PaLM 2并将其赋能Bard。

语言:新版Bard新增两种语言——日语和韩语。

推理能力:PaLM 2的广泛数据集包括科学论文和包含数学表达式的网页。因此, PaLM 2具备强大的逻辑、常识推理和数学方面的能力,比之前的PaLM更容易理解人类的意图。在少样本场景下的推理能力对比中,PaLM 2相较PaLM 的性能提升幅度较大,在WinoGrande、DROP场景超越GPT-4。

1685028138381.png

来源:《PaLM 2 Technical Report》(https://ai.google/static/documents/palm2techreport.pdf)

编写代码:PaLM 2在大量公开可用的源代码数据集上进行了预训练——既精通Python、JavaScript等流行的编程语言,同时也可以生成 Prolog、Fortran 和Verilog等语言的专用代码。1685028144027.png

来源:《PaLM 2 Technical Report》

Bard与Bing使用体验对比:

代码方面:Bing是鼓励自学的大学老师,Bard是直接呈现答案的中学老师。

Bing根据我的要求,用了50秒呈现网上有关爬取A股高频股价的资料链接,点击即可跳转到相应网站:

关闭
观看更多
更多
正在加载
正在加载
退出全屏

视频加载失败,请刷新页面再试

1685028147431.png 刷新

1685028150244.png

Bard一步到位地显示代码内容,并提示最终输出结果是CSV格式,每一列的标题分别是Date、Open、High、Low、Close、Volume。此外,用户可以将这一结果导出至Gmail、谷歌文档、Colab交互式编码工具和第三方协作编程App。

关闭
观看更多
更多
正在加载
正在加载
退出全屏

视频加载失败,请刷新页面再试

1685028152170.png 刷新

1685028153961.png

Bard在代码方面的能力非常惊人。谷歌表示,用户甚至可以直接询问Bard怎么用某一种语言实现某种功能。只要prompt到位,即可迅速生成一串代码,用时不超过10秒。举个例子,询问Bard如何使用Fortran语言建立苹果公司的估值模型,Bard会快速给出代码及变量解释:

1685028158877.png

在使用体验的细节方面,Bard有三处亮点:1)生成的答案会有三个版本,内容互为补充:

1685028163412.png

2)问答历史:左栏中的Bard Activity记录了该Google账号中全部历史问答:

1685028166494.png

点开之后主动提示用户设置查看活动记录的验证模式,确保活动记录的安全性:

1685028170693.png

3)速度较Bing至少提升50%:相比于Bing一字字生成答案,Bard在20秒内直接生成完整答案,效率较高。

答案的完整度对比:Bard学术气息浓郁,逻辑更接近真人我希望Bing和Bard列举各行业接入ChatGPT类产品并取得了不错反响的龙头企业。Bard生成的结果更完整,主动以行业为依据分类列举,点击答案左下方的“Google it”将跳转至搜索引擎,用于快速验证答案正确性。而Bing的回答思路较传统,首先回答了生成式AI的定义,简单列举了几个公司名称,生成速度明显慢于Bard。

1685028172612.png

1685028175554.png

继续问Bard上述公司融合ChatGPT的具体时点以及之后的营收是否改善,结果如下。Bard将时间具体到了季度,并提到了Market interest和Revenue的变化:

1685028181592.png

如果问得再详细一些,Bard还能将盈利指标变化来源于财报的第几页说明白:

1685028184168.png

归纳总结能力对比:Bard条理性更强,速度较Bing快四倍左右

我们以相同方式考察二者对于论文的总结能力(论文取自OpenAI关于开源项目Shap-E的研究,网址:https://arxiv.org/abs/2305.02463)。

Bing的总结内容如下,生成速度如视频所示:

你提供的文章题为 “Shap-E:生成有条件的三维隐式函数”,发表在arXiv.org上。它介绍了ShapE这种用于3D资产的条件生成模型。与最近产生单一输出表示的三维生成模型的工作不同,Shap-E直接生成隐式函数的参数,可以被渲染成纹理网格和神经辐射场。

关闭
观看更多
更多
正在加载
正在加载
退出全屏

视频加载失败,请刷新页面再试

1685028192913.png 刷新

1685028196300.png

Bard回答得更为具体,梳理要点水平不错:

你链接的文章是关于一个新的3D资产生成模型,叫做Shap-E。Shap-E与其他三维生成模型不同,它直接生成隐含函数的参数,可以渲染成纹理网格和神经辐射场。这使得它比其他模型更加通用和强大,因为它可以用来生成更多种类的三维资产。这篇文章描述了Shap-E的两阶段训练过程。在第一阶段,训练一个编码器,将三维资产确定性地映射到一个隐式函数的参数中。在第二阶段,在编码器的输出上训练一个条件扩散模型。然后,这个模型被用来通过从隐含函数的潜在空间采样来生成新的三维资产。文章最后展示了一些由Shap-E生成的3D资产的例子。这些结果令人印象深刻,表明Shap-E能够生成具有各种形状和纹理的高质量3D资产。以下是这篇文章的一些要点:

(1)Shap-E是一个用于3D资产的条件生成模型。(2)Shap-E直接生成隐含函数的参数,可以渲染成纹理网格和神经辐射场。(3)Shap-E的训练分为两个阶段:一个编码器被训练成确定性地将3D资产映射成隐式函数的参数,一个条件扩散模型被训练成编码器的输出。(4)Shap-E能够生成具有各种形状和纹理的高质量三维资产。

关闭
观看更多
更多
正在加载
正在加载
退出全屏

视频加载失败,请刷新页面再试

1685028198910.png 刷新

1685028201261.png

结语:

Bard预计很快实现多应用加持的生态融合。谷歌产品主管、Bard的负责人Jack Krawczyk称,在接下来的几个月里,谷歌将使通过Google Lens工具,让Bard看懂图片提示。未来,Bard不仅能将谷歌地图、文档、表格和 Gmail的信息带入对话中,还会Adobe等第三方工具的帮助下回复用户,比如借助Adobe的生成式 AI服务Firefly,根据文字描述创建图像。

PaLM 2标志着谷歌大语言模型的小型化”方面已取得非常重要的进步PaLM 2包含的模型中最轻量版本Gecko小到可以在手机上运行,能够在离线状态的移动设备端快速运行、与应用程序交互,这一进步有望加速AIGC在移动端的开发进程。

1685028205355.gif

Duet AI助力无代码构建应用,A3超级计算机虚拟机确保算力供给。Duet AI的任务是提供AI驱动的崭新云体验,将开发者从大量的代码工作中解放出来。Duet AI会涵盖谷歌的各种办公软件,包括在文档和Gmail中的写作辅助、幻灯片的图片生成、自动会议摘要等等。下图为Duet AI根据描述自动生成表格:

在算力方面,谷歌云宣布推出A3超级计算机虚拟机,专为提供最高性能的机器学习工作负载培训而设计,搭载英伟达H100 GPU、第四代英特尔Xeon可扩展处理器,与谷歌专门的数据中心结合,提供高达26 exaFlops 的算力,减少训练更大模型的时间和成本。

来源:Google Cloud官网

PaLM 2的发布是自然语言处理技术向更智能化、人性化方向转变的又一个里程碑,生成式AI与搜索等多种应用的结合将颠覆传统的使用理念与模式。从ChatGPT横空出世让AIGC在全球爆火,到如今PaLM 2等各类模型的惊艳亮相,多模态AI模型有望成为继移动互联网之后新的技术平台,并通过市场进一步验证更多场景的应用效果

视频加载, 刷新页面, 再次尝试

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *