文章主题:以下是文章中的关键词:
Meta, CMU, RoboAgent, 通用机器人智能体
作者:子渝
编辑:沈筱
Meta 联手 CMU 打造「通用机器人智能体」RoboAgent
在8月21日的消息报道中,Meta与CMU的研究团队合作用了两年时间,成功设计出一款名为RoboAgent的通用机器人智能体。这款智能体的独特之处在于,它仅通过7500个轨迹的训练就能实现12种不同的复杂技能。为了增强数据集,该团队还采用了离线添加不同变化场景的方法,同时利用动作分块Transformer模型来处理多任务数据。这些复杂技能包括但不限于烘焙、拾取物品、上茶和清洁厨房等,并且该智能体能够在100种未知场景中进行泛化应用。
https://www.chinaz.com/2023/0821/1552733.shtml
英国计划斥资 1.3 亿美元购买数千颗高性能人工智能芯片
在8月21日的消息 reported,英国首相里希·苏纳克(Rishi Sunak)正打算投入巨资13亿美元(约1亿英镑),以期在全球计算能力竞赛中占据有利地位。 reports 指出,这笔巨额资金将主要用于向芯片制造商英伟达、AMD以及英特尔采购数千颗高性能人工智能(AI)芯片。值得注意的是,英国科学研究基金机构英国研究与创新(UK Research and Innovation)已经进入了订购5000个英伟达GPU的后期阶段。
在现代社会中,科技的发展日新月异,尤其是在人工智能领域,不断有新的技术涌现。其中,深度学习作为人工智能的一个重要分支,近年来得到了广泛的关注。深度学习技术能够模拟人脑神经网络的结构和功能,通过大量的数据训练,使其具备图像识别、语音识别、自然语言处理等多种能力。尤其是计算机视觉领域,深度学习技术已经取得了显著的成果,被广泛应用于无人驾驶汽车、医疗影像诊断、安防监控等领域。然而,尽管深度学习技术具有诸多优点,但在实际应用过程中,仍然存在许多挑战和问题。例如,深度学习模型的训练过程通常需要大量的计算资源和时间,且容易出现过拟合现象;此外,深度学习模型的可解释性较差,难以解释模型是如何做出预测的。因此,如何提高深度学习模型的性能和可解释性,成为当前人工智能领域亟待解决的问题之一。为了解决这些问题,研究人员开始探索将其他机器学习技术融合到深度学习中,以提高模型的泛化能力和可解释性。例如,迁移学习、对抗训练等技术已经被应用于深度学习模型中,取得了一定的效果。同时,一些新型的深度学习架构也开始出现,如EfficientNet、Xception等,它们在保持较高准确率的同时,能够显著降低计算复杂度和训练时间。总之,深度学习技术在人工智能领域具有广阔的应用前景,但仍需要不断地改进和完善。通过研究和应用新的技术和方法,我们有信心在未来实现更加智能化的世界。
英伟达和 VMWare 合作推出定制化 AIGC 服务
在8月22日星期二,我国知名科技公司英伟达(NVIDIA)与软件制造商VMware宣布进一步加深合作,共同研发全新的软件平台,旨在为企业用户提供更为安全且定制的生成式人工智能(AI)服务。据双方透露,这些AI模型将充分利用用户独特的数据资源,为企业内部打造专属的人工智能解决方案。英伟达透露,为了推动这一服务的实施,预计将于今年底推出由戴尔、惠普和联想等厂商生产的支持人工智能的服务器。这些服务器将采用英伟达的企业级软件、L40S图形处理单元以及BlueField-3数据处理单元,从而确保AI模型的高效运行和优化性能。
在现代科技迅速发展的今天,人工智能的应用已经渗透到各行各业。其中,生成对抗网络(GAN)作为一种强大的深度学习技术,正逐渐成为企业们关注的焦点。NVIDIA与VMware的联手,更是将生成对抗网络技术应用到了一个新的高度,为企业提供了更为便捷、高效的AI解决方案。首先,我们来了解一下生成对抗网络(GAN)。它是一种利用两个神经网络相互竞争来生成新的数据样本的算法。一个神经网络会尝试生成与真实数据相似的数据样本,而另一个神经网络则会被训练去区分这些数据样本的真假。在这种竞争过程中,两者不断相互学习和优化,最终使得生成器能够生成更为逼真的数据样本。生成对抗网络具有强大的生成能力,可以应用于图像、语音等多种类型的数据生成任务。NVIDIA与VMware的结合,正是为了将生成对抗网络技术更好地服务于企业用户。通过双方的技术整合,企业可以将生成对抗网络应用于诸如图像识别、自然语言处理等实际业务场景中,从而提高工作效率、降低成本。同时,这种合作也标志着我国在AI领域的技术创新和发展进入了一个新的阶段。总之,NVIDIA与VMware的联手为生成对抗网络技术的发展注入了新的活力,也为企业用户带来了更为便捷、高效的AI解决方案。我们有理由相信,随着这种技术的不断成熟和应用,它将在未来的发展中扮演越来越重要的角色。
钉钉宣布开放 AI PaaS,多产品线与场景接入大模型
在 2023 年 8 月 22 日,上海张江科学会堂见证了钉钉生态大会的盛大开幕。此次大会,钉钉正式对外宣布了其智能化底座能力的开放,这标志着钉钉的智能化进程已经步入生态层面。此外,钉钉还向我们展示了其智能化的最新成果:目前已经有 17 条产品线和 55 个场景全面接入了大模型。值得一提的是,钉钉还在行业内率先提出了大模型落地应用场景的商业化解决方案。这个方案是在原有的收费版钉钉基础上,通过配置大模型调用额度来实现。据计算,调用一次大模型所产生的费用不到 5 分钱。
https://www.ithome.com/0/714/406.htm
DeepMind 推出强化学习算法 ReST,使 LLM 输出与人类偏好更一致
8 月 22 日消息,DeepMind 推出了一种新的强化学习算法 ReST,目的是使大语言模型(LLM)的输出与人类偏好更为一致。ReST 的核心是将数据集增长和策略改进分为两个离线阶段。实验结果显示,ReST 在机器翻译任务上表现卓越,显著提高了翻译质量,且与在线 RL 方法相比,ReST 在人类评分上更胜一筹。
https://finance.sina.com.cn/tech/roll/2023-08-22/doc-imziaace4562397.shtml
昆仑万维发布 AI 搜索产品 ” 天工 AI 搜索 “
8 月 23 日消息,昆仑万维今日宣布,正式推出国内第一款融入大语言模型的搜索引擎 —— 天工 AI 搜索,并开启内测申请。据官方介绍,传统搜索引擎基于关键词匹配,即根据用户输入的关键词识别检索范围,并匹配可能符合用户意图的海量信息。而基于大模型能力的 AI 搜索是一种生成式搜索,用户可通过自然语言清晰表达自己的意图,并获得有效组织和提炼后的答案。
https://www.ithome.com/0/714/236.htm
Hugging Face 获 2 亿美元 D 轮融资,Salesforce 领投
8 月 23 日消息,开源模型库公司 Hugging Face 获 2 亿美元 D 轮融资,本轮融资由 Salesforce 旗下投资机构 Salesforce Ventures 领投,Salesforce CEO Marc Benioff 在其 X 上证实了这一消息。本轮融资完成后,Hugging Face 估值将达 40 亿美元,相比去年 5 月由 Lux Capital 领投,红杉资本、Coatue Management 跟投 1 亿美元的 C 轮融资,其估值增长了一倍。
https://www.36kr.com/p/2400225043013763
IBM 在中国启动新一代 AI 与数据平台 watsonx
8 月 23 日,IBM 在北京召开新闻发布会,宣布启动新一代 AI 与数据平台 IBM watsonx 在本地市场落地,为企业级基础模型和生成式 AI 提供动力。这是继红帽 OpenShift 开放式混合云技术平台之后,IBM 落地大中华区市场的又一个具有里程碑意义的开放式 AI 技术平台。与 IBM 混合云平台一样,watsonx 也是基于领先的企业级开放技术,也是以平台的方法,通过构建和扩展广泛而强大的生态,把 IBM 从存力、算力、企业级 AI 应用到咨询服务的全栈能力,以及源自 IBM 研究院的前沿 AI 创新技术(如基础模型与生成式 AI),交到企业手中。
https://china.newsroom.ibm.com/2023-08-23-IBM-watsonx,-AI
Meta 发布 AI 模型 SeamlessM4T,可转录和翻译近百种语言
8 月 22 日消息,Meta 发布了一种能够翻译和转录数十种语言的人工智能模型 —— SeamlessM4T,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。Meta 声称,SeamlessM4T 将与新的翻译数据集 SeamlessAlign 一同开源,它代表了人工智能驱动的 ” 语音到语音 ” 和 ” 语音到文本 ” 领域的 ” 重大突破 “。该模型可以在近 100 种语言之间进行文本到语音的翻译,并支持 35 种语言的完全语音到语音翻译,是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270000 小时。
https://techcrunch.com/2023/08/22/meta-releases-an-ai-model-that-can-transcribe-and-translate-close-to-100-languages/
Meta 推出 AI 编程工具 Code Llama
8 月 24 日消息,Meta 现推出了名为 Code Llama 的 AI 编码工具,号称 ” 最先进的大型编码语言模型 “。该模型基于 Llama 2 大型语言模型打造,可以理解为 “Llama 2 的写代码专用版 “,可用于 ” 生成新的代码并调试人类编写的工作 “,目前已上线 Github。Meta 指出,Code Llama 能够根据代码自然语言提示 / 要求生成用户想要的代码和有关代码的自然语言,或者在指向特定代码时进行完善和调试。除了基础版的 Code Llama 外,Meta 还推出了专为 Python 设计的版本 —— Code Llama-Python,以及一个能够理解自然语言指令的版本 —— Code Llama-Instrct。
https://techcrunch.com/2023/08/24/meta-releases-code-llama-a-code-generating-ai-model/
谷歌计划推出针对 Google Workspace 的 AI 驱动安全增强功能
8 月 24 日消息,谷歌宣布将大幅增强 Google Workspace 产品的安全能力,特别是利用人工智能防止企业云数据的泄露。谷歌表示,将在云硬盘 Drive 中利用 AI 技术实现对敏感企业数据的自动分类及标记,并可设置基于风险级别的不同数据访问控制,从而有效防止企业敏感数据的泄露。同时,Gmail 也将新增数据丢失防护功能,帮助企业管理员更好地阻止用户无意间通过邮件发送敏感数据。
https://techcrunch.com/2023/08/23/google-plans-to-bring-ai-fueled-security-enhancements-to-google-workspace/
OpenAI 与 Scale AI 合作,支持企业使用专有数据训练模型
8 月 24 日消息,OpenAI 近日宣布,和数据标注服务初创公司 Scale AI 展开深度合作,将 Scale AI 的微调工具和 OpenAI 的 GPT-3.5 文本生成模型结合在一起,允许企业使用其专有数据来训练模型并大规模运行,使开发人员能够针对特定任务定制微调 AI 模型。
https://www.ithome.com/0/714/936.htm
Open AI 寻求中东千亿美元融资
8 月 24 日消息,据创投圈知情人士透露,OpenAI 首席执行官山姆 · 奥特曼下半年奔赴阿联酋首都阿布扎比等地寻求融资,不低于千亿美元。据悉,山姆奥特曼描述 OpenAI 的目标可能是要实现比人类更高级的智能。但要实现 Super intelligence(超级智能)这一目标,还非常遥远,OpenAI 需要的资金规模不可想象。
https://new.qq.com/rain/a/20230824A01F8100
联发科将推出新一代旗舰移动芯片,支持由 Llama 2 模型开发的 AI 应用
8 月 24 日,MediaTek 宣布利用 Meta 新一代开源大语言模型(LLM)Llama 2 以及 MediaTek 先进的 AI 处理器(APU)和完整的 AI 开发平台(NeuroPilot),建立完整的终端侧 AI 计算生态。MediaTek 将于年末推出新一代旗舰移动芯片,采用针对 Llama 2 模型而优化的软件栈(NeuroPilot),与搭配支持 Transformer 模型做骨干网络加速的升级版 AI 处理器(APU),可减少动态随机存取内存(DRAM)的读写消耗和带宽占用,进一步强化大语言模型和生成式 AI 应用的性能。预计年末采用 MediaTek 新一代天玑旗舰移动芯片的智能手机支持由 Llama 2 模型开发的 AI 应用,可为用户带来生成式 AI 应用体验。
https://corp.mediatek.cn/news-events/press-releases/mediatek-leverages-metas-llama-2-to-enhance-on-device-generative-ai-in-edge-devices
韩国互联网巨头 Naver 推出生成式 AI 服务平台
8 月 24 日 消息,韩国最大搜索引擎 Naver 推出自己的生成式人工智能服务 HyperCLOVA X,该产品包含聊天机器人应用程序 CLOVA X,旨在改进网络搜索、在线购物和导航服务,核心是将为用户提供生成式人工智能驱动的搜索功能,并为企业客户提供新的定制服务。Naver 将从 8 月 24 日开始 CLOVA X 的公开测试,9 月启动 Cue 的测试。Naver 及其国内竞争对手正着眼于美国和中国科技巨头尚未涉足的细分市场。例如, Naver 希望为政治敏感的中东国家以及非英语国家和地区如日本和东南亚开发本地化的 AI 应用。
https://techcrunch.com/2023/08/24/koreas-internet-giant-naver-unveils-generative-ai-services/
好未来正式推出数学领域千亿级大模型 MathGPT
8 月 24 日,在好未来 20 周年直播活动中,CTO 田密宣布好未来自研的数学领域千亿级大模型 MathGPT 正式推出并开启内测。MathGPT 是由好未来在今年 5 月公布的其公司自研数学大模型,面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型,也是国内首个专为数学打造的大模型。MathGPT 在多项基准测试中表现超越 GPT-4,刷新了 SOTA 记录。
https://www.chinaz.com/2023/0824/1553665.shtml
三星计划公布类 ChatGPT AI
8 月 24 日消息,近日,根据外媒报道,三星计划在 9 月 12 日举办的 Real Summit 2023 活动中,展示自家的类 ChatGPT 生成式 AI。据悉,该 AI 现阶段将主要为三星内部员工提供服务,带来诸如化编程代码、撰写电子邮件、记录文档摘要等功能。这将有效提升三星员工的工作效率。
http://www.techweb.com.cn/it/2023-08-24/2932535.shtml
小红书旗下公司新增 AI 软件业务
8 月 24 日消息,天眼查 App 显示,近日,小红书科技(珠海横琴)有限公司发生工商变更,经营范围新增数字技术服务、人工智能应用软件开发、人工智能基础软件开发、软件销售、珠宝首饰批发、汽车零配件批发等。该公司成立于今年 6 月,注册资本 5100 万人民币,法定代表人为王晓博,由小红书科技有限公司全资持股。
https://www.donews.com/news/detail/8/3660907.html
阿里巴巴国际站发布外贸 AI 产品
8 月 24 日,外贸行业首个 AI 应用落地,阿里国际站发布全链路 AI 产品。据悉,该产品与数字外贸全链路紧密结合,包含生意助手和 OKKI AI 两大服务,拥有智能商品发布与管理、市场分析、客户接待、视频聊天实时翻译、企业管理等多项功能,覆盖外贸生意所有环节。这是 AI 在外贸产业中的首次全面应用,将让 AI 真正成为每个出海企业的帮手。
https://www.sohu.com/a/714430368_114984
阿里云开源多模态视觉模型 Qwen-VL,新增视觉定位等能力
8 月 25 日消息,阿里云推出了大规模视觉语言模型 Qwen-VL,目前已经在 ModeScope 开源。阿里云此前已经开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。据悉,Qwen-VL 是一款支持中英文等多种语言的视觉语言(Vision Language,VL)模型,相较于此前的 VL 模型,其除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力。
https://www.alizila.com/alibaba-cloud-launches-open-source-models-that-understand-image-content/
奇安信发布 Q-GPT 安全机器人和大模型卫士
8 月 25 日消息,奇安信集团发布 Q-GPT(奇安信大模型)安全机器人和大模型卫士。据介绍,Q-GPT 安全机器人是基于奇安信大模型的 ” 虚拟安全专家 “,可以全天候工作,一台机器人等于 60 多位安全专家,可产生约 2000 万元的运营效益,极大提升了生产力。大模型卫士集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源、大模型应用分析等为一体,帮助企业更安全的向大模型要生产力。
http://www.techweb.com.cn/internet/2023-08-25/2932616.shtml
澜舟科技正式发布百亿参数大模型 ” 孟子 GPT-40B”
8 月 28 日消息,澜舟科技旗下国产百亿大模型孟子 GPT-40B 昨日正式发布,参数数量达到 400 亿,各项任务平均提升 10-15%。孟子 GPT-40B 在中文及多语言能力、写作、多轮对话等方面都有提升,接近 ChatGPT-3.5 的水平。澜舟科技还同步发布了基于孟子 GPT 的金融大模型和会议内容分析平台 ” 澜舟智会 “,未来将提供基础模型、大模型训练框架 / 工具包等服务。
https://www.chinaz.com/2023/0828/1554296.shtml
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!