最新中文大模型测评:腾讯混元稳居第一梯队
AI排名

最新中文大模型测评:腾讯混元稳居第一梯队

最新中文大模型测评:腾讯混元稳居第一梯队,语义理解能力国内第一。 近日,国内权威的大模型评测机构SuperCLUE发布了《中文大模型基准测评2024年度4月报告》,报告显示,腾讯混元大模型不仅稳居第一梯队,而且位于卓越领导者象限,这是继上次国际权威调研机构沙利文的评测之后,腾讯混元大模型又一次低调展现了在基础技术和场景应用上的优势。 据了解,SuperCLUE是国内权威的通用大模型综合性测评基准,本次测评是多层次、多维度的综合性测评,选取了国内外32个大模型4月份的版本,客观真实地反映了大模型在中文领域的综合能力和发展现状。 评估报告显示,腾讯混元大模型各项能力都十分出众,尤其是在语义理解能力方面表现突出,以75.4的高分排名国内第一。除此之外,在角色扮演、安全能力、计算、逻辑推理、工具使用、长文本能力等方面,腾讯混元大模型也均处于国内一流水平,稳坐领先地位。 腾讯混元大模型的成功不仅得益于其持续的技术创新和优秀的性能表现,更得益于腾讯在全链路自主可控技术上的深厚积累。从底层算力到机器学习平台再到上层应用,腾讯混元大模型通过持续迭代和实践,积累了完整的自主技术。比如,其自研的星脉高性能计算网络为AI大模型带来了10倍通信性能提升,训练速度是主流框架的2.6倍,推理成本相比业界主流框架下降70%。此外,腾讯混元大模型率先采用混合专家模型结构,使模型总体效果相比上代模型提升50%。 在应用方面,腾讯混元大模型已经支持了腾讯内部超过400个业务和场景接入,并实现了智能化升级。同时,腾讯混元也已经通过腾讯云面向企业和个人开发者全面开放,为更多用户提供优质的大模型服务。 综合而言,腾讯混元大模型以各项出众的能力,稳居国内第一梯队的地位和卓越领导者象限的表现,再次证明了其在国内大模型领域的领先地位。不难预测,作为腾讯在自主可控技术上的杰出成果,腾讯混元大模型将在未来继续引领行业发展,为用户带来更优质、更智能的服务体验。#腾讯混元再度领跑最新中文大模型测评#
能看长图文会听长语音,讯飞星火大模型有了新变化
星火

能看长图文会听长语音,讯飞星火大模型有了新变化

4月26日,讯飞星火大模型V3.5(以下简称“讯飞星火”)春季上新。科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速学习,还能够在各种行业场景给出专业回答。 面向企业应用场景,科大讯飞推出星火智能体平台,帮助企业解决大模型落地的“最后一公里”难题。 科大讯飞分析发现,在知识获取和学习的过程中,广大用户能拿到的资料往往不仅是现成的长文本,还有随手可见的报刊书籍内容、各种研讨会的PPT内容,老师黑板上的板书、同学的笔记,以及各种会议录音、访谈,各种网上的发布会、培训教育视频等。此次推出的首个支持长文本、长图文、长语音的大模型,来解决用户真实场景中多源信息的获取需求。 同时,科大讯飞进一步升级星火语音大模型,首发多情感超拟人合成,具备情绪表达能力,并推出一句话声音复刻功能,让科技更有温度。 除了超拟人对话,科大讯飞还推出“一句话声音复刻”功能,一句话就可以定制你的AI助手声音。比如模仿小朋友的声音,每天给爷爷奶奶读书读报;在我们出差的时候,模仿我们的声音给孩子讲故事。这个功能可以让世界变得更有温度。 用技术进步解决真实刚需,讯飞星火也在获得更多用户认可。据七麦数据显示,讯飞星火APP在安卓端的下载量已经超过9600万次,在国内工具类通用大模型APP中排名第一。 讯飞星火APP数据透露,用户使用的最高峰不是周末,而是工作日的上午9:30和下午3:30。这表明,大部分用户用讯飞星火来解决和工作相关的刚需问题。 科大讯飞还透露,将在6月27日发布讯飞星火大模型V4.0,进一步释放想象力。 南方+记者 郜小平 【作者】 郜小平 【来源】 南方报业传媒集团南方+客户端
阿里云通义万相开启定向邀测,国内第二款AI绘画工具是否能超越文心一格?
文心一言

阿里云通义万相开启定向邀测,国内第二款AI绘画工具是否能超越文心一格?

阿里云推出AI绘画创作模型"通义万相",基于组合式生成模型Composer,旨在辅助图片创作,应用于多场景,标志着其大模型家族的第三位成员。该应用已开启定向邀测,虽相较于国外产品仍有提升空间,但首批功能包括多种风格图像生成和相似图片生成功能,如图像风格迁移,显示了技术的进步。国内AI文图处理市场竞争激烈,尽管距离商业应用尚有距离,但AI技术的快速迭代令人期待其未来发展。
2024年全球大模型争霸赛!揭秘年度最佳榜单,谁将引领未来AI潮流?
AI排名

2024年全球大模型争霸赛!揭秘年度最佳榜单,谁将引领未来AI潮流?

2024年全球最佳大模型排行榜涵盖多个领域,OpenAI GPT-5凭借其强大的通用性和创造性位居榜首;Claude 3 Opus因其高精度和多语言能力受到认可;百度文心一言作为本土化优秀代表,在中文场景中表现出色且已商业化。各模型在性能、应用广泛度和市场影响力上展现出行业领先,但选择时还需综合考虑任务需求和实用性。AI技术持续进步预示着未来将有更多创新大模型涌现。