多模态升级的讯飞星火V2.0：打造有血有肉的三维虚拟世界

文章主题：一站式图文, 视频创作, 讯飞星火V2.0多模态能力

一站式图文、视频创作，讯飞星火V2.0多模态能力重磅升级

大模型通常被认为是无生命力的代码，但事实上，它们也能塑造出具有“血肉之躯”的形象。在8月15日的科大讯飞星火认知大模型V2.0升级发布会上，我们得以一窥虚拟主播以全新的形式向世人展示世外桃源“桃花潭”的壮丽景色，并见证了虚拟外教与刘聪院长进行口语交流时的炫酷表现。这些应用场景的实现，都离不开星火V2.0在多模态能力上的突破，从而使得视频内容制作和英语学习效率得到了显著提升。

中金研报曾经提到，随着大模型等技术的支持，虚拟角色能够实现与用户的实时智能互动，这将极大地增强用户的体验感，从而激活一个庞大的市场潜力。值得注意的是，科大讯飞公司凭借其星火多模态技术，率先将其应用于视频内容生产领域。根据我国电子信息产业发展研究院发布的预测数据，到2023年，我国超高清视频产业的规模有望达到4万亿元。此外，视频产业链条覆盖了生产、分发、消费等各个环节，其中仅生产环节市场规模就从2016年的19亿元激增至2022年的3860.7亿元，年均复合增长率高达222.34%。

讯飞星火认知大模型依托多模态技术，成功实现了“虚拟主播”的出镜，这一创新性的应用极大地提升了视频内容的质量和新颖度。不仅如此，该技术还具备化身为“景点导游”、“室内导览”以及“银行客服”等多重身份的能力，从而在旅游、展览、金融等多个领域展现出其巨大的价值。据相关资料显示，科大讯飞虚拟人服务已经在各行各业广泛应用，并且与新华社、央视动画、中信银行、中国平安等知名企业建立了合作关系。此外，讯飞虚拟人技术还在北京冬奥会、成都大学生运动会等世界级的体育赛事中得到了精彩的展示。

在科大讯飞星火V2.0发布会上，该企业采取了一项旨在极度简化了使用难度的策略，升级了其讯飞智作2.0一站式AIGC内容创作平台。借助这个平台，用户只需录制一段长度在3到10分钟之间的视频，然后将其上传至讯飞智作2.0平台进行训练。经过这样的操作，系统就能生成一个与真人完全相似的虚拟数字分身，实现了1:1的比例。此外，用户还可以根据需要选择不同的配音风格，赋予虚拟人物多元化的情感表现力。通过这种方式，虚拟人物的语气、语调以及停顿都可以根据内容本身的情绪进行调整，从而呈现出更加生动且充满温情的表演。

在2023年的下半年，许多同类大模型还在文本的“二维”层面挣扎时，我国讯飞星火认知大模型已经突破性地进入了音画“三维”领域，成功实现了AIGC技术在内容生产以及各个行业的“智慧涌现”。与此同时，讯飞星火助手中心所上线的一千多个智能助手，全方位地满足了职场、营销、创作等各类场景的需求，有效地助力了职场人士提升工作效率，降低了时间的成本。在这个时代，时间无疑是最宝贵的资源。

如今，大模型正在悄无声息、却又影响深远地改变着人类世界。面向未来，正如讯飞董事长刘庆峰所期盼的那样：“今天讯飞星火2.0发布后，我们还会迎来3.0、4.0，希望到那时你已经成为了我们的伙伴，无论是API的开发伙伴、共建行业生态的伙伴、还是做最终应用的伙伴，相信都将成为在星火赋能之下工作和生活更幸福的伙伴。”返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复