文章主题:燧原科技, 数据, AI芯片, 新基建
– 燧原科技 –
“数据”,这个由人类创造出的资源,在算力的推动下,已经揭开了探索数字经济新模型的序幕。以数据中心和智能计算中心为代表的算力基础设施,以及人工智能(AI)产业,在“新基建”的推动下,即将迎来爆发式的增长。而这一切的基础,是AI芯片,这是它们共同依赖的核心硬件。
“高举高打”
挑战云端AI训练芯片
在实现云端AI的过程中,有两个关键步骤:训练与推理。为了建立神经网络模型,我们需要先设计一款专用的训练芯片。这款芯片的主要任务是利用海量的数据进行训练,以便对模型进行精确的训练(Training)。这个过程可能会花费数天的时间,期间需要将大量的数据输入到芯片中,使其完成繁琐的运算。当训练完成后,我们就可以利用训练好的模型来应对实际的请求。此时,只需将新的数据输入到模型中,它就能根据训练好的参数“推断”出各种结论。在这个过程中,训练芯片与推理芯片共同发挥作用,为云端AI提供了强大的计算能力。
▲图1:AI训练和推断的区别和联系。来源:腾讯云社区云端训练芯片的开发是一项极具挑战性的任务,它面临着高度的壁垒、漫长的开发周期以及严格的要求,这需要运用最先进的半导体工艺和高级封装技术。此外,为了实现最佳性能,还需要强大的配套软件支持。值得注意的是,芯片的大小直接决定了设计的复杂程度,其难度甚至呈现出指数级的增长。以AI训练芯片和AI推理芯片为例,两者之间的难度差异就如同建造一栋70-80层的摩天大楼与一栋20-30层的公寓楼之间的差距。过去五年中,我国新增的AI研发类初创公司数量达到了上千家,其中云端推理领域的发展尤为繁荣,竞争激烈。然而,针对云端训练的初创芯片公司却屈指可数。
在2019年12月11日,我国知名科技公司燧原科技推出了首款云端AI训练芯片——”深邃之思”。这款芯片的性能表现不仅在国内同类型产品中独树一帜,就是在全球范围内,它的算力也堪称顶级。对此,燧原科技的两位创始人以实际行动证明了自己的能力,他们不仅是有远见卓识的领导者,更是能够付诸实践的执行力者。 Portfolio Management Office(PMO)负责人Tina在接受采访时分享了自己与燧原科技的结缘过程,”大约两年前,AI训练芯片领域还处于起步阶段,尽管面临巨大的挑战,但我对燧原科技的技术实力和他们的过往工程实战经验有着充分的了解。我坚信,我们有能力和智慧抓住这个市场的机会。因此,在我加入燧原科技仅仅三个月之后,我们就一起迎接了这场挑战。”
新创公司能够在短短18个月内成功推出云端AI训练芯片,其背后不仅取决于燧原创业团队多年的技术积累,更在于该公司对科学工程化方法学的给予了足够的重视。相比之下,我国IC设计产业普遍存在着这一方面的不足,然而,这却是打造强大”芯”产品的必经之路。
PMO:
让公司的每一个项目都成功
在军事行动中,情况瞬息万变,要想在战场上获得胜利,正确的方向、团队间的协同合作以及稳扎稳打的战略思维至关重要。PMO的最终使命在于,通过逐步攻占各个山峰,带领团队克服重重困难,最终实现公司在各个关键项目的成功。这需要我们扎实前行,不断努力,以达到最终的目标。
▶战略决策支持
使公司战略与项目执行形成信息双向反馈,帮助公司做出正确的决策,并确保公司的战略落实到项目,做到战略和执行的闭环。
▶ 端到端项目管理
PM对每个项目进行完整生命周期的管理,以纵观全局的角度,高效协同多个项目;以客户需求为导向,对项目做好风险把控,最终保证项目高效地执行并成功地交付。
▶ 最佳实践中心
建立最佳实践与集训中心机制,保证燧原各项目之间的成功可复制、经验有传承。
▲ 图2:燧原科技的PMO闭环模型PM是运筹帷幄的军师,在分析事实、问题折叠与拆解、资源配置的每一步路上,必须拥有全局观、对产品有完整的理解及敏锐的洞察力,一如Tina领导的PMO“军师联盟”始终在正确的道路上航行,与各环节团队并肩作战,完成一个个项目的攻坚。
在探索和创新的过程中
方法学就是工具
相比成熟的大芯片公司,全新的架构、团队及有限的资源,燧原的创芯之路也并不平静。回望一路经历的挑战,在项目执行的过程中保持团队的高度协调、保持效率,保证最终按时按质的完成交付,燧原已经熔炼出一套独门心法。
“大概在2018年11、12月前后,整个芯片的开发临近设计冻结的里程碑,理论上来讲这个时间点所有的设计、所有的IP应该都已经完成了开发,只需要进行最终一轮集成,就可以进入流片前的最后一轮物理实现阶段。这时出现了突发状况,一个非常关键模块的验证出现延迟,同时又产生了功能变更的新需求,一旦解决不好,不仅项目计划会延期,甚至流片后的产品质量也将难以保证。”当时的挑战还历历在目,Tina条理清晰的复盘了当时的举措:
Reset
重新梳理需求的优先级,快速锁定,把需求的串扰先解决掉;
Prioritize
把已经出现的所有问题再次梳理,在资源和时间有限的情况下抓大放小,先解决主要矛盾;
Reorganize
对资源进行了重新配置,把非关键路径上的资源调度到关键路径上来,优先解决重要的事情;
Plan
对整个项目下游的所有环节做详细的统筹规划,确保可以最大程度上把这个模块对于系统可能会出现的影响消解掉。
完善的方法学离不开EDA工具和平台的配套支持,“新思科技完整的工具链和成熟稳定的IP,帮助我们在架构设计前期就能验证架构思路,并且加快SoC的收敛;从软硬件迭代的角度,借助新思的VDK平台、ZeBu平台和技术支持,我们使软件开发测试工作提前了三个月以上,极大缩短后续硬件加速器或者FPGA平台上的软硬协同验证的时间。“在Tina看来,评估并聚合资源以保障项目进度与质量,对复杂的AI训练芯片能加速面世尤为关键。
燧原用18个月的时间,向行业展示了其过硬的研发实力,但作为一家云端AI芯片的初创公司来说,真正硬核的是燧原科技“靠谱” 的团队DNA,完整的工程化方法学加持高效专业的团队,每一个细节都在为成功加码。
迎接芯片PM大时代
今年3月,国家提出了加快新型基础设施建设(“新基建”)的战略目标,作为云端训练芯片的主战场,人工智能和数据中心均被列为重点发展方向。AI市场需求不断扩大,其需求的多样性也在增加,全新业务场景、业务模型、技术框架随之而来,推动芯片公司必须推出更加创新的架构和设计,以及始终不变的——更快、再快的市场需求响应速度。
面对这些挑战,需要整个上下游产业链共同发力——成熟创新的优秀人才、与时俱进的EDA工具、稳定可靠开放的IP核、先进的制造和封装技术、更好地协作方式和技术支持等,共同赋能芯片开发,达到缩短设计周期,实现更可控的、风险更低的开发过程。
从职业发展角度出发,Tina也谈到身为一位PM的自我修养:“PM需要一定的技术背景,因为在带领项目的过程中,需要和研发团队无缝交流;此外,对PM这个角色以及对集成电路这个行业来说,终身学习是我们所有人都需要拥抱的一个行业特质,终身学习的能力和个人愿望非常重要。当然还有一些像沟通能力、组织能力、逻辑思维能力等基本素质必须过关。”
在复杂度呈指数升级的后摩尔时代,正有这样一群默默奉献的人也开始成为创“芯“的中流砥柱,为IC开发项目的成功保驾护航。伴随国家和社会对人工智能和集成电路产业的重视加深,两大领域的前景一片欣欣向荣,然而关注度的爆发改变不了芯片开发周期长、投入大、风险高、复杂度高的事实。Tina展望道:“若想做好芯片,除了技术扎实之外,对于科学、完善的项目管理体系的重要性,我想业内越来越多有识之士也认识到了这一点。这背后也会对PM这个职业有一个正向的促进作用,我相信未来会有越来越多优秀的人才加入到PM这个岗位中来,一同推动集成电路行业的繁荣发展。”
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!