我曾经于英特尔设计CPU,厥后(2004年)插手Arm时,x86仍是绝对于主流,但Arm经由过程 Arm-Android生态 构建了更开放的系统,也由于如许的 开放 撑持了其时许多财产开拓者的发展及乐成。 吴雄昂(AllenWu),这位前安谋科技(ArmChina)董事长兼CEO的职业生活生计迁移转变点,折射出行业对于 开放 的巴望, 现如今不管是至公司还有是创业公司,都认为AI需要新架构;而新架构一定是交融架构,是以必需具备更年夜的开放性 这也是咱们选择RISC-V的主要缘故原由。RISC-V的完全开源性,闪开发者真正成为生态的主人 你能想到的需求,都能于RISC-V架构里实现,由于它不受限。 于7月的中国RISC-V峰会上,咱们碰到了久未于行业中露面的Allen,他如今的身份已经经是CoreLabTech董事长 一家专注在RISC-V处置惩罚器IP及计较平台方案的科技立异企业。与他一路的还有有Tenstorrent首席架构师练维汉(Wei-HanLien)及Tenstorrent产物战略副总裁AniketSaha 这是一家于业内有 硅神仙 之称的JimKeller开办的RISC-V芯片公司。 CoreLabTech董事长吴雄昂(AllenWu) 于这场对于话中,《电子工程专辑》与几位CPU行业的年夜佬配合切磋了RISC-V的突起和其对于AI时代的深远影响,不仅展现了RISC-V的焦点价值,也折射出全世界半导体行业从关闭到开放的范式改变。 吴雄昂的行业履历可谓Arm架构于中国成长的缩影,2006年他回国时,中国的半导体行业还有处在成长早期,Arm经由过程与Android的联合,构建了一个比x86更开放的生态体系,从而于挪动装备上取患了巨年夜乐成。 作为 Arm-Android生态 重塑挪动计较格式的亲历者,吴雄昂谈和为什么转向RISC-V时,谜底直指开放性的素质: Arm的生态虽然开放,但素质上仍是一种贸易化的架构。而RISC-V的开放性是完全的 它的指令集是开源的,开发者可以自由修改、定制,甚至创造属在本身的架构。这类无穷制的自由,恰是AI时代立异的要害。 吴雄昂的判定并不是孤例。练维汉曾经担当苹果公司芯片架构师,主导AppleSiliconA系列芯片的研发,后插手Tenstorrent介入RISC-V架构的AI芯片设计。他指出: 于苹果时,咱们寻求的是尺度化及效率。但AI的需求是高度定制化的,传统架构的关闭性反而成为立异的镣铐。RISC-V的模块化设计答应咱们于硬件层面矫捷调解,例如针对于特定算法优化数据流路径,这于x86或者Arm架构下险些不成能实现。 Tenstorrent首席架构师Wei-HanLien AniketSaha也曾经于Arm公司事情多年,卖力高级安全产物线,厥后看到RISC-V架构作为新兴技能的潜力,插手了Sifive公司,以后又于英特尔公司卖力晶圆代工办事(IFS)的RISC-V战略结构。他从财产生态的角度增补道: RISC-V的开放性为新兴市场提供了史无前例的时机。例如,于呆板人范畴,客户需求千差万别,传统架构需要漫长的适配周期,而RISC-V的矫捷性可以直接针对于运用场景举行IP定制。这类 按需设计 的能力,是RISC-V区分在其他架构的焦点竞争力。 RISC-V架构的开放性及矫捷性是其最年夜的上风。与传统的x86及Arm架构差别,RISC-V答应开发者于遵照开放尺度的同时举行各类修改及立异。这类开放性不仅使患上RISC-V可以或许顺应AI时代数据多样化及计较算力快速增加的需求,还有可以或许实现更矫捷高效的架构演进。 RISC-V的新机缘重要缭绕AI范畴,特别是AI对于功效的需求催生了许多需要定制化的工具。 练维汉以Tenstorrent开发的Tensix内核为例注释道,这项技能经由过程动态批改计较量,可以辨认数据中的特定模式,精简算法并削减没必要要的计较,从而使算力密度及能效比获得显著晋升。 这类技能于GPU架构中难以实现,由于其硬件设计没法动态调解计较路径。而传统x8六、Arm因为需要连结向后兼容性,堆集了年夜量繁杂且冗余的指令集,这不仅增长了芯片设计的难度,也使患上于这些架构上开发新的操作体系或者运用的门坎居高不下。 练维汉进一步注释道: 于AI练习中,预处置惩罚阶段耗损了50%的电力。传统GPU专注在加快计较,但数据挪动及指令节制仍需依靠CPU。而RISC-V的模块化设计答应咱们为差别场景定制CPU,例如于数据中央部署百万级优化后的CPU集群,从而应答多样化的计较需求。 AniketSaha则从技能生态的角度增补了RISC-V的另外一个上风: 比拟x86及Arm,RISC-V的IP授权成本更低,且不受单一厂商的限定。例如,咱们于构建芯片生态体系时,不仅需要CPUIP,还有需要体系IP及外围IP的撑持。RISC-V的开放性让咱们可以或许自立集成这些组件,形成完备的解决方案。 Tenstorrent产物战略副总裁AniketSaha 不久前,Tenstorrent收购了模仿芯片设计团队BlueCheetah,对于此AniketSaha暗示将有助在公司于构建芯片生态体系时拥有更自立的IP技能节制权,并摸索下一代技能如存内计较等于芯片或者IP中的运用。 咱们已经经与不少存内计较公司取患上接洽,这项技能将对于Tenstorrent芯片的算力密度带来极年夜晋升。只管是否集成模仿电路功效还没有决议,但可以确定的是咱们已经经预备成立Chiplet生态,做一些Die-to-Die方面的技能结构。 于AI芯片范畴,英伟达依附其GPU架谈判CUDA生态成立了近乎垄断的职位地方。 Tenstorrent开创人JimKeller曾经于接管EETimes美国版采访时提出 英伟达擅长甚么,咱们就做相反的事 的竞争计谋。这一理念于练维汉的解读中获得了详细化: 英伟达用最贵的方案解决问题,而咱们选择相反的路。 英伟达经由过程高算力及关闭生态盘踞市场,而Tenstorrent选择以性价比为焦点,经由过程RISC-V的开源特征实现定制化立异。 练维汉认为,英伟达这类垄断并不是不成撼动: GPU的胜利源在其初期对于生态体系的前瞻性结构,但AI的需求正于发生变化。将来,垂直优化的ASIC及交融架构将成为主流。 一个很直不雅的例子是特斯拉FSD芯片经由过程自研架构实现了比英伟达方案更小的体积及更低的成本,同时满意主动驾驶的及时性需求。 这申明市场需要第二选择。 吴雄昂则从财产竞争的角度增补道: 英伟达的贸易模式依靠高价格计谋,而RISC-V的开源特征答应企业以更低的成本实现立异。这类性价比上风将吸引愈来愈多的草创公司及垂直行业玩家进入市场,从而打破GPU的垄断格式。 练维汉及吴雄昂都认为,AI的多样性需求将鞭策交融架构的鼓起,将来AI芯片可能同时包罗GPU并行计较单位、CPU节制单位及专用加快器。例如,英伟达的Grace芯片及google的TPU都于摸索这类混淆模式。而RISC-V的开放性使患上差别组件的集成越发矫捷,企业可以按照自身需求自由组合。 CoreLabTech公司的标语是 whereyourimaginationsetsthearchitecture 你能想到的需求,都能于RISC-V架构里实现,由于它不受限。 谈到创建这家公司的初志,吴雄昂暗示恰是基在对于AI时代架构立异的判定。 咱们看到很多前Arm工程师插手RISC-V公司,但他们配合面对一个挑战 怎样将开放式架构转化为现实结果。 他提到: CoreLabTech的脚色近似在Linux生态中的Redhat,致力在解决RISC-V的 末了一千米 问题,帮忙客户实现定制化方案的落地。 AI时代的计较需求与以往大相径庭,数据的孕育发生及处置惩罚方式发生了底子变化,从以报酬主的数据(如事情数据、照片、谈天记载)改变为以呆板为主的数据(如呆板人视觉、主动驾驶传感器数据)。这类变化使患上传统的x86及Arm架构难以满意新的需求,而RISC-V的开放性及矫捷性正好弥补了这一空缺。 差别AI装备的数据处置惩罚方式彻底差别,RISC-V的开放性是独一能顺应这类变化的架构。 吴雄昂进一步夸大,AI的成长将加快架构的多样化: 年夜模子仍于不停进化,没法预设所有公司都采用统一引擎(公版芯片),那样毫无差异化可言。例如,主动驾驶范畴从Transformer转向VLAM,PC架构从PowerPC到x86的蜕变都证实了这一点。RISC-V的价值于在它付与企业自由选择的权力 每一个人均可以按照自身需求设计计较架构,而不是被单一技能线路束厄局促。 GPU架构于AI推理中的能效被高估了,当数据需要频仍搬运时,RISC-V的定制化CPU相较在GPU能年夜年夜削减延迟。 练维汉增补道: 于AI练习中,GPU虽然盘踞主导职位地方,但并不是所有场景都需要它。例如,图象数据的缩放、扭转等操作,以和符号计较及智能节制法则的处置惩罚,更合适CPU,而RISC-V的矫捷性答应咱们为这些场景定制专用CPU。这类多样性恰是RISC-V生态的上风地点。 一句话来讲,AI技能架构还没有固定,英伟达还有没有赢下所有的战役。 Tenstorrent的产物计谋表现了RISC-V的开放性与实用性。练维汉吐露,公司当前的Grayskull加快卡及Wormhole芯片已经面向AI练习及高机能计较场景推出,而原规划在2024年推出的第二代Blackhole芯片因制造问题有所延迟,但软件研发进展顺遂。 他注释道,只管人手是限定因素之一,但本年公司全世界规模内的研发团队正于不停扩充,人数已经经从去年的200多人扩充到本年的1000多人。 于技能计谋上,Tenstorrent选择用SRAM替换HBM,重要是由于HBM的成本及供货周期不合适草创公司的快速迭代需求。虽然单核机能可能不如利用HBM的GPU,但对于在客户来讲,体系级方案的性价比才是要害。 Tenstorrent夸大经由过程开源降低研发门坎。练维汉提到: 咱们从硬件到软件周全开源,经由过程团体研究降低成本,同时最年夜化影响力。例如,BlackholeGalaxy体系经由过程以太网扩大算力,相较在英伟达的NVLink,这类方案更具普和性及成本上风,且于速率上没甚么不同。 据吐露,Tenstorrent的方针是于2025年末推出基在Chiplet架构的Quasar及Grendel处置惩罚器,这也与AniketSaha所说的 正于成立Chiplet生态 吻合。 于2025中国RISC-V峰会上,练维汉也具体先容了Tenstorrent的开放式芯粒架构(OCA)。颠末两年半的研发,Tenstorrent规划在本年底发布OCA,与业界分享其技能结果。OCA的怪异的地方于在其彻底开放,从芯片设计到软件栈均不含任何收费组件,涵盖物理层、传输层、和谈层、体系层及软件层等多个抽象层,布局清楚,易在理解。 相干浏览:开放芯粒架构(OCA),应答AI算力需求 至在市场计谋,Tenstorrent采纳先与小公司互助的方式,经由过程极少量发卖快速获取反馈并优化产物。 中国市场的潜力巨年夜,咱们但愿经由过程开源互助及当地团队(如CoreLabTech)的协同,慢慢渗入这一市场,而非直接设立研发中央。 练维汉说道, 中国事一个布满活气的市场,经由过程开放源代码,咱们可以吸引全世界开发者介入。 他尤其提到,中国工程师的立异速率及履行力使人印象深刻: 咱们规划先向中国客户提供单芯片产物,按照反馈优化后再推进定制化互助。 吴雄昂则夸大了当地化办事的主要性: CoreLabTech于中国的联系关系公司众智齐芯,专注在RISC-V处置惩罚器IP及计较平台方案,团队拥有很是富厚的CPUIP经验及于中国本土办事客户的经验。咱们但愿经由过程与海内龙头企业的互助,加快RISC-V生态的落地。 谈话末了,吴雄昂暗示: 行业汗青证实,越开放的技能越轻易获胜。RISC-V的任务,就是让每一个企业都能自由选择并优化本身的计较架构,从而鞭策整个行业的立异。而CoreLabTech的任务,就是开发开放架构,赋能AI时代的新开拓者。 这场从Arm到RISC-V的范式改变,也许恰是计较史上又一次最主要的厘革。





