7月18日,于上海举办的RISC-V中国峰会人工智能分论坛上,阿里巴巴达摩院玄铁团队高级开发工程师徐鹏发表主题演讲,体系阐释了玄铁AI于RISC-V架构下的年夜模子部署优化实践。作为RISC-V生态的主要鞭策者,玄铁团队经由过程软硬件协同立异,于AI算力、模子量化、推理效率等维度实现要害冲破,为RISC-V于AI范畴的范围化运用提供技能范本。

阿里巴巴达摩院玄铁团队高级开发工程师徐鹏
从硬件演进到软件栈进级徐鹏起首展示了玄铁AI生态的快速扩张:截至2025年7月,RISC-V社区AI相干SIG/TG成员已经达25.8万人,魔搭社区开源模子数目冲破10万个,此中Qwen模子家族和其衍生模子成为焦点支撑。

硬件层面,玄铁处置惩罚器AI能力历经三代迭代 从2019年的Vector0.7.1到第二代AME(AI矩阵扩大)单位,连续强化年夜位宽计较、非凡操作函数加快和LLM场景适配能力。

基在营业需求,玄铁构建了分层AI软件栈:底层为部署东西集HHB(含XTorch扩大组件),中层为PyTorch生态适配层,顶层为撑持多精器量化的运行时引擎与算子库。这一架构实现了从模子练习到端侧部署的全链路笼罩。

PyTorch扩大:无缝跟尾RISC-V的加快引擎为降低RISC-V硬件迁徙门坎,玄铁团队推出HHB-XTorch扩大组件,经由过程三方面立异实现机能跃升:

算子交融优化:针对于MoE(混淆专家)模子,交融MoE-Gate、GroupGEMM等算子,端到端机能晋升11.2%;
量化算法撑持:集成AWQ、GPTQ、SMQ等主流LLM量化算法,撑持q8_0、q4_1等多粒度混淆量化;
极简部署流程:用户仅需插入两行代码便可激活XTorch加快,兼容Eager/TorchScript/TorchDynamo三种模式。

徐鹏夸大,该方案复用PyTorch成熟生态,使RISC-V硬件患上以 无痛 接入现有AI开发流程。
运行时引擎:多核并行与全局调理冲破于推理引擎层面,玄铁团队提出OneGraph全局调理技能,将年夜模子计较使命视为单一计较流,经由过程Matrix及Vector流式处置惩罚单位抽象,实现算子级并行与通讯使命一次性编排。实测数据显示,该技能使端到端推理机能晋升20.5%,硬件等候时间年夜幅减少。

此外,玄铁NN算子库撑持动态/静态计较图和FP16/INT8/FP4等多精器量化,共同多线程负载平衡算法,可充实开释多核并行潜力。例如,于Softmax算子优化中,团队经由过程新增th_vfredxxx_dup系列指令,联合数据重排与计较流调解,实现8倍加快;针对于Sigmoid、Silu等年夜模子经常使用函数,硬件加快使其机能晋升超5倍;FP16GEMM运算效率较竞品晋升3倍。
软硬件协同:闭环优化打造极致机能徐鹏重点分享了玄铁团队的协同立异要领论:

指令集扩大:针对于要害算子定制专用指令(如Softmax的reducedup指令),软件层同步优化数据排布;
算子级调优:手工优化与主动天生算子联合,笼罩GEMM、非凡函数等焦点操作;
场景化适配:针对于LLM长序列计较特征,优化计较流全局调理,最年夜化硬件并行能力。

末了,徐鹏吐露玄铁团队正推进端侧推理优化和更高机能软件生态设置装备摆设,例如撑持LLaMA等主流模子的高效部署。他暗示,玄铁将连续扩大生态体系,提供多精度混淆量化、多线程调理算法等能力,鞭策RISC-V成为AI算力普惠化的焦点载体。
责编:Luffy 本文为EET电子工程专辑原创文章,禁止转载。请尊敬常识产权,背者本司保留究查责任的权力。 920亿美元投资规划为宾夕法尼亚州带来了史无前例的成长机缘,使其有望成为美国下一个“第二个硅谷”。 微软与OpenAI的和谈素质是一场缭绕AGI界说的豪赌。微软以130亿美元押注AGI不会过早实现,而OpenAI则保留 技能核按钮 以防本钱侵蚀其任务。当前构和不仅是贸易好处的再分配,更将决议将来十年AI权利格式的走向。 前不久的Keysight World Tech Day 2025媒领会上,是德科技再度夸大了对于AI市场的注重,以和是德科技于AI年夜趋向下看到的市场时机... 英伟达CEO黄仁勋曾经暗示:“咱们正站于AI革命的出发点。”这于必然水平上申明,英伟达的4万亿美元市值不仅是企业里程碑,更标记着全世界经济从“消费互联网”向“AI基础举措措施”的价值转移。 作为一种基在硅桥的2.5D封装技能,EMIB是颇具代表性的;近来Intel也更新了迭代版的EMIB-T,适配HBM4/4e。此次咱们测验考试更过细地看看这项技能。 北京年夜学研究团队日前公布于智能计较硬件方面取患上领先冲破——国际上初次实现了基在存算一体技能的高效排序硬件架构,解决了传统计较架构面临繁杂非线性排序问题时计较效率低下的瓶颈问题。 智能与无人装备全方位安全将成为一座巨年夜金矿——功效安全数分 跟着诸如智能驾驶汽车、载人/货无人机、无人农机、各类专用及消费呆板人等智能与无人装备广泛进入咱们的事情及糊口,这些装备的安全性已经成了一个值患上存眷的主要话题。它们的安全运行与装备自身、搭客以和周边的职员及物品的安全紧密亲密相干。 为更智能的挪动堆栈呆板人提供动力 于全世界各地的堆栈中,自立呆板人正于与人类协同功课,实现比以往更快速的货物配送——而对于速率的需求也于连续上升。 2025 RISC-V中国峰会 | 奕斯伟计较以“产物+场景+生态协同”模式加快财产渗入 7月16日,第五届RISC-V中国峰会于上海张江科学礼堂进行,作为与“北美峰会”、“欧洲峰会”齐名的全世界RISC-V范畴三年夜顶级嘉会之一,本届峰会旨于构建财产生态,鞭策RISC-V技能的立异与运用,促成国际交流互助。奕斯伟计较高级副总裁、首席技能官何宁博士于主论坛发表《财产赋能:RISC-V场景化方案立异与生态协同》主题演讲,论述了奕斯伟计较于RISC-V场景化运用与生态设置装备摆设上的战略结构与实践结果。 达摩院玄铁构建RISC-V高机能基座:DSA扩大与全栈协同新范式 第五届 RISC-V 中国峰会上,达摩院玄铁发布C930办事器CPU与TITAN/DSA扩大,构建高机能 RISC-V 算力基座,重塑端-边-云算力生态。 点击蓝字 存眷咱们ENTERPRISE存眷公家号,点击公家号主页右上角“ ··· ”,设置星标,及时存眷智能汽车电子与软件最新资讯哪吒汽车的母公司合众新能源汽车株式会社最先寻觅新的投资人了。从7月 点击蓝字 存眷咱们ENTERPRISE存眷公家号,点击公家号主页右上角“ ··· ”,设置星标,及时存眷智能汽车电子与软件最新资讯7月18日动静,近来,于长春举办的2025新能源智能汽车新质成长论坛上 一凡 发自 副驾寺智能车参考 | 公家号 AI4Auto华为清华发布白皮书,痛批智驾营销乱象。“白皮书点破智驾营销乱象”话题火了,24小时浏览量破亿,成为潜于的热搜。这里的白皮书,指的是近来于北京发布 点击蓝字 存眷咱们ENTERPRISE存眷公家号,点击公家号主页右上角“ ··· ”,设置星标,及时存眷智能汽车电子与软件最新资讯来历:汽车电子书院、ECU软件开发电动汽车是采用动力电池供电,以驱动电 7月11日,遂宁市安居区人平易近当局与广东先导稀材株式会社签订项目互助和谈,标记着全市近3年来首个百亿级财产项目“先导科技集团半导体高端设备制造西南出产基地”正式签约落地。市委书记严卫东、先导科技集团 点击蓝字 存眷咱们SUBSCRIBEto USImage: Perplexity作为人工智能 “问答” 引擎暗地里的草创公司,Perplexity方才推出了本身的网页阅读器。这款名为Come 保举浏览:2025下半年汽车行业:整车及零部件格式激烈重塑,制造与科技并举2025年汽车行业中期瞻望:三年夜主线,整车+智驾平权+呆板人2025H2汽车投资计谋:乘用车、零部件、客车、重卡、两轮车202 于第三届链博会上,苹果公司副总裁葛越的讲话激发业界聚焦。这位深耕中国市场多年的高管直言:“苹果取患上的成绩与中国供给商伙伴密不成分。”这一亮相既彰显了中国制造的硬实力,更展现出焦点趋向——全世界科技巨 7月18日动静,今日,小米深圳总部年夜厦正式启用,小米集团合股人、集团总裁卢伟冰,小米集团副总裁、集团总办主任刘伟,小米集团CEO尤其助理潘九堂等高管出席了典礼。 跟着小米深圳总部正式开园,小米之 针对于美国近日核准向中国发卖英伟达H20芯片一事,商务部新闻讲话人作出正式回应。讲话人暗示,中美两边于伦敦经贸漫谈后连结着紧密亲密沟通,并就相干框架细节告竣共鸣。美方已经在7月上旬取缔了对于华部门限定办法,-欢迎来到公海,欢迎来到赌船!