21专访|云天励飞董事长陈宁:打造“中国版TPU”
21世纪经济报道,2025-12-27 22:45:53
21世纪经济报道记者 倪雨晴、林典驰 深圳报道
深圳湾科技生态园中,AI弄潮者从四方汇聚。
在这片中国科技产业密度最高的区域之一,21世纪经济报道记者再次见到了云天励飞董事长陈宁。长达1个半小时的深度交流中,陈宁侃侃而谈关于AI的一切。
(云天励飞董事长陈宁)
五年前,记者与陈宁的专访,正值中国AI创业最为喧闹的阶段。新锐企业群雄并起,算法、场景与资本交织,云天励飞也刚刚踏上上市之路。五年过去,陈宁依旧精神饱满,而云天励飞的坐标,已经从AI解决方案,转向更底层、也更具长期价值的AI推理芯片赛道。
这五年,人工智能的边界被不断推开。大模型走出实验室,开始进入手机、电脑和日常生活场景;算力从幕后走向台前,成为产业竞争的核心要素;国产AI芯片,也被推至聚光灯下,成为资本、产业与政策共同关注的焦点,训练和推理市场都如火如荼。这是一个罕见的历史窗口期,而陈宁看中的“AI推理芯片时代”,正在形成市场共识。
市场上并非没有质疑之声。有观点认为,当下AI投入正在积聚泡沫。对此,陈宁有不同的看法:“AI就像蒸汽机刚出现的时候。站在一个村庄的视角,可能会觉得这是泡沫,但站在历史的角度看,这是一个时代的起点。AI一定会经历泡沫和调整,但方向本身不会错。”
陈宁坦言,真正重要的是,站在正确的长期方向上。AI远远没有到天花板,远远没有进入收敛的阶段,或者说现在涌现的只是大语言模型,还有多模态模型、世界模型,机器人模型往何处发展尚且未知,这些领域都在持续发展。
训练时代,英伟达当之无愧的王者,也是标准制定者。但在推理时代,陈宁认为,“所有人都站在同一条新的起跑线上。谁能在成本、效率和系统能力上建立优势,谁就有机会。”
当前,推理已经进入到算力的中心舞台,毫无疑问,接下来AI场上将迎来更繁荣的推理芯片和应用生态。在未来的硬件架构中,可能有更多异构组合,有专门用来做通用计算CPU、有专门做训练的GPU、也有专门做推理的推理芯片。
展望未来,陈宁表示,也许再过15年到2040年的时候,深圳每个市民都会有三台机器人,家里一台服务机器人,一台在办公场所工作,出行有着无人驾驶汽车或者提供经济的旅程。而他最希望的是,每一台机器人上面都印着powered by Intellifusion。
AI新时代的帷幕已经拉开,格局未定。在这场围绕算力、架构与成本的长期竞赛中,芯片厂商们,正在不断加速。
与AI的三个周期同行
《21世纪》:相较于2020年,如今推进芯片研发是否面临不同的契机与考量?
陈宁:事实上,我们始终在坚持做芯片。我在美国工作了十年,一直专注于芯片领域。2014年回国创业时,我们回国申报的第一个项目就是关于神经网络处理器(NPU)的研究,这本就是回国创业的初心。
深圳这座城市非常务实,不讲太多高大上的概念,而是强调解决实际问题。这种环境催生了许多以产品为导向的企业。对企业而言,要生存并穿越周期,就必须等到人工智能真正迎来爆发。因此,我们不仅要做芯片,更重要的是,通过端到端的应用闭环来验证芯片的实际价值。
我们的第一代芯片至今仍在龙岗区政府部门稳定运行。为了有效验证芯片性能,我们需要高质量的前端数据,在芯片上实际部署并测试算法的准确率。在这个过程中,我们逐步构建起覆盖应用、算法与芯片的全栈能力,打通了从芯片、算法到上层应用的完整链条。
《21世纪》:今天的云天励飞是否全面投入AI芯片领域?
陈宁:回过头看,我们的战略方向其实始终未变,但市场策略一直在与时俱进,并经历了三个发展周期。这三个周期,恰好也对应了全球人工智能行业的发展阶段,尤其是中国人工智能落地应用的演进路径。
第一个周期是从2012年AlexNet(一种深度卷积神经网络)出现到2020年,这一阶段可称为智能感知时代。当时主流模型规模较小,核心任务是解决以计算机视觉为主的智能分析问题。在中国,我们主要聚焦于安防、互联网等领域的智能感知应用。
第二个周期从2020年持续到2024年,以自然语言处理和语义理解的重大突破为标志,特别是2022年之后,以ChatGPT为代表的大模型迅速崛起,推动行业进入“大模型时代”。
随着大模型的爆发,对算力的需求激增,尤其是英伟达的高性能计算芯片成为焦点,由此开启了第三个周期,即算力驱动阶段。可以说,直到真正进入这一阶段,我们才迎来了属于自己的“春天”和爆发期。
不过需要强调的是,尽管这一轮算力热潮自2020年前后便已初现端倪,但我们并未盲目追随GPU路线,尤其没有贸然切入训练芯片的赛道。我们始终立足自身技术积累和产业定位,坚持走符合自身发展节奏的道路。
《21世纪》:怎么看中美在AI和芯片发展路径上的差异?
陈宁:美国的发展模式更偏向“从0到1”的原始创新,以理论驱动为主;而中国则更多是应用驱动,强调将技术真正落地到产业场景中。以互联网为例,许多底层技术虽由美国首创,但移动互联网在中国的发展速度和应用规模丝毫不逊色,甚至在某些方面更具活力。
人工智能领域亦是如此。中国的强项并非最早提出基础理论,而在于将已有技术快速转化为规模化、可落地的应用。正因如此,我认为中国不应只聚焦于训练芯片,更应重视推理芯片的巨大机会。
从国家政策来看,《关于深入实施“人工智能+”行动的意见》明确提出:到2027年,新一代智能终端、智能体等应用普及率超70%,智能经济核心产业规模快速增长;到2030年,新一代智能终端、智能体等应用普及率超90%。
这是全球首个由国家层面如此明确、系统地推动人工智能规模化落地的战略。在我看来,中国的大模型发展已取得显著进展,我们或许不是做出最强模型的国家,但只要能与领先者的差距缩短至几个月之内,就足以支撑生产力的变革。
因此,中国的策略很清晰,既然在大模型上已基本追平、进入全球第一梯队,接下来的重点就是鼓励大规模市场化应用,加速AI在各行各业的渗透。而在这一过程中,亟需补齐的关键环节,正是高效运行的推理芯片。
为什么是推理芯片?
《21世纪》:当前业界普遍关注训练芯片与推理芯片,而你一直特别强调推理芯片的重要性,背后的逻辑是什么?
陈宁:我始终认为,训练芯片的市场规模远无法与未来推理芯片的市场潜力相比。
训练更多属于“从0到1”的技术创新阶段。这就像19世纪灯泡的发明,爱迪生并非第一个做出灯泡的人,但他通过系统工程的方式,将灯泡与电网、专利体系结合,使其真正成为可大规模使用的商品,这才引发了真正的工业革命。
同理,训练芯片是推动前沿科研和模型创新的重要工具。AI技术远未触及天花板,训练芯片仍将持续演进。但决定一场技术能否真正转化为产业革命的关键,并不只在于“0到1”的突破,更在于如何实现“1到N”的规模化落地。
在AI时代,推理环节才是真正的“电动机”和“输电网络”,它把训练好的模型部署到千行百业的实际场景中,让AI真正成为现实生产力。
据我们判断,到2030年,全球训练芯片市场规模可能达到约1万亿美元,而推理芯片市场至少将达到4万亿美元,甚至更高。
12月24日,英伟达拿下AI推理Groq的新闻,更印证了这一判断。Groq 是一家专注于 AI 推理芯片研发的明星独角兽,英伟达在 AI 推理能力与生态布局上的前置加码,进一步强化了推理基础设施加速演进的行业信号。
对中国而言,尽管在训练芯片领域与国际领先水平存在差距,追赶仍是必要且紧迫的国家战略任务;但从更长远、更具战略意义的角度看,中国真正的机会和主战场,其实在推理芯片赛道。这里不仅市场空间更大,也更契合中国以应用驱动、产业落地见长的发展优势。
《21世纪》:目前,国内许多芯片厂商都在布局推理方向,如何看待中国推理芯片的发展现状?是否已经迈上了一个新台阶?
陈宁:我想先提出一个行业判断:2025年将是一个重大的转折点。
在过去几年,AI部署主要依赖训练芯片或“训推一体”的方案,即用训练芯片来执行推理任务。那时的核心目标是解决“有没有”的问题,只要能把模型跑起来就行,对成本等指标并不敏感。
但进入2025年,一个显著的变化正在发生:训练与推理开始真正分离。训练专注于模型的构建与优化,而推理则走向专业化、高效化和场景化,形成独立的技术路径和产品体系。
今年我们已经观察到几个关键现象:过去半年,大模型的使用已从技术圈扩展到普通大众,身边的老人、孩子都在用大模型,手机上普遍安装了多个AI应用,“有事没事问一问”正成为一种日常习惯。这种用户行为的转变,是在2025年才真正成型的。
这非常类似于2007年iPhone发布后,手机从功能机迈向智能机的拐点。彼时,智能手机不仅改变了设备形态,更重塑了整个软件生态和用户生活方式。今天,AI推理的普及也正在开启一个全新的时代:AI不再只是实验室里的技术,而是嵌入每个人生活和每个产业环节的基础设施。
《21世纪》:在推理芯片这一赛道上,云天励飞的差异化在哪里?
陈宁:我们最新提出的GPNPU架构,可以理解成是中国版的TPU。相较于 GPGPU,GPNPU 在推理效率与成本控制上,能够实现数个数量级的优化。该架构在一个统一的大架构框架下,融合了三方面的核心优势:
第一,借鉴GPU在顶层架构上的可编程性与生态兼容性。这使得客户在迁移现有模型和应用时成本更低,也更易于被广大软件工程师接受和使用。
第二,继承NPU在推理任务中的高能效优势。我们的团队拥有近20年的芯片架构设计经验,长期坚持“算法芯片化”的理念,即将对AI算法的深刻理解转化为底层硬件的执行级优化,在性能、功耗与成本之间实现精细平衡。
第三,深度融合存算一体技术。我们认为,这是中国AI芯片实现差异化突破的重要机遇。在先进制程工艺受限的现实条件下,必须通过先进封装与存算一体等创新路径,构建自主可控的技术体系。
归根结底,芯片设计并非简单的公式套用,而是一门艺术,它是在性能、功耗、面积与成本之间不断权衡与优化的过程。gpnpu比gpgpu在推理效率和成本实现几个数量级的优化
《21世纪》:基于GPNPU架构的Nova500芯片现在进展如何?是在研发阶段,还是已经流片?
陈宁:基于Nova500的芯片预计将在明年流片。我们对这款芯片有比较大的期待,希望通过全新架构,在推理赛道上性能对标全球头部企业,价格还能有一定优势。
《21世纪》:目前云天励飞的芯片订单需求主要来自哪些领域?
陈宁:从客户结构来看,目前需求最明确的是来自互联网头部大厂。第二梯队包括三大通信运营商以及部分中大型互联网企业。
第三类客户是AI领域的创业公司,涵盖专注于大模型研发和AI应用整合的企业。这类公司创新节奏快,产品迭代迅速,有些甚至在短短半年内就能推出一款市场爆款,因此对推理芯片的需求增长明显。
《21世纪》:会不会出现和某一家互联网大厂合作特别紧密的情况?
陈宁:互联网大厂都会有多家供应商的策略,一方面是供应链安全,另一方面是产品线需求不同。
但可以确定的是,互联网大厂是推理芯片的终极目标客户。它们每年的采购额都是上千亿,只要做到第三、第四供应商,都是几十亿、上百亿的订单规模。
国产芯片突围、AI硬件爆发
《21世纪》:从营收结构来看,云天励飞未来会不会更多转向芯片?
陈宁:我们的营收结构变化,其实和AI行业的发展阶段是完全匹配的。
早期是以行业解决方案为主;到了大模型阶段,开始出现标品和服务;接下来,推理算力市场会爆发,推理芯片的出货量会迎来增长拐点。
《21世纪》:在研发投入加大的情况下,盈利压力怎么平衡?
陈宁:作为一家企业,我们不能盲目投入,而必须确保每一分研发资源都精准投向行业即将爆发的关键节点,并以此构建自身的核心竞争力。
首先,在 GPNPU 架构的演进中,我们重点加强与主流生态的兼容性扩展,这是市场准入的必经之路,无法绕开。因此,我们在提升架构灵活性方面进行了较大投入,以降低客户迁移成本并加速落地。
其次,在 NPU 架构优化方面,得益于团队近20年的持续积累,我们已建立起技术护城河。
最后,面向未来大算力需求,我们聚焦于3D堆叠与存算一体等技术,这将是突破先进制程限制的关键路径。
《21世纪》:在推理芯片研发和市场推进过程中,最大的挑战是什么?
陈宁:挑战是多方面的。首先是硬件本身的复杂性。芯片从设计、流片到量产是一个高投入、长周期的过程。
其次是软件生态的构建。要充分发挥硬件性能,必须投入大量资源打造完整的软件栈。
第三是AI技术本身的快速演进。大模型架构、计算范式乃至应用场景都在持续变化,而芯片的设计和制造周期通常长达一到两年。这就要求芯片架构必须具备足够的前瞻性与灵活性,既能适配当前主流需求,又能应对未来可能的技术路径变迁。
《21世纪》:如何看待半导体市场的并购趋势?
陈宁:我认为,并购活动将越来越多,根本原因在于,AI应用和AI推理这两大生态正在快速崛起,催生出大量新机会。我们自身也在积极布局,正在筹备多支产业基金,包括风险投资基金和并购基金。这种布局正是基于对赛道潜力的判断,当一个领域的市场规模从“小而散”走向“大而活”,资本和产业资源就会加速流动。
《21世纪》:如何看待广东省集成电路的发展情况?
陈宁:广东省对集成电路产业高度重视,广州、深圳、珠海等城市都在积极布局。尤其值得一提的是,全省明确提出应用场景开放驱动AI与集成电路产业发展的战略思路,这在全国具有前瞻性。
客观来看,中国集成电路整体仍处于追赶全球先进水平的阶段,尤其在制造环节仍面临“卡脖子”挑战。但广东具备独特的差异化优势,粤港澳大湾区被英伟达CEO黄仁勋称为“全球唯一一个AI与机电一体化深度融合的区域”。这一判断精准点出了广东的核心竞争力:这里不仅是AI算法和软件的试验场,更是AI原生硬件的策源地。
依托庞大的终端市场,广东已形成涵盖“端、边、云”等多元场景的完整应用生态。这种以实际应用为牵引的模式,有效拉动芯片的强劲需求。
在此基础上,广东一方面大力推动AI智能硬件产业集群的发展,另一方面又通过这些硬件产品所产生的真实市场需求,反向精准带动上游产业链,包括芯片设计、制造工艺、EDA工具等环节的协同进步。
以深圳为例,其产业政策尤为聚焦。早在五六年前,深圳就已旗帜鲜明地提出要发展NPU芯片产业。正是这种长期、稳定且前瞻的政策支持,让我们能够坚持十余年深耕NPU架构研发,并最终实现技术积累与产业落地的良性循环。
《21世纪》:今年AI产业链发展迅猛,涌现出大量AI硬件公司,其中很多都来自深圳。这是否意味着行业进入一个新的发展阶段?
陈宁:为什么这么多AI硬件的“爆品”都出自深圳?根本原因在于,深圳堪称AI产品经理的摇篮。这座城市不断孕育出新的创业公司,有些此前名不见经传,却能迅速打开全球市场,取得亮眼成绩。这背后,是深圳对市场、用户和产业土壤的深刻理解。
在深圳,产品经理不仅贴近草根市场,更能敏锐捕捉真实需求。对于AI领域而言,优秀的产品经理不仅要洞察用户痛点,还必须清楚当前大模型的能力边界:知道它们现在能做什么、不能做什么。唯有如此,才能做出务实、可落地的产品,而不是仅凭想象去设计功能。毕竟,现阶段的大模型远非万能,许多事情它实际上还做不到。正是这种脚踏实地的产品思维,让深圳在AI硬件的新阶段中持续领跑。